Your Planet Sustainable?Your Tribe Harmonious?Your Life Vibrant?
Future Proof Ideas since 2005, by Erwin van Lun

Google toont spraakmomenten in video

Google heeft een manier gevonden om de zoekresultaten van het zoeken van spraak in beeldmateriaal te visualiseren. Wie zoekt op 'Health' krijgt een balkje onder de (YouTube) video te zien met markeringsmomenten wanneer deze persoon het woordje 'health' uitspreekt. Deze manier staat bekend bij Google onder de naam Gaudi.

Future Vision by Erwin Van Lun on this article

Nu reageert Google op onze getypte zoekvraag, straks kunnen we zittend achter de TV vragen: ‘health’. En nog wat later: ‘wanneer had die vent het nou over gezondheid?’ (dus in het Nederlands). En nog later worden er allerlei synoniemen bijgezocht. Zo gaat het maar verder en verder. Niet alleen voor Google, maar voor alle merken. Aan alle merken kunnen we straks op deze manier vragen stellen. Alsof het altijd de gewoonste zaak van van de wereld is geweest. Voorlopig zijn we nog heel druk met het goed reageren op het klikken en typen van onze klanten, maar intussen is de technologie alweer een paar stappen verder.

Related trends

comments

Reaction by Eduard Blacquière on 23 September 2008 10:25

Interessante ontwikkeling. Google heeft hier al eerder iets over naar buiten gebracht rondom de verkiezingen.

In de VS biedt Google de gratis service GOOG-411 aan. Deze dienst stelt je in staat om telefonisch een zoekopdracht te geven en daarop ook via spraak een antwoord te krijgen.

Deze service is voor Google een zeer goede manier om hun speech-to-text technologie te testen.

Al met al is het indexeren van de daadwerkelijke content in video’s een belangrijke stap in de volgende fase van zoekmachines en zoeken in het algemeen. En het blijft toch knap dat Google hiermee weer voorop loopt; of in ieder geval de beste kaarten heeft om er het meest van te profiteren.

comments

Reaction by Arjan van Hessen on 2 October 2008 07:58

Leuk dat er zoveel reacties komen als Google iets doet grin
Op de Universiteit Twente draait al 3 jaar een demo waarin je in de journaaluitzendingen van de laatste twee weken kunt zoeken. Ook hier wordt spraakherkenning gebruikt om te bepalen wat Sacha de Boer of Philip Freriks precies hebben gezegd en wanneer.
Kijkvoor de demo op deze link:
http://hmi.ewi.utwente.nl/showcases/broadcast-news-demo

comments

Reaction by Erwin van Lun on 2 October 2008 09:22

Ha Arjan,

Ik ken de demo. Nog sterkerje hebt t me laten zien. Het grote verschil is toch wel de schaal waarop het nu gebeurt en dat het bovendien werkt op alle content.

Maar weet dat je hierop voortuitloopt… De vraag is nu: wat gebeurt er nu in Enschede wat Google of drie jaar gaat doen?

comments

Reaction by Eduard Blacquière on 7 October 2008 20:24

@Arjan
Dankjewel voor de toevoeging, interessant!

Begrijp ik het goed dat de spraakherkenning technologie de gesproken tekst omzet in de teletekst ondertiteling?

@Erwin
Terechte vraag, de schaalbaarheid. Google heeft op dat gebied goede kaarten in handen…

comments

Reaction by Arjan van Hessen on 7 October 2008 21:14

Beste Erwin en Eduard,
Spraakherkenning wordt al gebruikt voor het ondertitelen van TV programma’s maar dat gebeurt nog wel door iemand die in een rustige ruimte de spraak op de TV na spreekt. Direct herkennen van de vaak door elkaar sprekende studiogasten (bv Pauw en Witteman) is nog niet mogelijk hoewel we er wel aan werken (zie het NEON project). Wat wel gebeurt is het herkennen van de spraak in interviews. Tijd is dan geen geen kritische factor meer, en de resultaten zijn “goed genoeg”. Kijk maar eens op www.buchenwald.nl en http://www.iiav.nl/videohistory en ga bij beide sites naar de interviews. Schaalbaarheid is ook geen probleem meer. We werken samen met talloze beheerders van gesproken content en in principe volstaan 2 a 3 PC’s per beheerder.
Dezelfde technologie gebruiken we trouwens ook voor het herkennen van alle spraak in de rechtbanken en bij verhoren van verdachten door de politie: gewoon alles goed opnemen, door de spraakherkenner halen en op een goede manier doorzoekbaar maken.

comments

Reaction by Erwin van Lun on 8 October 2008 07:07

@Arjan:het fenomeen dat mensen die door elkaar heen praten staan staat toch bekend als het cocktail party effect?

Daar heb ik eerder iets over geschreven:
Asimo & Shotoku

Related postings

Archive

Twitter
RSS