Chcete naše služby? Ne? Tak si trhněte nohou. Z podobně nevhodného chování mohou mít zaměstnanci call center nebo bank nepříjemnosti. Jejich šéfové ale často o jejich nevhodném chování nic netuší. To má změnit program, který umožňuje rychle najít zadaná klíčová slova ve zvukové nahrávce. Vyvíjí ho vědci z brněnského Vysokého učení technického.

Lidé z fakulty informačních technologií brněnské techniky si už několik let hrají s myšlenkou umět se snadno orientovat nejen v textu, ale i v audio záznamech. Pro vývoj programu záměrně používají nahrávky běžného slovního projevu. „Zaměřujeme se například na telefonní hovory nebo různé přednášky," uvedl Jan Černocký z vědeckého týmu.

Zatím prý vytvořili několik způsobů, jak hledat v nahrávce. „Základní možností je přepis. Dostaneme nahrávku, kterou náš systém dokáže rychle přepsat do textu. Když máme takto zpracovaný třeba záznam z lékařského kongresu, stačí zadat do vyhledávače například Alzheimerova choroba a program mi přímo v nahrávce ukáže pět míst, kde o ní někdo mluví," vysvětlil princip Černocký.

Druhou možností je vyhledávání klíčových slov. „Tam není přepis vždy nutný. Do programu nahrajeme vybraná slova, která systém musí umět zachytit. To je užitečné například pro call centra, aby mohla snadno kontrolovat hovory svých zaměstnanců. Třeba to, jestli nejsou drzí, nenabízí konkurenční produkty nebo neřeší osobní věci v pracovní době," dodal vědec. Program navíc dokáže rozpoznat i hlas člověka, který mluví.

Centra v současné době kontrolují hovory většinou jen namátkově. Je to prý časově náročné. „Nahráváme všechno, ale pak z toho posloucháme a analyzujeme asi pětinu. Snažíme se tak sledovat, jestli zaměstnanci skutečně dělají svou práci," vysvětlila důvod kontroly Zuzana Moravčíková z brněnského S-Call centra.

Nahrávky navíc nadřízeným odhalí chyby, které zaměstnanci dělají. „Díky tomu víme, za co je napomenout nebo co je ještě naučit," podotkla.

První systémy rozpoznávání řeči, které vytvořili brněnští vědci, už zavádí do praxe firma, kterou sami založili. „Využívají je například velké banky nebo ministerstva vnitra několika států," vysvětlila mluvčí univerzity Jitka Vanýsková.

K lidem se zatím program nedostane. V budoucnu by ale pomocí stále dokonalejších systémů mohli studenti jednoduše vyhledat informaci například v přednášce nahrané na diktafon. „Kdybych si nemusel dělat na každé hodině poznámky, ale nahrál si ji, lépe bych se soustředil na to, co vyučující říká. Problém ale je, když pak potřebuji najít konkrétní informaci. V textu mi stačí zadat jednu klávesovou zkratku a mám to hned. U zvukové nahrávky je potřeba to přehrát celé, což je nepraktické," poznamenal například vysokoškolák Tomáš Veselý.

S rozpoznáváním řeči mají vědcům pomoci také umělé neuronové sítě. „Jedná se o výpočetní model inspirovaný biologickou strukturou lidského mozku," vysvětlil Černocký. Umožní zpracovat obrovské množství dat. „Na internetu už máme k dispozici stovky hodin záznamů řeči i s přeřeky, váhacími zvuky a podobně. A potřebujeme systém, který si s tím dokáže poradit," dodal vědec.

vyhledávánímožnosti, jak najít hledané slovo v nahrávce

přepis:speciální systém rychle přepíše nahrávku do textu. Pak mohou lidé přes vyhledávač najít úsek, který potřebují.
vyhledávání klíčových slov:do systému jsou zadána klíčová slova, která se pak hledají v nahrávce. Přepis není nutný.