2014 Frederick Jelinek Memorial Workshop

5. srpna 2014
V budově Informatické sekce na Malostranském náměstí probíhal od druhého červencového týdne mezinárodní workshop s tématem Význam v psaném a mluveném jazyce a jeho počítačové zpracování.

V budově Informatické sekce na Malostranském náměstí probíhal od druhého červencového týdne mezinárodní workshop s tématem Význam v psaném a mluveném jazyce a jeho počítačové zpracování.

Oficiální název letošního workshopu připomíná českého vědce Fredericka Jelinka, původním jménem Bedřicha Jelínka, jehož právě proběhlý ročník připomínal. Prof. Jelinek, který větší část svého života působil v USA, byl jednou z vedoucích osobností v oblasti užití statistických metod při počítačovém zpracování jazyka. Kromě významných amerických univerzit působil také ve středisku IBM pro zpracování jazyka a řeči.

Na devatenáctý ročník semináře pořádaného Centrem pro zpracování jazyka a řeči Johns Hopkins University v Baltimore a Ústavem formální a aplikované lingvistiky MFF UK se sjelo celkem padesát dva účastníků. Seminář probíhal od 7. 7. do 1. 8.2014 a vůbec poprvé se konal mimo území USA.

Průběh konference, historii oboru i aktuální trendy v rozpoznání mluveného a psaného jazyka počítačem přiblížil v rozhovoru prof. Jan Hajič z ÚFAL MFF UK.

Které přednášky měly největší ohlas?

Řekl bych, že nejvýraznější úspěch měly přednášky z prvního týdne. Týkaly se záležitostí, o kterých víme, že je během příštích deseti let nevyřešíme, a to účastníky zajímalo nejvíc. Během prvního týdne jsme se snažili zachovat si odstup a podívat se na řešení problému, jak člověk vůbec rozumí jazyku a jakým způsobem si v mozku ukládá informace. Z tohoto pohledu byly tyto přednášky trochu futuristické, a proto měly velký ohlas.

Workshop má téměř dvacetiletou tradici. Jaký je jeho dosavadní přínos?

Jeho přínos je skutečně obrovský; dvě věci potom vidím jako zásadní. Díky práci lidí během workshopů i po nich vznikl software, který se používá pro strojový překlad po celém světě. Dnešní metody byly vyvinuty v IBM na začátku devadesátých let, ale v té době samozřejmě nebyly ještě veřejně dostupné. Právě na workshopech se pracovní skupiny pustily do vývoje softwaru, který je dnes zdarma dostupný pro studenty, vědce i průmysl. Druhým přínosem je vývoj v oblasti rozpoznávání řeči. Veřejně dostupný software pro rozpoznávání řeči, který máme nyní k dispozici, je velmi efektivní.

Letošní ročník je pořádán na počest Fredericka Jelinka. Jak vy osobně vnímáte jeho přínos oboru?

Osobnost prof. Jelinka byla naprosto zásadní. V sedmdesátých letech se vrátil k myšlenkám, které byly známé už na konci druhé světové války. Aplikoval již známé metody jak na rozpoznání řeči, tak posléze i na překlad. To změnilo tento obor od základů. Když si dnes koupíte mobilní telefon, se kterým můžete komunikovat hlasem, užitá metoda odpovídá z osmdesáti procent poznatkům, které znal už Jelinek.

Pro mě osobně je jeho přínos nedocenitelný. V devadesátých letech přijel do Čech, navštívil všechna pracoviště a umožnil mi rok a půl pracovat ve výzkumu v IBM, kam poté přivedl mnoho dalších Čechů nejen z Karlovy univerzity. Pracovali jsme na spoustě společných projektů. Bez jeho vlivu by byl význam našeho pracoviště poloviční.

Workshop je mezinárodní, jsou některé státy nebo univerzity ve výzkumu výrazně pokročilejší než ostatní?

V Americe je několik míst, která se výzkumem v oblasti přirozeného jazyka a mluvené řeči zabývají. Jmenujme například Johns Hopkins University, Carnegie Mellon University, University of Pennsylvania, University of Southern California a University of Colorado Boulder. V Evropě se výzkumem v tomto oboru zabývá hlavně Velká Británie, Francie, Holandsko, Švýcarsko, Německo a samozřejmě Česká republika.

Kam se podle vás bude vývoj ubírat v budoucnosti? Co bude vyřešeno brzy a co nelze předpovědět?

Jazyk je takové povahy, že to podle mého názoru stoprocentně vyřešit nelze. Zpracovat lidské uvažování a myšlení je náročné. Počítače nyní už nerostou výkonem, ale můžeme jich zase použít velké množství. V jistém smyslu tedy výkon dále poroste, a pokud to dokážeme správně softwarově zpracovat a užít správné metody učení, posuneme metodiku dále. Počítače budou chytřejší a přesnější, a díky tomu, že budou přesnější, je budeme moct užít ve více aplikacích než dnes. Ve chvíli, kdy bude běžné mít v domácnosti přístroje, na které bude člověk mluvit – a bude to přitom fungovat spolehlivě – lidé si zvyknou a budou mít požadavky na stejný způsob komunikace i u dalších věcí.

-omk-