Realistyczny interfejs głosowy
Wysiłki badaczy z UE przyczyniły się do lepszego rozpoznawania mowy ludzkiej przez komputery. Przeprowadzone prace polegały na prezentowaniu komputerom dużych ilości materiałów źródłowych o wstępnie określonym formacie przy użyciu nowych algorytmów umożliwiających automatyczne nadawanie struktury.
Komputery nadal mają bardzo ograniczone możliwości interpretowania
ludzkiego języka naturalnego. Wynika to między innymi z faktu, że główna
metoda uczenia komputerów, czyli nanoszenie adnotacji eksperckich, jest
powolna, kosztowna i mało elastyczna.
Za cel finansowanego ze środków UE projektu HELENLP (Heterogeneous learning for natural language processing) przyjęto tworzenie systemów zdolnych do lepszej interakcji z ludźmi. Prace projektu skoncentrowano na poprawianiu wydajności poprzez dodanie ogromnego zestawu nowych źródeł cyfrowych o różnych stopniach adnotacji. Komputery korzystające z planowanych algorytmów mogłyby automatycznie interpretować źródła, odpytując moduł adnotacji. Badacze zamierzali opracować dodatkowe algorytmy adnotacji, dążąc ostatecznie do poprawy rozumienia mowy i tekstu przez komputery.
Prace skoncentrowano na nowych metodach obliczeniowych i statystycznych integrowania i analizowania źródeł cyfrowych. Opracowano pasywne metody opisywania danych już częściowo opatrzonych adnotacjami bez użycia modułu adnotacji oraz metody aktywne, korzystające z takiego modułu. W nowych algorytmach uwzględniono też uczenie równoczesne poprzez łączenie kilku źródeł danych opatrzonych adnotacjami. Potencjalne zastosowania to kategoryzacja tekstu oraz segmentacja i rozpoznawanie fonemów.
Projekt osiągnął cel zintegrowania silnej grupy badawczej. Prace zaowocowały stworzeniem puli badaczy, pozyskaniem dodatkowych funduszy i publikacjami badawczymi.
Nowe algorytmy z projektu HELENLP mogą usprawnić przetwarzanie ludzkiego języka naturalnego przez komputery.
opublikowano: 2016-03-15