Realistyczny interfejs głosowy

Just_yellow_paint
By aceebee from Camberley, UK (Just yellow paint) [CC BY-SA 2.0 (http://creativecommons.org/licenses/by-sa/2.0)], via Wikimedia Commons

Wysiłki badaczy z UE przyczyniły się do lepszego rozpoznawania mowy ludzkiej przez komputery. Przeprowadzone prace polegały na prezentowaniu komputerom dużych ilości materiałów źródłowych o wstępnie określonym formacie przy użyciu nowych algorytmów umożliwiających automatyczne nadawanie struktury.

Komputery nadal mają bardzo ograniczone możliwości interpretowania ludzkiego języka naturalnego. Wynika to między innymi z faktu, że główna metoda uczenia komputerów, czyli nanoszenie adnotacji eksperckich, jest powolna, kosztowna i mało elastyczna.

Za cel finansowanego ze środków UE projektu HELENLP (Heterogeneous learning for natural language processing) przyjęto tworzenie systemów zdolnych do lepszej interakcji z ludźmi. Prace projektu skoncentrowano na poprawianiu wydajności poprzez dodanie ogromnego zestawu nowych źródeł cyfrowych o różnych stopniach adnotacji. Komputery korzystające z planowanych algorytmów mogłyby automatycznie interpretować źródła, odpytując moduł adnotacji. Badacze zamierzali opracować dodatkowe algorytmy adnotacji, dążąc ostatecznie do poprawy rozumienia mowy i tekstu przez komputery.

Prace skoncentrowano na nowych metodach obliczeniowych i statystycznych integrowania i analizowania źródeł cyfrowych. Opracowano pasywne metody opisywania danych już częściowo opatrzonych adnotacjami bez użycia modułu adnotacji oraz metody aktywne, korzystające z takiego modułu. W nowych algorytmach uwzględniono też uczenie równoczesne poprzez łączenie kilku źródeł danych opatrzonych adnotacjami. Potencjalne zastosowania to kategoryzacja tekstu oraz segmentacja i rozpoznawanie fonemów.

Projekt osiągnął cel zintegrowania silnej grupy badawczej. Prace zaowocowały stworzeniem puli badaczy, pozyskaniem dodatkowych funduszy i publikacjami badawczymi.

Nowe algorytmy z projektu HELENLP mogą usprawnić przetwarzanie ludzkiego języka naturalnego przez komputery.

opublikowano: 2016-03-15

Udostępnij