Hybrydowe podejście do tłumaczenia maszynowego

Choć statystyczne metody tłumaczenia maszynowego (MT) przyciągają większą uwagę środowisk akademickich, w praktyce nadal dominują tradycyjne architektury regułowego tłumaczenia maszynowego (RBMT). Przyczyn takiego stanu rzeczy jest wiele, podobnie jak niedoskonałości obu podejść.

Rozwiązanie tego problemu przyjęto za cel projektu HYGHTRA (A hybrid high quality translation system), w ramach którego zaproponowano hybrydową architekturę łączącą najlepsze cechy obu podejść, a unikającą ich słabości. Projekt zrealizowano jako wspólne przedsięwzięcie między ośrodkiem badań nad tłumaczeniami na jednym z niemieckich uniwersytetów a niemiecką firmą zajmującą się inżynierią języka.

Partnerzy projektu opracowali metodologię i stworzyli zestaw narzędzi obliczeniowych i zasobów do szybkiego integrowania nowych języków i podejść translacyjnych z regułowym systemem MT z wykorzystaniem statystycznych technik MT.

W toku prac powstała też modułowa infrastruktura programistyczna. Umożliwiło to opracowanie nowego zestawu produktów i usług, który partner komercyjny projektu oferuje już na nowych rynkach wykraczających poza tradycyjne zastosowania MT. Stworzono między innymi moduły do głębokiej analizy lingwistycznej i generowania danych, wyodrębniania terminologii i wspomagania procesu tłumaczenia zespołowego.

Badano też nowatorskie zastosowania technik MT, między innymi w nauczaniu języków i szkoleniu tłumaczy. Partnerzy projektu zaproponowali metodę opartą na podstawach pedagogicznych wraz ze scenariuszami używania MT do wspomagania procesu nauczania języka na poziomie zaawansowanym.

Nowe metodologie mają zastosowanie do generowania szczegółowo opisanych słowników i gramatyk z dużych zasobów tekstowych, wyodrębniania baz danych odpowiedników tłumaczeniowych, generowania wstępnych wersji słowników elektronicznych i gramatyk dla nowych języków blisko spokrewnionych z istniejącymi oraz rozstrzygania statystycznego w przypadku sprzecznych wyników zastosowania różnych reguł analizy składniowej. W ramach uniwersyteckiego modułu "Angielski dla tłumaczy" przetestowano uzasadnione pedagogicznie scenariusze używania MT do generowania negatywnych danych językowych dla potrzeb nauki języka na poziomie zaawansowanym i szkolenia tłumaczy.

Z innych działań projektu należy wymienić cykl warsztatów na czołowych konferencjach międzynarodowych z zakresu lingwistyki komputerowej. Spotkali się tam badacze MT i przedstawiciele firm tworzących komercyjne produkty MT zainteresowanych podejściami hybrydowymi.

Najważniejszy wkład projektu HYGHTRA w badania naukowe stanowi nowa metoda budowania hybrydowych systemów MT poprzez dodanie technik statystycznych do istniejących technik regułowych o szerokim zakresie zastosowań. Fundamentalna architektura systemu pozostaje regułowa, ale zastosowanie metod statystycznych wspomaga szybkie tworzenie gramatyk i słowników dla potrzeb nowych kierunków tłumaczeniowych. Dzięki temu możliwe jest utrzymanie dokładności analizy językowej przy jednoczesnym ograniczaniu niezbędnych zasobów obliczeniowych.

opublikowano: 2015-11-13
Komentarze


Polityka Prywatności