Možnosti využitia strojového prekladu v slovenskom jazyku

19.04.2014

V poslednej dobe je v prekladateľskom odvetví čoraz viac počuť o strojových prekladoch (ďalej len SP). Názov pochádza z anglického slova Machine Translation často skracovaný na MT. Zatiaľ je okolo jeho využiteľnosti v podmienkach slovenského trhu nejasno. Pri tom je dôležité, ako sa postaviť k IT evolúcii v prekladateľskom segmente. Týka sa nás to? Pokúsiť sa nasadnúť na vlnu a potom z nej profitovať alebo ide o Sci-fi, ktoré nie je na Slovensku realizovateľné?

Pre laickú verejnosť spresním niektoré základné rozdiely v prístupoch k prekladaniu. Profesionálny preklad je vykonávaný v špeciálnych programoch, takzvaných CAT nástrojoch. Takýto preklad nazývame počítačom podporovaný preklad. Tieto programy pomáhajú prekladateľovi produkovať kvalitnejšie a efektívnejšie preklady. Niekedy si ľudia mimo prekladateľského odvetvia mylne myslia, že počítačom podporovaný preklad a strojový preklad predstavujú to isté. Nie je to tak. Ide o úplne iný prekladateľský proces. Strojový preklad je výlučne výsledok počítačového programu a do procesu prekladu prekladateľ nezasahuje.

Prvé strojové preklady sa začali už v 50. rokoch minulého storočia, kedy sa podarilo vytvoriť automatický prekladač viac ako šesťdesiatich ruských viet do angličtiny. Na základe Georgetownského experimentu, ako sa prvý projekt volal, sa postupom času vyvinulo niekoľko spôsobov prekladu, ktoré využívajú odlišné metódy či techniky. Podľa týchto techník identifikujeme tri základné prístupy k SP:

  • SP na základe pravidiel (Rule-Based Machine Translation - RBMT)
  • SP na základe štatistiky (Statistical Machine Translation - SMT)
  • Hybridné SP (Hybrid machine translation HMT)

Práve posledne spomenuté hybridné strojové preklady (HMT) sa zameriavajú na kombináciu najlepších vlastností rôznych prístupov k SP. Strojovo preložený preklad nie je v drvivej väčšine prípadov okamžite použiteľný a musí byť ešte spracovaný editorom (post-editing). Základnou myšlienkou SP je generovanie prekladu v takej kvalite, ktorá umožní skrátiť dobu prekladu a znížiť celkové náklady na preklad. V súčasnosti je veľmi populárne zahŕňať lingvistické funkcie do systémov štatistických strojových prekladov SMT, prípadne modifikovať základnú architektúru pravidlových strojových prekladov RBMT pridaním štatistických znalostí. Existujú však aj iné spôsoby hybridizácie SP, ktoré spočívajú v kombinácii bohatej palety prekladateľských paradigiem. SP sú v súčasnej dobe v centre záujmu a popredné technológie dokázali priniesť výsledky. Celková miera pokroku sa výrazne spomalila ako dozrievali. Neznamená to však, že technológie ako štatistické SP sú von z hry, ale skôr, že čas ľahko dosiahnuteľnej produktivity a kvality sú minulosťou. Ďalšie napredovanie si bude vyžadovať viac úsilia ako doteraz.

Na základe používateľov môžeme na prekladateľskom trhu deliť SP na prekladateľské agentúry a freelancerov. Freelanceri používajú SP ako pomôcku pri prekladoch pravidelne. Najznámejší príklad použitia sú web služby Google Translate a Bing translator. Služby sú pre verejnosť voľne dostupné, no pre profesionálne využite sú obe obmedzené. Kým Microsoft ponúka zadarmo 2 milióny slov mesačne, Google predáva svoje služby už od prvého písmena. Rizikom je sprístupňovanie prekladaného obsahu poskytovateľovi služby, ktorý tento ukladá pre ďalšie verejné použitie. Kvalita je vo všeobecnosti a profesionálne použitie príliš nízka.

Agentúry sa zaujímajú o sofistikovanejšie riešenia upravené pre potreby konkrétnych zákazníkov. Tieto riešenia predstavujú zdĺhavé nastavovanie systému, ktoré si vyžadujú lingvistov, terminológov, lokalizačných špecialistov, ktorí sú odborníci v danej jazykovej kombinácii. Výhodou tohto prístupu je vyššia kvalita predpreloženého textu, nevýhodou je potreba veľkého množstva už preloženého textu, rádovo v miliónoch slov zdrojových dokumentov. A aj napriek vynaloženému úsiliu nemusí výsledok uspokojiť očakávania. Slovenský jazyk obsahuje veľa pravidiel (čo sa dá vyriešiť RBMT), ale ešte viac výnimiek. Okrem toho je slovenský trh so svojimi potrebami taký malý, že nájdenie subjektu, ktorý na pravidelnej báze produkuje štandardizované texty aspoň v státisícoch slov ročne je takmer nemožné.

V akomkoľvek využití SP je dôležitá fáza pred-prípravy a fáza, takzvanej po-úpravy strojového prekladu (Post-Editing MT). Viacerí lokalizační špecialisti tvrdia, že nemusí byť prvoradé dosiahnuť vysokú kvalitu, ale dosiahnuť aspoň spracovateľný pred-preklad, ktorý prekladateľovi pomôže k efektívnejšiemu prekladu konkrétnej vety.

Autor: Juraj Baran, Tetras, s.r.o.