MateCat — kot najlepszym przyjacielem nie tylko tłumacza
14.05.2016 15:16
Witajcie w moim pierwszym wpisie. Zamierzam poruszyć w nim temat oprogramowania, o którym chyba niewiele mówiono na ramach tej strony lub blogów na niej obecnych (a przynajmniej nie w ciągu ostatnich kilku miesięcy, od kiedy ją śledzę). Nie dziwota, wszak usługa, którą chcę opisać należy raczej do narzędzi specjalistycznych, wykorzystywanych jedynie przez osoby nią zainteresowane. Ja jednak uważam, iż może się ona przydać także laikom.
Matecat (bo to on jest bohaterem tego wpisu) to open-source'owe narzędzie typu CAT (ang. computer-assisted translation, pol. tłumaczenie przy użyciu komputera). Skierowane jest ono przede wszystkim do osób zajmujących się zawodowo tłumaczeniem tekstu z jednego języka na inny. Ot działająca w przeglądarce aplikacja, która korzystając z pamięci tłumaczeniowych (ang. translation memory) pozwala w miarę szybko i wygodnie uporać się z tłumaczeniem. Pamięć tłumaczeniowa, to nic innego jak baza danych, zawierająca fragmenty tekstów w co najmniej dwóch różnych językach. Po załadowaniu tekstu do programu, zdania w nim zawarte porównywane są z pamięcią tłumaczeniową i na ich podstawie powstaje propozycja tłumaczenia.
Ok, na tym etapie pewnie niektórzy zastanawiają się "po jakiego diabła mi to wiedzieć, nie zajmuje się przecież tłumaczeniami!". Pozwólcie więc, że nim przejdę do szczegółowego opisywania matecata, wytłumaczę się z decyzji opisania akurat narzędzia tego typu. Otóż uważam, że nie trzeba być tłumaczem, by oprogramowanie wspomagające tłumaczenie przy użyciu komputera mogło ułatwić nam życie. Może się zdarzyć, iż będziemy musieli przetłumaczyć jakiś tekst z jednego języka na drugi. Nie będzie to na tyle ważny dla nas tekst, by fatygować się z nim do specjalisty (który troszkę za niego skasuje), ale z drugiej strony, ciężko nam zabrać się za niego samemu. Moje własne doświadczenia: jestem studentem translatoryki i moi znajomi dosyć często proszą mnie, bym wykonał dla nich jakieś drobne przekłady: a to kolega chce umieścić na swoim blogu wpis w języku obcym, a to koleżanka chce wystartować w międzynarodowym konkursie architektonicznym i ktoś musi przetłumaczyć jej projekt na język zrozumiały dla szerszego grona odbiorców, a to inna znajoma napisała poradnik do jakiegoś MMORPGa i chciałaby mieć jego angielską wersję, by wrzucić na jakieś międzynarodowe forum... do tego dochodziło jeszcze tłumaczenie korespondencji firmowej i inne tego typu drobnostki. Są to raczej zbyt trywialne rzeczy, by zlecać je profesjonalnemu tłumaczowi (chyba, że ktoś ma naprawdę sporo kasy), a z drugiej strony, posty na blogu czy poradniki do gier online nie należą raczej do ambitnych tekstów, trudnych w redakcji czy odbiorze. Osoba z umiejętnością posługiwania się językiem obcym na poziomie B1‑B2 powinna sobie z tym poradzić. Zwłaszcza, jeśli miałaby do pomocy narzędzie, które jej tę pracę ułatwi.
I tym samym wracamy do matecata. Strona główna wygląda przejrzyście i daje nam dokładnie to, czego nam trzeba. Możemy z niej załadować tekst do przetłumaczenia, wybrać język wejściowy, a także język docelowy, wybrać temat tekstu (co pewnie ma ułatwić matecatowi w wyszukiwaniu odpowiednich rekordów w pamięci tłumaczeniowej). Plik możemy załadować prosto z naszego dysku twardego lub z Google Drive (do matecat możemy zalogować się poprzez konto Google, lub korzystać zeń anonimowo). Po wgraniu tekstu (matecat twierdzi, że obsługuje 68 formatów plików) i ustawieniu języków klikamy w duży niebieski przycisk "Analyze". Ukaże nam się wtedy tabelka ze statystykami tekstu (dla nas to raczej nieistotne informacje), którą olewamy i klikamy na "Translate".
Po kliknięciu przycisku Translate pojawi nam się okienko, z którego możemy zamówić profesjonalne tłumaczenie tekstu (wykonane przez człowieka, nie przez maszynę). Jednakże, jeżeli chcemy sami zmierzyć się z tekstem, klikamy na "Open"
Wówczas pokaże nam się okno, w którym dokonamy dzieła przetłumaczenia tekstu na inny język. Po lewej stronie znajduje się oryginał tekstu, a po prawej, jego tłumaczenie. Pozwoliłem sobie na użycie tekstu autorstwa użytkownika wielkipiec o analizie telemetrii. Wrzuciłem fragment owego tekstu do matecata by zobaczyć, w jaki sposób kotek przetłumaczy go bez mojej ingerencji, na język angielski.
Idealnie nie jest. Pojawiły się drobne niedociągnięcia, lecz ogólne przesłanie pozostało. Owe niedociągnięcia możemy z łatwością poprawić (nie trzeba być anglistą by to zrobić), możemy też dowolnie przeredagować zdanie, tak by brzmiało lepiej. Trójkąciki i kwadraciki przed i po "surprisingly popular" to tagi. W oryginalnym tekście, w tym miejscu znajdowało się hiperłącze. Jeżeli nie usuniemy tagów, po wyeksportowaniu tłumaczenia, hiperłącze powinno nadal tam być. Dodatkowo, pomagają one zachować formatowanie tekstu. Kasowanie tagów, to ogólnie kiepski pomysł: ich usunięcie może skutkować problemami w pobieraniu lub poprawnym otwieraniu pliku tekstowego z tłumaczeniem.
W tym fragmencie rzuca się w oczy błąd na samym początku, gdzie pierwszą osobę l. poj. zamieniono na trzecią. Jest to jednak łatwe do wychwycenia i korekty. Kolejnym ciekawym błędem jest przetłumaczenie związku frazeologicznego "napisać coś na kolanie" w sposób dosłowny. Program komputerowy nie wychwytuje oczywiście takich subtelności językowych, w tych miejscach musi wkroczyć człowiek. Żadne oprogramowanie do tłumaczenia nie pomoże nam zbytnio w tłumaczeniu tekstów, w których pełno jest finezji (jak np. poezja). Przyznacie chyba jednak, że cała reszta nie wygląda tak źle (pamiętajcie, że tłumaczyła to maszyna), zwłaszcza że możemy łatwo skorygować tekst tłumaczenia.
Darujmy sobie tłumaczenie innych fragmentów, chętni mogą wypróbować matecata sami, i przejdźmy do innych szczegółów.
Jak wspomniałem na początku, matecat jest programem typu open-source, na stronie znajdziemy linki do githuba oraz inne informacje na temat projektu. Oprogramowanie jest i będzie (przynajmniej wg twórców) całkowicie darmowe, aczkolwiek istnieje możliwość wykupienia planów Gold i Platinum (ten pierwszy kosztuje bagatela 1500 euro za miesiąc, ceny drugiego nie podają), ale są to oferty skierowane do dużych firm, a nie do indywidualnych użytkowników. Matecat obsługuje naprawdę wiele języków, oferuje support oraz darmowe webinairy na tematy związane z przekładem (na webinairy trzeba się wcześniej zapisać). Support reaguje bardzo szybko, na potrzeby tego wpisu napisałem do nich, odpisali w ciągu 5 minut. Niestety, z matecata można korzystać jedynie na przeglądarkach Chrome i Safari, w przeciwnym wypadku zobaczymy taki komunikat:
Nie powinno być to jednak wielką przeszkodą, jakby nie patrzeć, przeglądarka od Google'a i tak jest używana przez większość internautów.
Rzecz jasna, programów podobnych do matecata jest całkiem sporo. Cel działania większości z nich jest podobny: ułatwić tłumaczenie tekstów. Zdarzyło mi się używać innego softu do przekładu np. darmowego WordFast Anywhere, jednakże po jakimś czasie coś skopało się z pamięcią tłumaczeniową i program przestał wspomagać mnie w translacji. Dodatkowo miał on dosyć denerwujący mechanizm obsługi tagów, a pominięcie jakiegoś taga mogło prowadzić do zabawnych, acz irytujących bugów, jak np miganie wyeksportowanego tekstu w edytorze tekstowym (sprawdzane na Word i Libre Office). W roku 2013 J. Tabor przeprowadził badanie, z którego wynikło, iż ponad 43% tłumaczy korzysta z oprogramowania Trados Studio. Jest to jednak program płatny (kosztuje niemało), co dyskwalifikuje go z użycia przez każdego, kto nie jest profesjonalistą. Dodatkowo działa on tylko na Windowsie, więc użytkownicy OS X czy Linuxa muszą obejść się ze smakiem.
Zbliżając się do końca: MateCat jest moim zdaniem dobrym rozwiązaniem zarówno dla profesjonalistów, jak i dla osób, które od czasu do czasu muszą zmierzyć się z tłumaczeniem jakiegoś tekstu. Jego obsługa wymaga wprawdzie znajomości języka obcego, aczkolwiek nie trzeba być na nie wiadomo jak wysokim poziomie. Matecat jest lepszym rozwiązaniem niż Google Translate, którego kulawe tłumaczenia wzbudzają często śmiech i politowanie (aczkolwiek, Google Translate, rozsądnie używany, także może być cenną pomocą). Nie polecałbym matecata do tłumaczenia tekstów, w którym znajduje się sporo metafor i innych subtelności, skrypty niestety ich nie wyłapią i przetłumaczą dosłownie. Takie tłumaczenie nie będzie miało żadnej wartości. Osobom nie znającym się na tłumaczeniach, nie radziłbym także samodzielnego tłumaczenia np. tekstów reklamowych lub innych oficjalnych pism. Jeśli masz firmę i chcesz np. przetłumaczyć swoją stronę internetową na język obcy, by trafić ze swoją ofertą także do osób zza granicy, lepiej poświęć trochę pieniędzy i zatrudnij profesjonalistę. On będzie wiedział, jak dostosować taki tekst do konwencji przyjętych w danym kraju. Widywałem już angielskie wersje stron czy ulotek, gdzie tłumaczenie tekstu musiało powodować u obcokrajowców atak śmiechu (o ile w ogóle byli oni w stanie zrozumieć, co autor miał na myśli). Jeżeli jednak nie są to teksty, od których zależeć mogą Twoje zyski i nie chcesz nikomu płacić, wykorzystaj zdobycze technologii i pozwól, by komputer ułatwił Ci pracę.