SZAP - 14

Cards (44)

  • Machine translation (MT)
    Zastřešující termín pro proces, ve kterém je stroj, počítač, využíván k automatizaci překladu mezi dvěma či více přirozenými jazyky, nebo alespoň pomáhá s realizací určitých částí tohoto úkolu
  • Fully automated machine translation (FAMT)

    Plně automatický počítačový překlad
  • Typy strojového překladu
    • Plně automatický strojový překlad (FAMT/AT)
    • Strojový překlad s lidskou asistencí (HAMT)
    • Strojem/počítačem podporovaný překlad (MAHT/CAT)
  • FAMT - Fully Automated Machine Translation
    Plně automatický počítačový překlad, kvalitní automatický překlad zůstává (prozatím) nedosaženým cílem, některé specializované jednoúčelové systémy mohou dosahovat v podstatě 100 % úspěšnosti
  • HAMT - Human Aided Machine Translation
    Počítačový překlad s lidskou asistencí, do této kategorie de facto spadají všechny ostatní automatizované systémy, v průběhu procesu počítačového překladu je většinou nutná lidská asistence při pre-editaci nebo post-editaci
  • MAHT - Machine Assisted Human Translation
    Počítač je překladatelem využíván jako prostředek k usnadnění a urychlení překladového procesu, využívání textového editoru, scanneru, internetu, elektronických slovníků atd., speciální nástroje pro počítačem podporovaný překlad čili CAT (computer aided translation)
  • Translation memory (TM)
    Dvojjazyčný korpus, který sestává z paralelních textů ve výchozím a cílovém jazyce
  • Terminology database (termbase)
    Uživatel (překladatel) naplňuje ručně, obsahuje konkrétní termíny ve zdrojovém i cílovém jazyce, využívá se zejména u technických textů při překládání přesných termínů
  • Překladové projekty umožňují práci současně na několika dokumentech, překladatel může importovat zvolené dokumenty z jiného projektu
  • Text alignment tool
    Umožňuje překladateli vytvořit TM z již zhotovených překladů (text musí existovat v elektronické podobě)
  • Terminology manager
    TM uchovává obvykle celé věty, terminology manager pracuje na úrovni lexikálních jednotek, databázi termínů si může překladatel sám spravovat (doplňovat, opravovat, rozšiřovat), TM poskytne překladateli k náhledu všechny existující paralelní segmenty, ve kterých se zadaný výraz vyskytuje
  • OCR (Optical Character Recognition)

    Optické rozpoznávání textu
  • Překladače na principu děrované papírové pásky, G. Artsrouni (FR), P.S. Trojanskij (SSR)

    30. a 40. léta 20. století
  • Weaver (USA), A. D. Booth (GB) společně navrhují využití počítače pro překlad, tj. poprvé pro jinou než čistě numerickou aplikaci

    1947
  • Prezentace prvních automatických překladačů, zahájení MT výzkumu na mnoha amerických univerzitách a postupně i v dalších zemích, zprovoznění prvních funkčních systémů pro překlad z ruštiny do angličtiny (Mark 1, SERNA)

    1950-66
  • Počítačový překlad vyhodnocen jako pomalejší, méně přesný a nákladný; vývoj se přesunul do oblasti vývoje podpůrných počítačových nástrojů usnadňujících práci (elektronické bilingvální slovníky, terminologické databáze, databáze paralelních textů)
    1966—76
  • Komercializace MT a obnovený výzkum (AT na úzce zaměřené oblasti jako zdravotnické formuláře, technické manuály)
    1976—90
  • Založena Mezinárodní asociace pro strojový překlad (IAMT) sdružující výzkumné ústavy, obchodní společnosti, odborníky z příbuzných oborů a překladatele

    1991
  • Spuštěna AltaVista Translation Service, zkráceně 'Babelfish', první internetová služba poskytující zdarma a v reálném čase strojový překlad obsahu internetových stránek
    1997
  • Překladatelská studia (CAT) se ve specializovaných oblastech stávají standardem překladatelské práce (lokalizace software, odborné texty s vysokými nároky na terminologickou přesnost a uzuálnost); za svůj standard "překladatelské studio" (konkrétně Trados Translator's Workbench) přijala i Evropská Unie
  • Využitelnost počítačových nástrojů pro překlad
    • Překlad odborných textů náročných na terminologii (texty, kde převažuje funkce věcně sdělná), často se opakují termíny a určité větné konstrukce (př.: technické manuály, texty z práva, ekonomie, medicíny)
    • Databáze termínů zajišťuje konzistentnost
    • Rychlost - hledání pomocí fulltextu, v elektronických slovnících
    • Dostupnost - VLTM, volně přístupné databáze na internetu
    • Google Translate - uživatelé mohou překlady editovat, zvyšuje se tak kvalita
    • Umožňuje práci na překladatelských projektech, zajišťuje konzistentnost
    • Při softwarové lokalizaci se překladatel nemusí vyznat v programovacím kódu
    • Zachovávají formát původního dokumentu (řádkování, typ písma, barvy)
    • Úspora času
    • Zvýšení konzistence (a tím i kvality)
  • CAT nástroje
    Standardem překladatelské práce (lokalizace software, odborné texty s vysokými nároky na terminologickou přesnost a uzuálnost)
  • Evropská Unie přijala za svůj standard "překladatelské studio" (konkrétně Trados Translator's Workbench)
  • Výhody CAT nástrojů
    • Databáze terminů à konzistentnost
    • Rychlost à hledání pomocí fulltextu, v elektronických slovnících
    • Dostupnost à VLTM, volně přístupné databáze na internetu
    • Google Translate à uživatelé mohou překlady editovat, zvyšuje se tak kvalita
    • Umožňuje práci na překladatelských projektech, zajišťuje konzistentnost
    • Při softwarové lokalizaci se překladatel nemusí vyznat v programovacím kódu
    • Zachovávají formát původního dokumentu (řádkování, typ písma, barvy)
    • Úspora času
    • Zvýšení konzistence (a tím i kvality) – terminologická přesnost, dodržování úzu
    • Shromáždíme-li dostatečný počet odborných textů z určité oblasti – bude generován značný počet shod à díky TM se zvýší rychlost, přesnost a uzuálnost překladu
    • Automatická segmentace textu v překladu umožňuje přehledné postupování (nehrozí vynechání nebo přeskočení řádku)
    • Výchozí a cílový text jsou uspořádány pěkně vedle sebe, netřeba přeskakovat mezi různými okny (nahlížení do papíru snad už ani nelze brát úvahu) - šetří oči a skýtá vyšší uživatelský komfort
    • Odlišují překladový text od programovacích kódů (umožňují lokalizaci softwaru)
  • Limity CAT nástrojů
    • FAMT, HAMT – výsledný text potřebuje editovat, nelze jej považovat za hotový produkt
    • Databáze a bilingvní slovníky nabízejí synonyma, ale neurčují, které synonymum se hodí do kontextu
    • PC nepracuje s překladovými jednotkami jako s jazykovými útvary coby nositeli významu, pouze srovnává formální podobnost mezi dvěma znakovými řetězci, postrádá tedy jakékoli zohlednění kontextu jazykového, situačního či pragmatického
    • V databázi se také mohou vyskytovat nekvalitní překlady
  • Jazykový kontext
    • Typologické odlišnosti (ČJ: syntetický jazyk, AJ: analytický jazyk)
    • Funkční větná perspektiva (téma, réma)
    • Mechanické spojování jednoslovných segmentů dle vzorce substantivní přívlastek + substantivum
  • Situační kontext
    • Rozdíly v úzu, jedná-li se o větu v nadpise, komentář k obrázku nebo větu v odstavci
  • Pragmatický kontext
    • Dvě formálně totožné věty mohou mít dva odlišné významy
  • Adaptivní MT
    • Vlastní MT engine, který se přizpůsobí stylu překladu, obsahu a terminologii
    • Pokaždé, když se provede změna ve výstupu strojového překladu a potvrdí se segment, engine se z ní poučí a v reálném čase ji aplikuje na další věty
  • Cloud computing
    Jednoduše je cloud computing dodávání výpočetních služeb, jako jsou servery, úložiště, databáze, sítě, software, analytické nástroje a další, přes internet ("cloud")
  • Poskytovatelé cloudu

    Společnosti nabízející tyto výpočetní služby, obvykle se za služby cloud computingu platí na základě jejich využití obdobně, jako platíte účty za vodu nebo elektriku
  • Integrace MT do TM
    • MT vytváří překlad podle záznamů v TM, může si z ní brát potřebné termíny, a tak zajišťuje konzistentnost překladu
  • Post editing MT

    • MT už jen nenapovídá, ale je možné ho rovnou upravovat, což zvyšuje efektivitu práce překladatelů
  • Web-based CAT tools
    Nástroje, které jsou zcela online, a není potřeba žádné instalace (cloud computing)
  • APE - automated post-editing
    • Automatický systém se namísto použití lidských editorů snaží transformovat výstup MT na nový překlad, který se bude více podobat překladu po editaci
  • Integrace MT a APE systémů
    • Vzniká překlad, do kterého je potřeba mnohem méně zasahovat
  • Project Management (and distributed translation)
    1. Registrovaný projektový manažer (PM) vytvoří překladatelský projekt pro určitý jazykový pár nahráním zdrojového souboru
    2. Po vytvoření projektu se v řádku tabulky přiřazení úloh objeví ID úlohy (další informace jsou přiřazeny)
    3. PM může úlohu zkontrolovat a přiřadit dílčí úlohy překladu kterémukoli z dostupných překladatelů
    4. Překladatel může úlohu přijmout nebo odmítnout
    5. To se ukáže u PM, ten si ji po revizi může hned stáhnout a rozposlat klientům
  • Možnost vybírat i z několika návrhů MT
    • Od APE, MT anebo od MT nějaké třetí strany, který je možné doinstalovat
  • MMT
    • Financováno Evropskou unií
    • Software MT s otevřeným zdrojovým kódem
    • Nevyžaduje počáteční školení
    • Přizpůsobuje se překládanému obsahu v reálném čas
    • Učí se z uživatelských oprav
  • Interactive Machine Translation
    • Pomáhá psát rychleji (předpovídá slova)
    • Dokáže přepsat navržený překlad, jakmile zjistí, že překladatel zvolil jiné slovo nebo frázi, než původně navrhla