翻訳メモリとは
この記事では、翻訳メモリについて、その仕組み、翻訳メモリがもたらす多くのメリットについてご紹介します。
著者: Fred Visnevsky
翻訳メモリ(TM)とは、人が行う翻訳のすべてにおいて中心的役割を果たす言語データベースのことです。現在および将来のプロジェクトで再利用するため、所定の言語ペアで翻訳した文章を継続的に蓄積する機能を持ちます。TMは現代の翻訳関連テクノロジーに必要不可欠な土台となるものです。ここで明確にしておかなければならないことは、TMは決して機械翻訳ではないということです。
機械翻訳が人間が行わない自動翻訳を目的としているのに対し、TMは特定の言語ペアに対して人間が以前行った翻訳を再利用するという汎用性の高い手段なのです。TMのデータベースには、原文の一部と対応する翻訳文が「分節ペア」別名「翻訳単位」として保存されています。通常、テキストでは文章、リスト、表、数字の組み合わせが分節とされ、その範囲は文末のピリオドや段落記号などの符号で決められます。
TMの仕組み
最初の段階では、コンピュータ支援翻訳ツールはTMを使用して今回行う翻訳のソースファイルを分析し、既存のTMファイルと比較します。TMファイルが存在しない場合は空のTMを作成し、それが所定言語の今回および将来の全プロジェクトで中心的役割を果たすものとなります。TMは文書を分析する際、新しいテキストの分節とTM内に存在する所定言語ペアの分節とを比較し、新しいプロジェクトで同じ分節が繰り返し出現する頻度を計算します。
分析が完了すると、TMによって一致する分節が識別され、それらは一致率に基づいて4つのカテゴリに分類されます。所定のプロジェクトを担当する翻訳チームは、その分節の翻訳として提案されたものをすべてまたは一部利用するか、あるいは提案を無視して新たに翻訳するかどうかを決めなければなりません。分節の一致の種類は以下のようなものです。
-
完全一致(100%マッチ) – 既存のTM分節と完全に一致する分節です。
-
繰り返し – 今回対象のドキュメントにおいて複数回出現する同じ内容の分節です。翻訳は一度だけ行われ、以降の繰り返しの分節には、その翻訳がTMによって提供されます。繰り返しは新しいTMプロジェクトではよく見られるものです。
-
あいまい一致(75~99%マッチ) – このグループに当てはまる分節は、既存のTM分節と一致する部分があるものです。この場合、分節内の異なる部分のみを新たに翻訳する必要があります。
-
一致なし(0~74%マッチ) – テキスト内で繰り返し出現しない、またはTM内に同一のものがないため新たに翻訳する必要のある、他に一致するもののない分節です。
翻訳メモリの作成プロセス
翻訳メモリは2つの方法で作成されます。
-
1. 新規TM – 新規翻訳メモリは最初のプロジェクトで作成されます。そのプロジェクトおよび将来のプロジェクトで継続的に再利用され、データが蓄積されます。これは所定言語ペアの翻訳が過去に行われていない場合に作成されるものであり、最も一般的なTMです。
-
2. 既存翻訳ドキュメントを元にしたTM – この種のTMは、ソースドキュメントがすでにターゲット言語に翻訳されている場合に作成されるものです。作成の際、翻訳チームは最初に「整合」と呼ばれる処理を実行して、既存または新規翻訳メモリに原文と対応するターゲット言語の翻訳データを入力し、将来のプロジェクトで使用できるようにします。
翻訳メモリを使用するメリット
翻訳メモリは継続的、長期的に利点をもたらすため、あらゆる企業や組織にとって短期的にも長期的にも重要な資産となり得るものです。翻訳メモリの主なメリットは以下の通りです。
-
コスト削減 – 一度TMを作成すれば、長期的なコストの削減が可能です。TM内に繰り返し分節や一致分節がある場合に料金を下げることができるからです。新しく翻訳しなければならないのは一致のない分節のみで、あいまい一致の分節は一部分のみを翻訳すればよいのです。大規模なTMは、継続的にコストダウンをもたらして有利に働き、長期的かつ重要な資産となります。
-
正確な料金設定 – TMを使えば過去すべてのプロジェクトや新しいプロジェクトの内容を同時に把握できるため、新しいプロジェクトの正確な見積もりを作成することが可能となり、顧客は言語サービス提供事業者(LSP)に支払うべき正確な料金を知ることができます。
-
一貫性 – すべての原文の変更を把握できるため、それが反映される翻訳文すべてにおいて一貫性が向上します。TMを使えば、どの翻訳者チームがプロジェクトを担当しても特定の用語や言葉遣いの一貫性を保つことができます。
-
汎用性 – TMには汎用性があり、文書翻訳、ウェブサイトのローカリゼーション、ソフトウェアのローカリゼーション、ゲームのセリフなど、使用するコンテンツの種類を問わず機能します。TMはこれらのさまざまなコンテンツやそれ以外のものに使用できます。例えば、最初の翻訳プロジェクトがソフトウェアのローカリゼーションだった場合、その際に作られたTMをウェブサイトのローカリゼーションにも適用することができます。
-
スピード – TMを使えば、「TMの仕組み」に記載した一致の種類に基づいて過去に翻訳された分節の全部または一部を再利用し、品質を損なうことなく翻訳スピードを大幅に向上させることができます。
まとめ
TMは担当翻訳チームと顧客の双方に多くのメリットをもたらすため、現代のあらゆる翻訳およびローカリゼーション環境において常に使用すべき中心的存在となっています。
TMで以前翻訳されたコンテンツを再利用して、翻訳者チームのワークフローの最適化、ミス発生の可能性の低減、翻訳のスピードアップ、顧客側コストの継続的削減を実現することによって、現在および将来すべてのプロジェクトの品質に良い影響がもたらされます。
TMを短期的および長期的に利用することで、あらゆるプロジェクトの品質を全体的に全く新しいレベルに押し上げることができるのです。