Webベース翻訳プラットフォーム Transifex 使用メモ
Saas、多言語対応、多ユーザー協同でドキュメント翻訳を進めていけるサービス。サービス全体の機能をざっと眺める限り、従来からあるPootleとおそらくかなり近い。下記サイトのデザインからもわかるように、最初からモダンなブラウザに対応すべく設計されたサービスのようだ。使いやすいので、これからまだまだ広まっていくと思う。
- Transifex
- Pootle
- Pootle Demo 参考。いくつかの翻訳プロジェクトの様子がデモで見られる
- Pootle - Wikipedia
先日、
に参加したのをきっかけにこのTransifexをいろいろ触れたので、気づいた点をメモ替わりに:
翻訳作業の流れ
- Transifexアカウントを(まだなければ)作成
- 該当プロジェクト(今回の例ではThe Data Journalism Handbook多国語化)へ参加申請
- 文字列の閲覧はプロジェクト未参加でも可能、翻訳はプロジェクト参加後に可能
- あとは、翻訳対象のファイル、セクション等を選び‥
- 画面右側のエディタ部分で粛々と翻訳。各パートごとにTabキーまたは [保存] で即時保存
- 保存後しばらく経つと「履歴」に翻訳履歴が残る(=翻訳文字列のバージョニングも自動でやってくれる)
- 画面右下、他の人が他訳を「提案」したり、「コメント」を入れたりすることも可能なようだ
- 進捗を示す黄緑のプログレスバーも即時更新。他の人からも閲覧可能("Cloud-based")
"http://(URL)[文字列]" の文字列構造はそのままで
原文(=英→日翻訳の場合は英語)に http://(URL)[文字列]
のようなURLつき文字列が登場した場合、翻訳文(日本語)でもその構造を保持しておくのがよい
- 例)
http://www-news.iaea.org/EventList.aspx[IAEA site]
- OK:
http://www-news.iaea.org/EventList.aspx[IAEAサイト]
[ ]
の中は翻訳してもよい
- NG:
http://www-news.iaea.org/EventList.aspx [IAEAサイト]
[ ]
の前にスペースは入れない
- NG:
http://www-news.iaea.org/EventList.aspx(IAEA のサイト)
[ ]
以外の記号(全角かっこや半角かっこなど)は使わない
- OK:
この記法はどうやらTransifex独自のようで(違うかも)、HTML化された場合のハイパーリンク表示に対応するようだ。例えば原文がこのようなページであれば、ハイパーリンクは下図のように表現される。
※ Wikipedia上でリンクを表現するときの記法に似ている(Wikipedia Help:リンク)‥と思ったら少し違った
外部リンクは http://www.example.org リンク名 という形式で記述します。
「用語」とは?
Transifex上ではGlossaryと呼ばれている。複数メンバーでの翻訳の場合、「この英単語はこの日本語翻訳で文書中は統一できるとよいな」というケースがけっこうある。たとえばprogramming languageを‥
- Aさんは「プログラミング言語」
- Bさんは「プログラム言語」
- Cさんは単に「言語」
‥と翻訳する、いわゆる表記揺れが生じる。文脈上はおそらくどれが間違いともいえない。"強いて言うなら逐語訳といえる「programming language − プログラミング言語」かなあ" と相談するなどで決めた場合に、この英−日の組み合わせを「用語」に登録しておく。
そうすると、以下の画面のように、翻訳時に訳語をポップアップ表示してくれるので、その後の翻訳での日本語表記揺れが(基本的には)なくなり、翻訳後文書全体の内容整合性が上がる。
(とはいえ、AさんBさんCさんの翻訳をどれも活かすという意味で、上記のような表記揺れは許容しよう、という考え方もありだと思う。どこまでこだわるか?の問題)
- プロジェクトの先頭ページ [View Glossary]
- 翻訳対象の言語(日本語)を選択して、[新しい用語の追加]
- 下図のように用語を登録(品詞はおそらく任意、たいていは名詞Nounと思います)
- 翻訳作業の画面では以下のように、原文(英語)下線が引かれ、マウスオーバーで訳文(日本語)が表示される
- 登録した用語は、画面右上 [用語検索] で検索も可能。下の例は(わかりづらいけれど)database で検索した例。翻訳文字列中どこに何箇所 database が登場するかがわかる
- しかし登録したての用語は、この[用語検索]でも検索できない。しばらく待たないといけないようだ
翻訳メモリ(Translation Memory, TM)
用語(Glossary)の拡張版とも言えそうだけど、英→日の定型表現を「翻訳メモリ」として登録しておき、類似表現が登場したときに、翻訳候補として「提案」欄に表示が可能(なようだ。)
例えば 「What Is Machine-Readable Data?」−「機械可読データとは?」
という翻訳メモリが存在したとき、訳文に
What Is Machine-Readable File?
が登場すると、翻訳メモリとの一致率(どれくらい類似しているか)と合わせて、右下「提案」欄に 「What Is Machine-Readable Data?」−「機械可読データとは?」
を表示してくれるもよう。
実際に使用していないけれど、画面イメージはこのページの「Translation Memory」にある。必須とは思わないけど、長くややこしい表現が登場したときの意味解釈をアシストしてくれる感じかも
参考情報
同様に手順と合わせて記事を書かれている方が複数名おられます