原文ファイルに現れるフォーマット情報は通常訳文ファイルに再現される必要があります。OmegaT は対応している形式(現在のところ DocBook, HTML, XHTML, Open Document, OpenOffice.org)の組み込みフォーマット情報をタグとして表示します。タグは普通マッチング処理で文字列の類似度を考えるときには考慮に入りません。タグを翻訳された分節に再現すれば、翻訳されたドキュメントにも現れます。
タグは 1 から 3 文字の英文字と番号からなります。ユニークな番号によってそれぞれ対応するタグを結びつけ、同じショートカット文字を持つが実際には違うタグを区分けします。
英文字はタグが表現しているフォーマットの値(太字、斜体など)を反映しているかもしれませんし、していないかもしれません。
タグにはタググループ毎に昇順で番号付けされます。
ここで言う「タググループ」とは、単一のタグ(<br1>
)ならばそれ自身、組となるタグならその 2 つの組(<f3>
と</f3>
など)を意味します。
一つの分節の中では、最初のグループ(組タグまたは単純タグ)が番号0を、次が番号1となります。
以下の最初の例では 3 つのタググループ(組タグ、単純タグ、もう一つの組タグ)があり、次の例では 1 つだけdのグループ(組タグ)があります。
タグは常に単純タグか組タグとして現れます。
単純タグは周りの文章に影響を与えないフォーマット情報(追加の空白や改行など)を示します。
<分節 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2></分節>
<br1>
は単純タグであり、周りの文章には影響を与えません。
組タグは普通開きタグと閉じタグの間の文章に適用されるスタイル情報を示します。いかなる場合でも、組タグは常に開きタグが閉じタグの前に現れます。
<分節 3167>Log file (<f1>log.txt</f1>) for tracking operations and errors.</分節>
<f1>
と</f1>
は組タグで、log.txt
に影響を与えます。
OmegaT は文単位の分節化を行なう前にタグを作成します。分節化ルールに依存して、タグは上記の番号とグループ化に従わない形で現れることもあります。
<分節 1554> <f0>Before: \. After: \s</f0></分節>
ここには問題はないように見えます。ここで、この分節にデフォルトの分節化規則を適用する(これが OmegaT のデフォルトの振る舞いです)と、以下のような結果になります:
<分節 1990> <f0>Before: \. </分節> <分節 1991> After: \s</f0></分節>
(ここで適用された分節化規則は: ピリオドの後ろ、スペースの前で分節を作る)
ここで、分節が組と番号付けルールに従っていないことがわかります: <f0>
と</f0>
は同じ分節で組になるべきですが、分節化ルールによって分割されています。
訳文言語での語順を反映させるためにタグを移動させないといけない場合、翻訳で問題が発生する場合があります(後述するタグ操作を参照してください)。
タグについて練習するには注意が必要です。もし間違って変更してしまうと、最終的なファイルのフォーマットが壊れてしまうかもしれません。最悪の場合には、ファイルそのものが全く開けなくなります;これは特に OpenOffice.org ファイルで発生します。
タググループを複製するには、好きな位置に単にコピーして下さい。組タグは常に開きタグが閉じタグの前に現れることを忘れないで下さい。
複製するグループによって表現されているフォーマットは複製された場所にある項目に適用されます。
例:
<segment 0001><f0>This formatting</f0> is going to be duplicated here.<end segment>
複製後:
<segment 0001><f0>Ce format</f0> a été <f0>copié ici</f0>.<end segment>
タググループを削除するには、単に分節から取り除いて下さい。フォーマットが適切に削除されるように、組タグの場合は開きタグと閉じタグを両方削除しなければなりません;さもないと翻訳ファイルが壊れたり、開けなくなったりします。
タググループを削除することで、翻訳したファイルから関係するフォーマットを削除できます。
例:
<segment 0001><f0>This formatting</f0> is going to be deleted.<end segment>
削除後:
<segment 0001>Ce format a été effacé.<end segment>
翻訳において異なる言語構造を反映させるためにタググループの順番を変える場合、単にタググループを翻訳であるべき場所に置いてください。
フォーマットは適用された部分に従います。
例:
<segment 0001><f0>The formatting here</f0> and <f1>the formatting here</f1> are going to be moved around.<end segment>
順序変更後:
<segment 0001><f1>Ce format</f1> et <f0>ce format</f0> ont été inversés.<end segment>
タググループの順序変更によって、タググループが他のタググループの中にネストすることがあります。これは外側のグループが内側のグループを完全に包む限り可能です。ネストにおいては、内側のグループが不完全に外側のグループの内側に入らない場合に特に注意してください;さもないと翻訳したファイルが壊れたり、開けなくなったりします。
ネスとした部分は両方のフォーマットが適用されます。
例:
<segment 0001><f0>The formatting</f0> <f1>here</f1> is going to be nested.<end segment>
ネスト後:
<segment 0001><f0>Le format <f1>ici</f1></f0> a été emboité dans le premier format.<end segment>
重複はタグペアの間違った操作の結果として起こり、確実にフォーマットが壊れてしまい、翻訳したファイルが全く開けなくなることもあります。
例:
<segment 0001><f0>the formatting</f0> <f1>here</f1> is going to be messed up.<end segment>
間違った操作後:
<segment 0001><f0>the formatting <f1>here</f0> </f1>is very messed up now.<end segment>
タグ検証機能(タグ検証)はタグの変更(故意と過失とに関わらず)を検出し、影響のある分節を表示します。この機能を使うと文書中にある、壊れているか間違っていると考えられるタグを表示したダイアログを開きます。
この機能はタグ付きテキストを翻訳した時の間違いを発見するのに便利です。これは翻訳中に発生したタグの問題によって開けなくなった OpenDocument やOpenOffice.org ファイルの問題です。この問題は、タグを修正して訳文文書を再作成することでしばしば修正されます。
タグは一般的に元の文書のある種のフォーマッティングを表現しています。元の文書フォーマッティングの単純化はタグの数の削減に大きく貢献しています。使用フォント、フォントサイズ、色などを可能ならば統一することで、翻訳を単純化し、起こりうるタグエラーの数を減らします。
タグに対して出来ることについては、タグ操作の項目を参照してください。
タグが悩みの種で、フォーマットが今の作業にとても重要というわけではないのなら、ほとんどのフォーマットを原文から取り除くことで翻訳が非常に簡単になることを憶えておいて下さい。
OmegaT でタグは表示されてほしいけれどもほとんどのフォーマットが訳文文書には不要の場合、自由に訳文からタグを取り除いてください。この場合、組タグには特に注意してください;組タグの片方を消すのを忘れると文書フォーマットが壊れてしまい、翻訳した OpenOffice.org 文書が開けなくなります。
タグはテキスト自身に含まれているので、より少ないタグが含まれる分節を作るために分節化規則を使うことも可能です。これは上級者向け機能で、初心者は使うべきではありません。
OmegaT はまだフォーマットのミスを完全に自動的に検出することはできないので、間違いを犯したり訳文言語によりよくなじませるためにフォーマットを変えたときに警告しません。しかし、時々翻訳したファイルがおかしくなったり、OpenDocument / OpenOffice.org ファイルの場合は開くことすら出来なくなることもあります。