Egyszerű szöveg fordítása

Tartalomjegyzék

<a0>Egyszerű szöveg fordítása az OmegaT használatával</a0>

Az egyszerű szöveges állományok kizárólag szövegből épülnek föl. Az egyszerű szöveges állományokban nincs egyértelmű utasítás a számítógép számára arra vonatkozóan, hogy milyen nyelven íródtak. Ez nagyjából azt jelenti, hogy a számítógép abból indul ki, hogy a szöveg nyelve a számítógép alapbeállítása szerinti nyelvvel megegyezik.

Az egyszerű szöveges állományok legtöbbször .txt kiterjesztésűek.

Zavaros megjelenítés?

Egy orosz felhasználó esetén a számítógép nagy valószínűséggel szintén oroszul működik: a menük oroszul vannak, a megnyíló állományok nyelve is orosz stb. Legtöbbször a számítógép helyes feltételezésből indul ki, mivel a nyelvi környezet minden eleme orosz megjelenítést kíván.

Ha egy orosz fordító japán állományokat kap fordításra egyszerű szöveg formában, ezeket a gép orosznak fogja tekinteni. Ennek az az oka, hogy az állományban nincs utasítás a számítógép részére arról, hogy a szöveg milyen nyelven íródott.

A japán állomány tartalma lehet pl. a következő:

   OmegaTとは、コンピュータを利用した翻訳ツールです。

A szövegszerkesztőben azonban ez ekként jelenik meg:

   OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≈ВЈБB

mivel orosz tartalmat feltételezett... Csakhogy ez nem oroszul van. A japán karakterek helyén orosz betűk láthatók.

Az OmegaT szintén így működik. Az OmegaT feltételezi, hogy az egyszerű szöveg nyelvi megegyezik a számítógép alapbeállítás szerinti nyelvével. Ez nem jelent gondot, ha francia gépen kell a szöveget lefordítani angolra, vagy német gépen kell megnyitni olasz állományokat.

Karakterkészletek és kódolások

Miért működik jól az angol és a francia esetén, és miért gond az orosz vagy a japán? Azért, mert az angol és a francia azonos karakterkészletet használ. Éspedig a Latin-1-et vagy annak egy változatát.

Egészen mostanáig az orosz és a japán eltérő karakterkészleteket használt. Az orosz karakterek nem felelnek meg a japánoknak, és fordítva. Ennek eredménye látható fent.

A japán megbízó japán gépen dolgozik és japán szöveges állományokat hoz létre. Az ügyfél által kiválasztott karakterkészlet az operációs rendszertől és egyéb beállításoktól függ, de bizonyára a kiválasztott (japán) karakterkészlet nem jelenik meg helyesen az orosz számítógépen.

Az, hogy egy karakterkészletben az adott szöveg fizikailag miként jelenik meg (vagyis a számítógép miként olvassa azt be és jeleníti meg), a kódolástól függ. Amikor a számítógép beolvassa az állományt, a kódolásnak megfelelően "dekódolja" az információt és a karakterkészletnek megfelelően jeleníti meg. Durván fogalmazva, egy kódolás egy karakterkészletnek felel meg...

Az OmegaT által kínált megoldás

A helyzet kezelésére az OmegaT 3 alapvető megoldást kínál.

  1. A durva módszer:
  2. A választást kínáló módszer:
  3. Az unikódos módszer:

Jelenleg az OmegaT az egyszerű szöveges állományokat az alábbiak szerint kezeli: (ellenőrizheti, ha az Állományszűrők pontra kattint a Beállítások menüben. Kattintson a Szöveges állományok sorra, majd a Szerkesztés gombra.)

Persze .txt1, .txt2 és .utf8 kiterjesztésű állományok a valóságban nem léteznek. Az OmegaT ezek használatával segítséget nyújt egyes idegen nyelven írt állományok kezeléséhez.

Így például ha egy francia szöveget (pl. francia.txt) kell lefordítani egy japán számítógépen, és mivel az nagy valószínűséggel ISO-8859-1 kódolású, tudhatja, hogy ha a kiterjesztéséhez hozzáadja az 1-et (francia.txt1), az OmegaT megfelelő módon fogja ISO-8859-1 állományként kezelni ... Et voilà!


Jogi tudnivalók