Testu hutsarekin lanean

Edukiak

Testu hutsa OmegaT-n

Testu hutseko fitxategiek testu-informazioa besterik ez dute gordetzen. Fitxategi hauek ez daukate zein hizkuntzatako testua gordetzen duten adierazteko modu argirik. Asko sinplifikatuz, horrek esan nahi du ordenagailuak erabakitzen duela fitxategiaren edukia ordenagailuaren hizkuntza berean dagoela.

Testu hutseko fitxategiek, gehienetan, .txt luzapenarekin amaitzen den izena daukate.

Bistaratze nahasiak?

Errusiarra bazara, seguraski zure ordenagailuak errusieraz egiten du lan: menuak errusieraz daude, irekitzen dituzun fitxategiak errusierazkoak dira, etab. Kasu gehienetan, ordenagailuak uste zuzena dauka fitxategi gehienen edukiari buruz: errusierazko testuak gordetzen dituzte eta, beraz, pantailan ezin dira errusierazko karaktereak besterik erakutsi.

Haatik, japonieratik errusierara itzultzen duzun itzultzailea bazara, eta testu hutsekoak diren japonierazko fitxategiak jasotzen badituzu, ordenagailuak errusiera daukaten fitxategiak direla uste izango du. Izan ere, fitxategiak berak ez dauka informaziorik barruan gorderik daukan testuaren hizkuntzari buruz.

Japonierazko fitxategiaren edukia ondokoa izan daiteke:

   とは、コンピュータを利用した翻訳ツールです。

Baina zure testu-editoreak beste modu honetan erakutsi dezake:

   В∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≈ВЈБB

Edukiak errusieraz daudela uste duelako... Baina ez da errusiera. Errusieraz erakutsitako japonierazko karaktereak dira.

OmegaT ez da desberdina. OmegaT-k uste du testu hutseko fitxategien edukia automatikoki ordenagailuak lehenetsitako moduan erakutsi daitekeela. Horrek emaitza egokia ematen du ordenagailuak fratsesez lan egiten badu eta ingelesezko fitxategiak jasotzen badituzu, edo ordenagailua alemanierazkoa bada eta italierazko fitxategiak jasotzen badituzu.

Karaktere-sortak eta kodeketak

Zergatik da emaitza ona ingelesa eta frantsesa nahastean eta okerra errusiera eta japoniera nahastean? Ingelesak eta frantsesak karaktere-sorta bera erabiltzen dutelako. Bere izena, Latin-1 edo bere aldaeretako bat.

Duela gutxira arte, errusierak eta japonierak ez zuten karaktere-sortarik partekatzen. Errusierazko karaktere-sorta gehienek ez dute japoniera kontuan hartzen, ezta alderantziz ere. Emaitza goian erakutsi dena da.

Bezero japoniarrak japonierazko ordenagailu batekin egiten du lan eta japoniera daukaten testu-fitxategiak sortzen ditu. Bezeroaren ordenagailuak hautatutako karaktere-sorta sistema eragilearen eta beste hainbat ezarpenen araberakoa izango da, baina seguraski errusierazko ordenagailuak gaizki interpretatuko du jatorrizko ordenagailuaren (japonierazko) karaktere-sorta hautatua.

Karaktere-sorta jakin bat darabilen testu-informazioa nola transmititzen den (alegia, fitxategian nola dagoen idatzita, ordenagailuak interpretatu eta erakutsi ahal dezan), kodeketaren araberakoa da. Ordenagailuak fitxategia irakurtzen duenean, bere kodeketaren arabera "dekodetzen" du eta karaktere-sortaren arabera erakusten du. Oro har, kodeketa bati karaktere-sorta bat dagokio...

OmegaT-ren konponbidea

OmegaT-k hiru bide dauzka arazo hau konpontzeko.

  1. Bide zakarra:
  2. Bide selektiboa:
  3. "Unicode" bidea:

Egun, OmegaT-k ondoren azalduko den moduan ulertzen ditu testu hutseko fitxategiak: (portaera hau egiaztatzeko, aski duzu Fitxategi-iragazkiak aukera hautatzea Aukerak menuan. Klikatu Testu-fitxategiak lerroa eta gero Editatu... botoia.)

Noski, .txt1, .txt2, eta .utf8 fitxategi-luzapenak ez dira benetan existitzen. OmegaT-k zerrenda labur bat prestatu du zenbait fitxategi arrotz errazago kudeatu ahal ditzazun.

Beraz, orain, frantsesezko fitxategi bat (esaterako, frantsesez.txt) badaukazu eta japonierazko ordenagailu batean itzuli behar baduzu, fitxategi hori seguraski ISO-8859-1 kodeketa erabiliz sortu denez, badakizu bere izenari atzean 1 zenbakia erantsiz (frantsesez.txt1) OmegaT-k bere edukiak ISO-8859-1 motakoak direla ulertuko duela. Et voilà!


Legezko oharrak