Lavorazione di testi formattati

Sommario

Testo formattato in OmegaT

Le informazioni di formattazione che si trovano nel file di partenza, di solito, dovrebbero anche essere trasferite al file di arrivo. OmegaT visualizza le informazioni di formattazione all'interno dei segmenti dei file riconosciuti (attualmente DocBook, HTML, XHTML, Open Document e OpenOffice.org) sotto forma di tag. I tag non vengono di solito presi in considerazione nelle operazioni di confronto della similitudine fra due stringhe per l'analisi delle corrispondenze parziali. I tag che appaiono all'interno del segmento tradotto saranno presenti anche all'interno del documento finale tradotto.

Assegnazione di nomi ai tag

I tag sono composti da uno a tre caratteri e da un numero. I numeri identificativi consentono di raggruppare quei tag che hanno fra di loro una corrispondenza e differenziano i tag che possono essere associati allo stesso carattere rapido, anche se, in effetti, sono diversi.

I caratteri possono, o meno, riflettere il valore della formattazione rappresentato dal tag stesso (per esempio: neretto, corsivo ecc.)

Numerazione dei tag

I tag sono numerati, in modo incrementale, in base al gruppo di tag.

Ciò che qui viene chiamato “gruppo di tag” si riferisce sia a un tag singolo (come nel caso di <br1>), a se stante, sia a 2 tag, sotto forma di coppia (come nel caso di <f3> e </f3>).

All'interno di un segmento, il primo gruppo (in coppia o singolo) è associato al numero 0, il secondo al numero 1 ecc.

Il primo esempio qui sotto riportato è composto da 3 gruppi di tag (una coppia, un singolo e, quindi, un'altra coppia) mentre il secondo esempio ne contiene solo uno (una coppia).

Tag in coppia e tag singoli

I tag sono sempre singoli o in coppia.

I tag singoli indicano le informazioni di formattazione che non coinvolgono il testo circostante (per esempio, inserimento di spazi aggiuntivi o di interruzioni di riga).

   <segmento 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><fine segmento>

<br1> è un tag singolo e non influisce sul testo circostante.

I tag accoppiati, di solito, indicano informazioni di stile che verranno applicate al testo contenuto tra il tag di apertura e quello di chiusura della coppia. Qualsiasi cosa accada a una coppia, il tag di apertura dovrà sempre precedere quello di chiusura.

   <segmento 3167>File di log (<f1>log.txt</f1>) per la registrazione delle operazioni e degli errori.<fine segmento>

<f1> e </f1> sono tag accoppiati e influiscono su log.txt.

Tag e segmentazione della frase

OmegaT, prima di procedere con la segmentazione delle frasi, crea i propri tag. In base alle regole di segmentazione, i tag potrebbero comparire come se non venissero rispettate le regole di numerazione e di raggruppamento qui sopra espresse.

   <segmento 1554> <c0>Prima: \. Dopo: \s</c0>
<b2>Nota:</b2>
“\.” corrisponde al carattere del punto (“.”)<br3> “\s” corrisponde a un carattere di spazio bianco<fine segmento>

Qui non sembra che vi siano problemi. Ora, se a questo segmento vengono applicate le regole predefinite della segmentazione (ovvero il comportamento predefinito di OmegaT) otterremo il seguente risultato:

   <segmento 1990> <c0>Prima: \. <fine segmento>

   <segmento 1991> Dopo: \s</c0><br1> <fine segmento>

   <segmento 1992> <b2>Nota:</b2> "\." corrisponde al carattere del punto (“.”)<br3><fine segmento>

   <segmento 1993> “\s” corrisponde a un carattere di spazio bianco<fine segmento>

(Le regole di segmentazione adottate sono: segmento dopo un punto seguito da uno spazio e segmento dopo un tag di interruzione di riga.)

Qui, si può notare che i singoli segmenti non rispettano le regole di accoppiamento e di numerazione: <cO> e </cO> dovrebbero essere accoppiati sullo stesso segmento ma, in effetti, vengono separati dalle regole di segmentazione.

Vi sono alcune occasioni nelle quali potrebbero sorgere problemi nel testo finale tradotto, ovvero quando i tag devono essere spostati all'interno del documento di arrivo per riflettere l'ordine delle parole della lingua di destinazione (si veda, più sotto, la sezione Operazioni sui tag).

Operazioni sui tag

Quando si agisce su tag è necessario prestare una particolare attenzione. Se vengono accidentalmente cambiati, la formattazione del documento finale potrebbe presentare problemi. Nello scenario peggiore, un errore potrebbe anche portare alla mancata apertura del file, e ciò è particolarmente vero per quanto riguarda i file OpenOffice.org.

Duplicazione di un gruppo di tag

Per duplicare gruppi di tag sarà sufficiente copiarli nella posizione finale corretta. Si tenga a mente che in un gruppo accoppiato, il tag di apertura deve sempre precedere quello di chiusura.

La formattazione associata al gruppo duplicato verrà applicata alla sezione nella quale si è effettuata la duplicazione.

Esempio:

   <segmento 0001><f0>This formatting</f0> is going to be duplicated here.<fine segmento>

Dopo aver effettuato la duplicazione si otterrà:

   <segmento 0001><f0>Questa formattazione</f0> è stata <f0>duplicata qui</f0>.<fine segmento>

Eliminazione di un gruppo di tag

Per eliminare gruppi di tag sarà sufficiente cancellarli dall'interno del segmento. Si tenga però presente che, per eliminare tutte le tracce della formattazione, sarà necessario eliminare sia il tag di apertura sia quello di chiusura; in caso contrario il file tradotto potrebbe risultare danneggiato e potrebbe anche non essere possibile aprirlo.

L'eliminazione di un gruppo di tag rimuoverà dal file finale tradotto tutte le informazioni di formattazione correlate.

Esempio:

   <segmento 0001><f0>This formatting</f0> is going to be deleted.<fine segmento>

Dopo l'eliminazione si otterrà:

   <segmento 0001>Questa formattazione è stata eliminata.<fine segmento>

Modifica dell'ordine di un gruppo di tag

Per modificare l'ordine di un gruppo di tag in modo da riflettere nella traduzione la corretta struttura linguistica sequenziale delle parole, sarà sufficiente inserire il gruppo di tag dove questo dovrebbe correttamente apparire all'interno del documento finale tradotto.

La formattazione verrà applicata alla parte corrispondente.

Esempio:

   <segmento 0001><f0>The formatting here</f0> and <f1>the formatting here</f1> are going to be moved around.<fine segmento>

Dopo la modifica dell'ordine si otterrà:

   <segmento 0001><f1>Questa formattazione</f1> e <f0>questa formattazione</f0> sono state ribaltate.<fine segmento>

Annidamento di un gruppo di tag

La modifica dell'ordine del gruppo di tag potrebbe anche portare all'annidamento di un gruppo di tag all'interno di un altro gruppo di tag. Si tratta di una condizione possibile fintanto che il gruppo di tag esterno comprende completamente il gruppo di tag annidato. Quando deve effettuare un annidamento è necessario prestare un'attenzione particolare, specialmente nelle occasioni in cui le coppie di tag non vengono completamente spostate all'interno di un gruppo di contenimento; in questo caso il documento finale potrebbe risultare danneggiato e potrebbe anche non essere possibile aprirlo.

La parte annidata dovrà prevedere la presenza di entrambi i tag di formattazione.

Esempio:

   <segmento 0001><f0>The formatting</f0> <f1>here</f1> is going to be nested.<fine segmento>

Dopo l'annidamento si otterrà:

   <segmento 0001><f0><f1>Questa</f1> formattazione</f0> è stata annidata nel primo gruppo di tag di formattazione.<fine segmento>

Sovrapposizione di un gruppo di tag

La sovrapposizione è il risultato della scorretta manipolazione della coppie di tag e porterà certamente a un danneggiamento della formattazione e, a volte, all'impossibilità di aprire il file tradotto.

Esempio:

   <segmento 0001><f0>The formatting</f0> <f1>here</f1> is going to be messed up.<fine segmento>

Dopo la manipolazione non corretta si potrebbe ottenere:

   <segmento 0001><f0>the formatting <f1>here</f0> </f1>is very messed up now.<fine segmento>

Convalida di un gruppo di tag

La funzione di convalida dei tag (Convalida i tag) rileva i tag che sono stati modificati (sia in modo deliberato sia accidentalmente), e indica i segmenti coinvolti. L'uso di questa funzione apre una finestra di dialogo nella quale vengono riportati tutti i tag sospetti o scorretti all'interno di un documento.

Questa funzione potrebbe risultare particolarmente utile per rilevare gli errori presenti all'interno del testo tradotto contenente tag. Spesso questo è un problema per i file OpenDocument od OpenOffice.org in quanto potrebbe accadere che non sia possibile aprirli a causa di problemi correlati ai tag generati nel corso del processo di traduzione. Per risolvere il problema si può correggere gli errori dei tag e ricreare di nuovo il documento finale tradotto.

Consigli per la gestione dei tag

I tag, di solito, rappresentano elementi di formattazione presenti nel testo originale. La semplicità della formattazione del testo originale contribuisce in modo sostanziale alla riduzione del numero dei tag. Quando è possibile, si dovrebbe prendere in considerazione l'uniformazione dei caratteri utilizzati, della loro dimensione, dei loro colori ecc. Ciò semplificherà il processo di traduzione e ridurrà la quantità di possibili errori nei tag.

Si consiglia di leggere la sezione Operazioni con i tag per capire come è possibile intervenire su questi elementi.

Si ricordi che se si ha difficoltà nella gestione dei tag e se la formattazione non ha un'importanza primaria per il lavoro che si sta eseguendo, si ha sempre la possibilità di rimuovere da un testo originale la maggior parte della formattazione, semplificando, in questo modo, il lavoro di traduzione.

Se si vogliono visualizzare i tag in OmegaT ma non si ha la necessità di conservarli all'interno del documento tradotto, si potrà anche evitare di inserirli nella versione finale del documento. In questo caso si consiglia di prestare ulteriore attenzione alle coppie di tag poiché la mancata eliminazione di un elemento della coppia potrebbe portare a una scorretta formattazione del documento e anche impedire ad OpenOffice.org di aprire il documento finale tradotto.

Poiché i tag fanno parte del testo, è possibile adottare regole di segmentazione in modo da creare segmenti che contengano un numero inferiore di tag. Si tratta, in questo caso, di una funzione di tipo avanzato e che non dovrebbe venire utilizzata dagli utenti principianti.

Importante

OmegaT non è ancora in grado di rilevare in modo completamente automatico gli errori di formattazione, pertanto non segnalerà eventuali errori o modifiche di formattazione applicate al documento finale per adattarlo alla lingua di destinazione. A volte, tuttavia, il file tradotto potrebbe apparire non corretto e, nel caso di file OpenDocument / OpenOffice.org, ciò potrebbe anche determinare l'impossibilità dell'apertura del file stesso.


Avvertenze legali