Formato tradizionale di ESL

Per compatibilità all'indietro, gretl può elaborare anche file di dati nel formato "tradizionale" ereditato dal programma ESL di Ramanathan. In questo formato (che era quello predefinito nelle versioni di gretl precedenti alla 0.98) un dataset è rappresentato da due file: uno contiene i dati veri e propri, l'altro contiene la descrizione dei dati e le modalità per la loro lettura. Per essere più specifici:

  1. Dati veri e propri: una matrice rettangolare di numeri separati da spazio vuoto. Ogni colonna rappresenta una variabile, ogni riga un'osservazione per ognuna delle variabili (come in un foglio elettronico). Le colonne dei dati possono essere separate da spazi o caratteri tab. Il nome del file deve avere l'estensione .gdt e il file di solito è di tipo ASCII (testo semplice), ma può essere anche compresso con gzip, per occupare meno spazio su disco. È possibile inserire commenti in un file di dati: se una riga comincia con un carattere cancelletto (#), l'intera riga viene ignorata (questo comportamento è coerente con i file di dati di gnuplot e di octave).

  2. Descrizione: il file di dati deve essere accompagnato da un file di descrizioni, che ha lo stesso nome di base del file di dati, ma l'estensione .hdr. Questo file contiene, nell'ordine:

    • (Opzionale) commenti sui dati, introdotti dalla stringa di apertura (* e conclusi dalla stringa *); ognuna di queste stringhe deve essere presente da sola su una riga.

    • (Richiesta) lista dei nomi delle variabili presenti nel file, separati da spazio bianco. I nomi sono limitati a 8 caratteri, devono iniziare con una lettera e possono contenere solo caratteri alfanumerici e il carattere trattino basso, _. La lista può continuare su più righe e deve essere chiusa da un punto e virgola ;.

    • (Richiesta) riga osservazioni, nel formato 1 1 85. Il primo elemento indica la frequenza dei dati (1 per dati non datati o annuali, 4 per trimestrali, 12 per mensili). Gli altri due elementi indicano le osservazioni iniziale e finale: di solito questi saranno pari a 1 e al numero delle osservazioni, per i dati non datati. Per le serie storiche, è possibile usare date nella forma 1959.1 (trimestrale, una cifra dopo il punto) o 1967.03 (mensile, due cifre dopo il punto). Si veda il Capitolo 7 per l'uso speciale di questa riga nel caso dei dati panel.

    • La parola chiave BYOBS.

Ecco un esempio di un file di descrizione dei dati ben scritto.

 
	  (* 
	  DATA9-6: 
	  Dati su log(moneta), log(reddito) e tasso di interesse USA. 
	  Fonte: Stock and Watson (1993) Econometrica 
	  (dati grezzi) Il periodo è 1900-1989 (dati annuali). 
	  Dati composti da Graham Elliott. 
	  *) 
	  lmoneta lreddito tassint ; 
	  1 1900 1989 BYOBS
Il corrispondente file di dati contiene tre colonne di dati, ognuna con 90 osservazioni.

Ci sono altre tre caratteristiche del formato dati "tradizionale" degne di nota.

  1. Se la parola chiave BYOBS è sostituita da BYVAR ed è seguita dalla parola chiave BINARY, significa che il corrispondente file di dati è in formato binario. Questo tipo di file di dati può essere scritto da gretlcli usando il comando store con l'opzione -s (precisione singola) o l'opzione -o (precisione doppia).

  2. Se BYOBS è seguita dalla parola chiave MARKERS, gretl si aspetta un file di dati in cui la prima colonna contiene stringhe (lunghe al massimo 8 caratteri) usate per identificare le osservazioni. Queste possono essere utili nel caso dei dati di tipo cross-section in cui le unità di osservazione sono identificabili: regioni, stati, città ecc. Un altro caso è quello delle serie storiche irregolari, come ad esempio i dati giornalieri delle quotazioni azionarie, in cui mancano i giorni in cui non avvengono contrattazioni: in questo caso, le osservazioni possono essere marcate con una stringa che rappresenta la data, come ad esempio 10/01/98 (si ricordi il limite di 8 caratteri). Si noti che le opzioni BINARY e MARKERS sono mutualmente esclusive, e si noti anche che i "marcatori" non sono considerati come una variabile: questa colonna non compare nell'elenco delle variabili nel file di descrizione dei dati.

  3. Se esiste un file con lo stesso nome di base del file di dati e di quello delle descrizioni, ma con l'estensione .lbl, esso viene letto e usato per riempire le etichette descrittive per le serie di dati. Il formato del file di etichette è semplice: ogni riga contiene il nome di una variabile (indicata nel file di descrizione) seguito da uno o più spazi, seguito dall'etichetta descrittiva. Ecco un esempio: prezzo Indice dei prezzi delle auto nuove, anno base 1982

Se si vuole salvare i dati nel formato tradizionale, occorre usare l'opzione -t con il comando store, nella versione a riga di comando del programma o nella finestra del terminale della versione grafica del programma.