Formato documentale

formato di file usato per documenti

In informatica, un formato documentale è un formato di file per la rappresentazione di documenti digitali su supporti di memorizzazione. Esistono numerosi formati documentali, la maggior parte dei quali sono incompatibili fra loro.

Storia modifica

Descrizione modifica

Secondo la scienza dell'informazione, la parola documento si riferisce alla combinazione di un supporto fisico e informazioni (che sono rilevanti per l'utente). Se si esamina un generico documento digitale possiamo trovare quattro tipi di informazioni o componenti: il contenuto, la struttura, lo stile di presentazione e i metadati. In genere queste informazioni vengono confuse in unico file: si provi ad aprire ad esempio un file .doc con un editor di testo. Il linguaggio XML rappresenta una soluzione a questo problema: esso infatti consente di tenere separate queste componenti. Anche il file XSV rappresenta un'altra ottima soluzione in quanto perfettamente leggibile.

Contenuto modifica

Il contenuto è generalmente costituito dalle parole che compongono il documento; un documento elettronico può contenere dati di diversa natura: testo, immagine, audio e video.

Struttura modifica

La struttura di un documento è la sua componente logica: è l'informazione che indica come suddividere il contenuto in elementi, eventualmente suddivisi in sottoelementi e così via in una sorta di gerarchia ad albero. Ad esempio, questo documento ha un titolo e una successione di sezioni aperte a loro volta da un titolo. Inoltre possiamo avere che il contenuto delle sezioni è suddiviso in paragrafi, sottoparagrafi, liste, ecc.

Stile modifica

Lo stile è l'informazione legata a come rendere il documento su un particolare dispositivo. In genere i documenti sono stati pensati principalmente per essere "resi" su carta, ovvero "stampati" o su monitor. In questo caso si dice che sono visualizzati. Ma possiamo anche pensare ad altri modi di rappresentare un documento: ad esempio su un dispositivo per ipovedenti. In questo caso il documento viene "letto". Avremo quindi bisogno di altre informazioni di stile per istruire un sintetizzatore vocale affinché possa convertire contenuto e struttura in segnale audio.

Metadati modifica

Se andiamo a esaminare da vicino le informazioni contenute in un file elettronico, troviamo essenzialmente i tre tipi di informazioni succitati. In realtà esiste anche un quarto tipo di informazione di cui molte volte ignoriamo l'esistenza. Si tratta di informazioni "bibliografiche" (come il nome di chi ha composto il documento ovvero dell'autore, le date di creazione e di ultima modifica, il nome del programma usato per comporre il documento), oppure informazioni per descrivere e rendere più facile la ricerca del documento stesso. Questo tipo di informazioni vengono genericamente detta "metainformazioni" ovvero informazioni sulle informazioni. Per evitare fraintendimenti, si precisa che la suddivisione tra informazione (contenuto, struttura e stile) e metainformazione non è affatto netta e precisa: quello che per alcuni è informazione, per altri viene visto come metainformazione. Ad esempio, il titolo di un libro può essere classificato in entrambe le maniere.

Formati documentali comuni modifica

  Le singole voci sono elencate nella Categoria:Formati di file.

Quella che segue è una raccolta non esaustiva dei principali formati documentali di uso comune. La maggior parte è orientata alla rappresentazione di "documenti da ufficio", ed è implementata dalle suite di software per ufficio.

Voci correlate modifica