Coordinate parallele

Le coordinate parallele sono un sistema comunemente utilizzato per visualizzare spazi n-dimensionali e analizzare dati multivariati. Per mostrare un insieme di punti in uno spazio a n dimensioni, vengono disegnate n linee parallele, solitamente verticali e poste a uguale distanza l'una dall'altra. Un punto nello spazio n-dimensionale è rappresentato come una linea spezzata con i vertici sugli assi paralleli. La posizione del vertice sull'i-esimo asse corrisponde all'i-esima coordinata del punto.

Storia

Le coordinate parallele furono inventate da Maurice d'Ocagne nel 1885 ^[1] e successivamente riscoperte e diffuse da Al Inselberg ^[2] nel 1959. Successivamente vennero sistematicamente sviluppate e utilizzate come sistema di coordinate a partire dal 1977. Alcune importanti applicazioni sono, ad esempio, negli algoritmi di Collision Avoidance per il traffico aereo, nel Data Mining e più recentemente in sistemi di Intrusion Detection. È importante ricordare come molte di queste applicazioni delle coordinate parallele e il loro successo sono dovute all'articolo "Hyperdimensional Data Analysis Using Parallel Coordinates" (Wegman 1990).

Considerazioni Statistiche

Nei casi in cui le coordinate parallele siano usate per la visualizzazione di dati statistici, particolare importanza va posta a tre fattori: l'ordine degli assi, la loro rotazione e la scala utilizzata.

L'ordine degli assi è fondamentale per identificare le caratteristiche principali dei dati, e solitamente, nell'analisi dei dati, vengono provate più soluzioni prima di raggiungere un risultato ottimale. Alcuni autori hanno descritto delle euristiche per l'ordinamento degli assi, in grado di svolgere questo compito ^[3].

La necessità di ridimensionare gli assi nasce dal fatto che il grafico è basato sull'interpolazione (combinazione lineare) di coppie consecutive di variabili^[4]. Perciò le variabili devono essere in una scala comune ed esistono molti approcci diversi per trovare la rappresentazione ideale, che sono considerati come parte del processo di preparazione dei dati e possono rivelare diverse visualizzazioni informative.

Generalizzazione delle Coordinate Parallele

Una generalizzazione delle Coordinate Parallele (GPCP) è stata proposta da (Moustafa e Wegman 2002) ^[5]. Seguendo questo approccio, i dati vengono trasformati prima di essere rappresentati sul grafico. Se la funzione di interpolazione è una Lagrangiana definita per casi, si ottiene un grafico a Coordinate Parallele tradizionale, altrimenti, se vengono usate delle splines come funzione di interpolazione si ottiene lo smooth parallel coordinates plot (SPCP). In questo grafico ogni osservazione è rappresentata come una curva parametrica, continua e ortogonale ad ogni asse parallelo^[4].

Note

^ d'Ocagne, Maurice, Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles, Paris: Gauthier-Villars, 1885.
^ Alfred Inselberg, The Plane with Parallel Coordinates, in Visual Computer, vol. 1, n. 4, 1985, pp. pages 69–91, DOI:10.1007/BF01898350.
^ Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets (pages 3-4)
^ ^a ^b . R. Moustafa, E. Wegman, Multivariate continuous data - Parallel Coordinates, in In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer, 2006, pp. 143–156.
^ R. Moustafa, E. Wegman, On Some Generalization to Parallel Coordinate Plot, in Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germany, 2002.

Collegamenti esterni

Alfred Inselberg's Homepage, with Visual Tutorial, History, Selected Publications and Applications
Parallel Coordinates: Visual Multidimensional Geometry and Its Applications^{[collegamento interrotto]} by Alfred Inselberg, Springer, 2009.
An Investigation of Methods for Visualising Highly Multivariate Datasets by C.Brunsdon, A.S.Fotheringham & M.E.Charlton, University of Newcastle, Regno Unito
Parallel coordinates plot in GGobi, su ggobi.org. URL consultato il 26 gennaio 2011 (archiviato dall'url originale il 24 dicembre 2013).
Using Curves to Enhance Parallel Coordinate Visualisations by Martin Graham & Jessie Kennedy, Napier University, Edimburgo, Regno Unito
On Some Generalization of Parallel Coordinate Plots by Rida E. Moustafa and Edward J. Wegman (2002), George Mason University, Fairfax, VA
picviz — the graphviz of parallel coordinates Archiviato il 10 febbraio 2011 in Internet Archive. disponibile sotto GNU GPL v3 - implementato in C, con Python binding usati per la GUI.
Clustergram: A graph for visualizing cluster analyses based on the Parallel Coordinates of each observations cluster mean over the number of potential clusters (implemented in R).
XDAT - a free GPL JAVA-based software for plotting parallel coordinate.

[pc-first-1] 'Ocagne, Maurice, Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles, Paris: Gauthier-Villars, 1885.

[pc-2] Alfred Inselberg, The Plane with Parallel Coordinates, in Visual Computer, vol. 1, n. 4, 1985, pp. pages 69–91, DOI:10.1007/BF01898350.

[3] Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets (pages 3-4)

[Gpc2-4] . R. Moustafa, E. Wegman, Multivariate continuous data - Parallel Coordinates, in In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer, 2006, pp. 143–156.

[Gpc1-5] R. Moustafa, E. Wegman, On Some Generalization to Parallel Coordinate Plot, in Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germany, 2002.

[1]

[2]

[3]

[4]

[5]