Coordinate parallele

Le coordinate parallele sono un sistema comunemente utilizzato per visualizzare spazi n-dimensionali e analizzare dati multivariati. Per mostrare un insieme di punti in uno spazio a n dimensioni, vengono disegnate n linee parallele, solitamente verticali e poste a uguale distanza l'una dall'altra. Un punto nello spazio n-dimensionale è rappresentato come una linea spezzata con i vertici sugli assi paralleli. La posizione del vertice sull'i-esimo asse corrisponde all'i-esima coordinata del punto.

Classificazione di un insieme di auto con grafico a coordinate parallele.

StoriaModifica

Le coordinate parallele furono inventate da Maurice d'Ocagne nel 1885 [1] e successivamente riscoperte e diffuse da Al Inselberg [2] nel 1959. Successivamente vennero sistematicamente sviluppate e utilizzate come sistema di coordinate a partire dal 1977. Alcune importanti applicazioni sono, ad esempio, negli algoritmi di Collision Avoidance per il traffico aereo, nel Data Mining e più recentemente in sistemi di Intrusion Detection. È importante ricordare come molte di queste applicazioni delle coordinate parallele e il loro successo sono dovute all'articolo "Hyperdimensional Data Analysis Using Parallel Coordinates" (Wegman 1990).

Considerazioni StatisticheModifica

Nei casi in cui le coordinate parallele siano usate per la visualizzazione di dati statistici, particolare importanza va posta a tre fattori: l'ordine degli assi, la loro rotazione e la scala utilizzata.

L'ordine degli assi è fondamentale per identificare le caratteristiche principali dei dati, e solitamente, nell'analisi dei dati, vengono provate più soluzioni prima di raggiungere un risultato ottimale. Alcuni autori hanno descritto delle euristiche per l'ordinamento degli assi, in grado di svolgere questo compito [3].

La necessità di ridimensionare gli assi nasce dal fatto che il grafico è basato sull'interpolazione (combinazione lineare) di coppie consecutive di variabili[4]. Perciò le variabili devono essere in una scala comune ed esistono molti approcci diversi per trovare la rappresentazione ideale, che sono considerati come parte del processo di preparazione dei dati e possono rivelare diverse visualizzazioni informative.

Generalizzazione delle Coordinate ParalleleModifica

Una generalizzazione delle Coordinate Parallele (GPCP) è stata proposta da (Moustafa e Wegman 2002) [5]. Seguendo questo approccio, i dati vengono trasformati prima di essere rappresentati sul grafico. Se la funzione di interpolazione è una Lagrangiana definita per casi, si ottiene un grafico a Coordinate Parallele tradizionale, altrimenti, se vengono usate delle splines come funzione di interpolazione si ottiene lo smooth parallel coordinates plot (SPCP). In questo grafico ogni osservazione è rappresentata come una curva parametrica, continua e ortogonale ad ogni asse parallelo[4].

NoteModifica

  1. ^ d'Ocagne, Maurice, Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles, Paris: Gauthier-Villars, 1885.
  2. ^ Alfred Inselberg, The Plane with Parallel Coordinates, in Visual Computer, vol. 1, n. 4, 1985, pp. pages 69–91, DOI:10.1007/BF01898350.
  3. ^ Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets (pages 3-4)
  4. ^ a b . R. Moustafa, E. Wegman, Multivariate continuous data - Parallel Coordinates, in In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer, 2006, pp. 143–156.
  5. ^ R. Moustafa, E. Wegman, On Some Generalization to Parallel Coordinate Plot, in Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germany, 2002.

Collegamenti esterniModifica