Algoritmo di ordinamento
Un algoritmo di ordinamento è un algoritmo che viene utilizzato per posizionare gli elementi di un insieme secondo una sequenza stabilita da una relazione d'ordine, in modo che ogni elemento sia minore o maggiore di quello che lo segue. In assenza di altre specifiche, essa viene sempre considerata totale, cioè tale da rendere sempre possibile il confronto tra due elementi dell'insieme: le relazioni d'ordine parziale danno origine agli algoritmi di ordinamento topologico. A seconda del verso della relazione considerato, un ordinamento può essere ascendente o discendente.
Criteri di partizionamento
modificaPer analizzare e studiare gli algoritmi di ordinamento sono stati definiti differenti criteri di partizionamento, analizzati qui di seguito.
Ordinamento interno e ordinamento esterno
modificaSe il file da ordinare, o la struttura dati, può essere contenuto in memoria, il metodo viene detto interno. L'ordinamento di file residenti su disco o su nastro viene chiamato ordinamento esterno: la differenza principale tra i due tipi di ordinamento sta nel fatto che mentre nel primo è possibile accedere direttamente a un record, nel secondo i record devono essere indirizzati in modo sequenziale o al più per grandi blocchi.
Ordinamento per confronti-scambi e digitale
modificaA seconda del tipo di operazione che viene effettuata, si hanno due differenti tipi di ordinamento: l'ordinamento che effettua confronti e scambi ( ) e l'algoritmo digitale che accede all'informazione tramite un gruppo di bit alla volta.
Ordinamento adattivo
modificaSolitamente un algoritmo di ordinamento sfrutta operazioni di confronto e scambio. Se tali operazioni vengono svolte in modo indipendente dai dati di input l'algoritmo viene definito non adattivo. Mentre se un metodo di ordinamento esegue diverse sequenze di operazioni in funzione del risultato dei confronti si ha un algoritmo adattivo.
Stabilità di un algoritmo
modificaUn metodo di ordinamento si dice stabile se preserva l'ordine relativo dei dati con chiavi uguali all'interno del file da ordinare. Ad esempio se si ordina per anno di corso una lista di studenti già ordinata alfabeticamente un metodo stabile produce una lista in cui gli alunni dello stesso anno sono ancora in ordine alfabetico mentre un ordinamento instabile probabilmente produrrà una lista senza più alcuna traccia del precedente ordinamento.
La stabilità può essere forzata aggiungendo prima dell'ordinamento un piccolo indice a ciascuna chiave o allungando in qualche altro modo le chiavi sulle quali operare, in modo da renderle univoche preservando l'informazione sulla posizione relativa degli elementi.
Algoritmi in place
modificaUn algoritmo si dice algoritmo in place quando non crea una copia dell'input per raggiungere l'obiettivo, l'ordinamento in questo caso. Pertanto un algoritmo in place risparmia memoria rispetto ad un algoritmo non in place. Si noti infatti che, malgrado le considerazioni fatte sulla complessità abbiano senso in generale, hanno una rilevanza decisiva sui grandi numeri. Allo stesso modo della proprietà di essere o meno in place.
Relazioni d'ordine e chiavi
modificaLa relazione d'ordine che intercorre tra gli elementi dell'insieme può essere:
- quella naturale (se esiste) per l'insieme preso in considerazione (ad esempio la relazione di per sottoinsiemi dei numeri naturali)
- una relazione definita dalle necessità dell'applicazione.
È frequente il caso in cui l'algoritmo di ordinamento non opera direttamente sui dati di interesse, ma su un diverso insieme di dati che sono in collegamento biunivoco con quello dei dati di interesse: questo è detto l'insieme delle chiavi. Nel caso frequente in cui i dati sono costituiti da record, le chiavi sono spesso costituite dalla combinazione di uno o più campi del record stesso (questo avviene regolarmente nei database relazionali). L'obiettivo dei metodi di ordinamento consiste nel riorganizzare i record in modo tale che le loro chiavi siano disposte secondo un ordine ben definito (di norma in ordine numerico o alfabetico). Le specifiche caratteristiche delle chiavi e dei record possono variare notevolmente da un'applicazione all'altra. La nozione astratta di ordinamento prescinde da tali caratteristiche.
Complessità degli algoritmi di ordinamento
modificaLa ricerca e l'ottimizzazione di algoritmi di ordinamento è molto importante per alcuni ambiti informatici e per queste classi di algoritmi sono stati dimostrati svariati teoremi che ne definiscono i limiti. Il più importante è il seguente:
- Teorema: La complessità temporale di un qualsiasi algoritmo di ordinamento per confronto è pari a , dove N è il numero di elementi da ordinare.
Questo teorema fissa il limite inferiore di complessità per gli algoritmi che si basano sul paragone di coppie di chiavi (per confronto). Nulla è noto su altri algoritmi di ordinamento, nemmeno quali possano essere. Sono stati ipotizzati (ma non prodotti) algoritmi di ordinamento totalmente quantistico, che potrebbero avere un più basso limite inferiore di complessità.
Dimostrazione
modificaSi vuole dimostrare che in un algoritmo confronti e scambi la complessità è . Data in input una sequenza di n elementi, l'azione dell'algoritmo si può rappresentare come un albero binario, per ogni sequenza di ingresso ci sarà un cammino all'interno dell'albero, questo perché si ha una permutazione delle sequenze, infatti il numero di permutazioni possibili su n elementi sono combinazioni che corrispondono al numero di foglie dell'albero.
Date due permutazioni distinte esse identificano diversi cammini all'interno dell'albero. è il numero di foglie nell'albero di decisione dove n è il numero di elementi da ordinare. Date foglie ed essendo l'albero binario l'altezza dell'albero sarà:
L'altezza dell'albero corrisponde al numero di confronti, elemento indicativo del tempo di esecuzione dell'algoritmo. Nel caso peggiore, ossia quando si arriva al fondo dell'albero, si avrà una complessità pari a .
Per ultimare la dimostrazione si utilizza la formula di Stirling sull'approssimazione di .
numero di confronti
che a livello asintotico corrisponde a .
Albero di copertura
modificaOgni operazione dell'algoritmo di ordinamento può essere analizzata tramite un albero binario di copertura. Per ordinare una sequenza di n elementi bisognerà effettuare un numero di operazioni pari all'altezza minima di un albero binario con k foglie:
Elenco degli algoritmi di ordinamento
modificaVi sono varie classi di algoritmi di ordinamento, i più noti ed utilizzati sono gli algoritmi di ordinamento per confronto (comparison sort algorithms), ma esistono altre classi caratterizzate da un tempo di esecuzione nel caso peggiore inferiore a O(nlogn).
Nella tabella seguente sono elencati alcuni algoritmi di ordinamento, riportandone la complessità al caso Migliore, Medio e Peggiore, la memoria aggiuntiva richiesta, e la stabilità. Si utilizzano due convenzioni nella tabella: gli algoritmi sono implementati su array di chiavi intere; la complessità computazionale degli algoritmi di ordinamento per confronti è derivante unicamente dal numero di confronti effettuati.
Nome | Migliore | Medio | Peggiore | Memoria | Stabile | In place | Note |
---|---|---|---|---|---|---|---|
Avl sort | — | — | — | — | — | — | — |
Bubble sort | Θ(n) | Θ(n2) | Θ(n2) | Θ(1) | Sì | Sì | Algoritmo per confronto tramite scambio di elementi |
B sort | — | — | — | — | — | — | — |
B-Tree sort | — | — | — | — | — | — | — |
Bitonic sort | O(log2n) | O(log2n) | O(log2n) | O(nlog2n) | — | — | A. parallelo non basato sul confronto |
Bogosort | O(n) | O(n·n!) | ∞ | Θ(1) | No | Sì | A. non basato sul confronto |
Btm | — | — | — | — | Sì | No | — |
Gnome sort | O(n) | O(n2) | O(n2) | Θ(1) | Si | Si | A. per confronto tramite scambi, miglioria di Insertion sort |
Heap sort | O(nlogn) | O(nlogn) | O(nlogn) | Θ(1) | No | Sì | A. per confronto tramite selezione, ottimale |
Insertion sort | Θ(n) | Θ(n2) | Θ(n2) | Θ(1) | Sì | Sì | A. per confronto tramite inserimento |
Counting sort | Θ(n+k) | Θ(n+k) | Θ(n+k) | O(k) | Sì | No | A. non basato sul confronto. k=max(A)-min(A)+1, dove A è l'array.
la versione in-place non è stabile, quella non in-place usa uno spazio O(n+k) ed è stabile. |
Intro sort | O(nlogn) | O(nlogn) | O(nlogn) | O(logn) | No | Si | A. per confronto ibrido, derivato da Heap sort e Quick sort |
Jump sort | — | — | — | — | — | — | — |
Merge sort | Θ(nlogn) | Θ(nlogn) | Θ(nlogn) | O(n) | Sì | No | A. per confronto tramite unione di componenti, ottimale e facile da parallelizzare |
Ms sort | — | — | — | — | — | — | — |
Oet sort | — | — | — | — | — | — | — |
Patient sort | O(nlogn) | O(nlogn) | O(nlogn) | O(n) | Sì | No | A. per confronto tramite partizionamento e selezione, ottimale e facile da parallelizzare |
Partition sort | O(nlogn) | O(nlogn) | O(n2) | O(log n) | No | — | — |
Plasel sort | — | — | — | — | — | — | — |
Quicksort | Θ(nlogn) | Θ(nlogn) | O(n2) | O(n) | No | Sì | A. per confronto tramite partizionamento. Le sue varianti possono: essere stabili, usare solo O(logn) di memoria (v. di Sedgewick), costare solo O(nlogn) usando Quickselect, usare più pivot, ecc. |
Radix sort | O(n·k/s) | O(n·k/s) | O(n·k/s) | O(n) | Sì | No | A. non basato sul confronto. k è il numero medio di cifre delle chiavi da ordinare |
Ripple sort | — | — | — | — | — | — | — |
Selection sort | Θ(n2) | Θ(n2) | Θ(n2) | Θ(1) | No | Sì | A. per confronto tramite selezione di elementi |
Several unique sort | — | — | — | — | — | — | — |
Shaker sort | O(n) | Varia | O(n2) | Θ(1) | Sì | Sì | A. per confronto tramite scambio di elementi, miglioria del Bubble sort. Noto anche come Cocktail sort |
Shear sort | — | — | O(nlogn) | — | — | — | A. per confronto di array bidimensionali |
Shell sort | O(n) | O(n1,5) / O(nlog2n) | O(nlog2n) | Θ(1) | No | Sì | A. per confronto, la sua complessità dipende dalla sequenza di gap utilizzata. |
Simple sort | — | — | — | — | — | — | |
Sleep sort | O(n) | — | O(k) | Θ(1) | Si | Si | A. non basato sul confronto. k è uguale a max(A), dove A è l'array. L'algoritmo necessità di un processo parallelo indipendente per ogni elemento dell'array. |
Smooth sort | O(n) | O(nlogn) | O(nlogn) | O(n) | — | — | A. per confronto tramite unione di componenti, miglioria dell'Heap sort |
Sunrise sort | O(nlogn) | O(nlogn) | O(nlogn) | O(n) | No | — | — |
Trippel sort | — | — | O(n~ log(3)/log(1.5)) | — | No | Sì | A. per confronto tramite partizionamento, di tipo ricorsivo. Le sue varianti possono essere stabili |
Bibliografia
modifica- (EN) D. E. Knuth, The Art of Computer Programming, Volume 3: Sorting and Searching.
Altri progetti
modifica- Wikiversità contiene risorse sugli algoritmi di ordinamento
- Wikimedia Commons contiene immagini o altri file sugli algoritmi di ordinamento
Collegamenti esterni
modifica- algoritmo di ordinamento, in Enciclopedia della Matematica, Istituto dell'Enciclopedia Italiana, 2013.
- (EN) Opere riguardanti sorting algorithm, su Open Library, Internet Archive.
- (EN) Eric W. Weisstein, Sorting, su MathWorld, Wolfram Research.
- Una breve guida agli algoritmi di ordinamento e ricerca
- (EN) Spiegazione e analisi di molti algoritmi, su iti.fh-flensburg.de. URL consultato il 27 novembre 2005 (archiviato dall'url originale il 13 dicembre 2012).
- (EN) Applet Java che mostra graficamente il funzionamento di alcuni algoritmi, su cs.oswego.edu.
- (EN) Corso sugli algoritmi reso gratuitamente disponibile on line dal MIT. Varie lezioni trattano di algoritmi di ordinamento, su ocw.mit.edu.