Versione delle 23:22, 27 gen 2012 modifica Tommaso Ferrara (discussione \| contributi) Utenti autoverificati 17 273 modifiche mNessun oggetto della modifica ← Differenza precedente		Versione delle 10:18, 26 lug 2012 modifica annulla ZimbuBot (discussione \| contributi) Bot 210 779 modifiche m WPCleaner v1.14 - - Dispari, Distanza, 1 to be fixed - Pattern Differenza successiva →
Riga 5: === Il parametro ''k'' === Un oggetto è classificato in base alla maggioranza dei voti dei suoi ''k'' vicini. ''k'' è un intero positivo tipicamente non molto grande. Se ''k=1'' allora l'oggetto viene assegnato alla classe del suo vicino. In un contesto [[Sistema numerico binario\|binario]] in cui sono presenti esclusivamente due classi è opportuno scegliere ''k'' [[Numeri pari e dispari\|dispari]] per evitare di ritrovarsi in situazioni di parità. Questo metodo può essere utilizzato per la tecnica di [[regressione]] assegnando all'oggetto la media dei valori dei ''k'' oggetti suoi vicini. Considerando solo i voti dei ''k'' oggetti vicini c'è l'inconveniente dovuto alla predominanza delle classi con più oggetti. In questo caso può risultare utile pesare i contributi dei vicini in modo da dare, nel calcolo della media, maggior importanza in base alla [[distanza]] dall'oggetto considerato. === Scelta del parametro ''k'' === Riga 19: === Calcolo della distanza === Ai fini del calcolo della [[distanza]] gli oggetti sono rappresentati attraverso [[Vettore (matematica)\|vettori]] di posizione in uno spazio multidimensionale. Di solito viene usata la [[distanza euclidea]], ma anche altri tipi di distanza sono ugualmente utilizzabili, ad esempio la [[Manhattan distance\|distanza Manhattan]]. Nel caso in cui si debbano manipolare [[stringa (informatica)\|stringhe]] e non numeri si possono usare altre distanze quali ad esempio la [[distanza di Hamming]]. L'algoritmo è sensibile alla struttura locale dei dati. === Fase di classificazione ===

K-nearest neighbors: differenze tra le versioni