K-nearest neighbors: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
ZimbuBot (discussione | contributi)
m WPCleaner v1.14 - - Dispari, Distanza, 1 to be fixed - Pattern
Riga 5:
 
=== Il parametro ''k'' ===
Un oggetto è classificato in base alla maggioranza dei voti dei suoi ''k'' vicini. ''k'' è un intero positivo tipicamente non molto grande. Se ''k=1'' allora l'oggetto viene assegnato alla classe del suo vicino. In un contesto [[Sistema numerico binario|binario]] in cui sono presenti esclusivamente due classi è opportuno scegliere ''k'' [[Numeri pari e dispari|dispari]] per evitare di ritrovarsi in situazioni di parità.
 
Questo metodo può essere utilizzato per la tecnica di [[regressione]] assegnando all'oggetto la media dei valori dei ''k'' oggetti suoi vicini.
 
Considerando solo i voti dei ''k'' oggetti vicini c'è l'inconveniente dovuto alla predominanza delle classi con più oggetti. In questo caso può risultare utile pesare i contributi dei vicini in modo da dare, nel calcolo della media, maggior importanza in base alla [[distanza]] dall'oggetto considerato.
 
=== Scelta del parametro ''k'' ===
Riga 19:
 
=== Calcolo della distanza ===
Ai fini del calcolo della [[distanza]] gli oggetti sono rappresentati attraverso [[Vettore (matematica)|vettori]] di posizione in uno spazio multidimensionale. Di solito viene usata la [[distanza euclidea]], ma anche altri tipi di distanza sono ugualmente utilizzabili, ad esempio la [[Manhattan distance|distanza Manhattan]]. Nel caso in cui si debbano manipolare [[stringa (informatica)|stringhe]] e non numeri si possono usare altre distanze quali ad esempio la [[distanza di Hamming]]. L'algoritmo è sensibile alla struttura locale dei dati.
 
=== Fase di classificazione ===