Imprimer
Affichages : 2770

Vote utilisateur: 5 / 5

Etoiles activesEtoiles activesEtoiles activesEtoiles activesEtoiles actives
 

NSI - Numérique et Sciences Informatiques
Méthode des k plus proches voisins


Prérequis au TD

Présentation de la méthode des k plus proches voisins

Notre problème est assez simple
 

La méthode des k plus proche voisins - (k nearest neighbors)

 

 

Algorithme des k plus proche voisins - k nearest neighbors

Algorithme des k plus proche voisins - k nearest neighbors

 Soit un ensemble E contenant \(n\) données labellisées.

Voici le principe de l’algorithme de k plus proches voisins  :

  1. On calcule les distances entre la donnée C et chaque donnée appartenant à E à l’aide de la fonction \(d\).
  2. On retient les \(k\) éléments de E les plus proches de C.
  3. On attribue à C la classe qui est la plus fréquente parmi les \(k\) données les plus proches (selon la distance choisie).
  4. Il étant entendu que tout dépend du paramètre \(k\) qui est choisi.

 Algorithme des k plus proches voisins - k nearest neighbors

 

Algorithme des k plus proche voisins - Etude d'un exemple

Description : Iris de Fisher

Nous allons ici appliquer l'algorithme des k plus proches voisins sur un exemple concret.

Ce  jeu de données Iris  connu aussi sous le nom de Iris de Fisher  est un jeu de données multivariées présenté en 1936 par Ronald Fisher dans son papier "The use of multiple measurements in taxonomic problems".

Le jeu de données comprend 50 échantillons de chacune des trois espèces d'iris (Iris setosa, Iris virginica et Iris versicolor).

Iris de Fisher : Iris setosa, Iris virginica et Iris versicolor

Quatre caractéristiques ont été mesurées à partir de chaque échantillon : la longueur et la largeur des sépales et des pétales, en centimètres.

Sur la base de la combinaison de ces quatre variables, Fisher a élaboré un modèle d'analyse permettant de distinguer les espèces les unes des autres.

Il est possible de télécharger ces données au format csv : Iris_de_Fisher.csv.

 

 

Articles Connexes