Afin d’entraîner et d’évaluer une méthode de Machine Learning, disposer de données n’est souvent pas suffisant : il faut également posséder une vérité terrain, indiquant pour un certain nombre de données le résultat attendu.
Construire cette vérité terrain est un processus généralement chronophage et fastidieux. Les méthodes d’apprentissage explorent les possibilités pour un modèle de machine learning entraîné avec à l’aide d’une vérité terrain succincte, d’indiquer un sous-ensemble de données pour lequel la production d’une vérité terrain sera fortement bénéfique. Ainsi la vérité terrain n’est plus construite à l’aveugle, mais de manière efficace, en se limitant aux données nécessaires pour que le modèle de machine learning puisse apprendre correctement. Après l’étude des grands principes de l’apprentissage actif nous verrons que des stratégies spécifiques doivent être mise en œuvre pour les réseaux de neurones, la question du nombre de données d’entraînement ne pouvant être séparé de celle de leur architecture.