Interprétation des résultats
Nos algorithmes ne nous permettent pas seulement d'apprécier l'appartenance d'un individu à un groupe (entreprise ou poste) mais également d'analyser ce groupe en lui-même. En effet, nous pouvons analyser la structure des données psychométriques définissant un groupe d'individu. En d'autres termes, quelles caractéristiques psychologiques définissent ce groupe.
Le schéma ci-dessous correspond à un algorithme qui possède un haut niveau de fiabilité, car nous obtenons un très bon score de prédiction et d'aire sous la courbe ROC rattachés (AUC).
L'aire sous la courbe ROC représente la capacité de notre algorithme à différencier des individus appar- tenant, ou non, à un groupe spécifique. Une aire de 50 signifie que notre algorithme ne prédira pas mieux que ce que ferait le hasard. A contrario, une aire de 100 signifie une prédiction parfaite : aucun faux positifs (déclaré comme positif alors qu'il est en réalité négatif) et aucun faux négatifs (déclaré comme négatif alors qu'il est en réalité positif). L'aire sous la courbe ROC ne peut jamais être inférieur à 50.
Ici, une précision de 95% signifie que l'algorithme est capable dans 95% des cas, de détecter sur de nouvelles données, des individus appartenant à un groupe de référence (par exemple, une entreprise).
Le schéma suivant correspond à un algorithme de faible performance : il est difficile d'identifier les invariants comportementaux. Un candidat aléatoire est peu différencié d'un candidat appartenant à un groupe de référence.