L'imputation des données manquantes est le processus de remplacement des données manquantes par des valeurs de substitution, «meilleure estimation». Étant donné que les données manquantes peuvent créer des problèmes pour l'analyse des données et entraîner un biais de données manquantes, l'imputation est considérée comme un moyen d'éviter les problèmes associés à la suppression par liste (en ignorant toutes les observations avec des valeurs manquantes).
J'ai un ensemble de données avec 21000 lignes (échantillons de données) et 102 colonnes (entités). J'aimerais avoir un plus grand ensemble de données synth&eacut ...