Excel est une application polyvalente ayant dépassé de loin ses premières versions en tant que solution de feuille de calcul. Employé comme archiveur, carnet d’adresses, outil de prévision, etc., de nombreuses personnes utilisent même Excel de manière inattendue.
Si vous utilisez beaucoup Excel à la maison ou au bureau, vous savez que, parfois, les fichiers Excel peuvent rapidement devenir encombrants en raison du grand nombre d'enregistrements avec lesquels vous travaillez.
Heureusement, Excel possède des fonctions intégrées pour vous aider à trouver et à supprimer les enregistrements en double. Malheureusement, l'utilisation de ces fonctions pose quelques problèmes, vous devez donc faire attention à ne pas supprimer des enregistrements que vous n'aviez pas l'intention de supprimer. En outre, les deux méthodes ci-dessous suppriment instantanément les doublons sans vous permettre de voir ce qui a été supprimé.
Je vais également mentionner un moyen de mettre en évidence les lignes qui sont en double en premier, afin que vous puissiez voir celles qui seront supprimées par les fonctions avant de les exécuter. Vous devez utiliser une règle de mise en forme conditionnelle personnalisée afin de mettre en surbrillance une ligne entièrement dupliquée.
Supprimer les doublons
Supposons que vous utilisiez Excel pour garder une trace des adresses et que vous suspectiez des enregistrements en double. Regardez l'exemple de feuille de calcul Excel ci-dessous:
Notez que l’enregistrement «Jones» apparaît deux fois. Pour supprimer ces enregistrements en double, cliquez sur le bouton Les données onglet sur le ruban et localisez le Supprimer les doublons fonctionner sous la Outils de données section. Cliquer sur Supprimer les doublons et une nouvelle fenêtre s'ouvre.
Ici, vous devez décider si vous utilisez des étiquettes de titre en haut de vos colonnes. Si vous le faites, sélectionnez l'option intitulée Mes données ont des en-têtes. Si vous n'utilisez pas d'étiquettes de titre, vous utiliserez les désignations de colonne standard d'Excel, telles que Colonne A, Colonne B, etc.
Pour cet exemple, nous choisirons la colonne A uniquement et cliquez sur le bouton D'accord bouton. La fenêtre d'option se ferme et Excel supprime le deuxième enregistrement «Jones».
Bien sûr, ce n'était qu'un exemple simple. Tous les enregistrements d’adresses que vous gardez avec Excel risquent d’être beaucoup plus compliqués. Supposons, par exemple, que votre fichier d’adresse ressemble à ceci.
Notez que bien qu'il existe trois enregistrements «Jones», seuls deux sont identiques. Si nous utilisions les procédures ci-dessus pour supprimer les enregistrements en double, il ne resterait qu'une entrée «Jones». Dans ce cas, nous devons élargir nos critères de décision afin d’inclure les noms et les prénoms des colonnes A et B, respectivement.
Pour cela, cliquez à nouveau sur le bouton Les données onglet sur le ruban, puis cliquez sur Supprimer les doublons. Cette fois, lorsque la fenêtre des options apparaît, choisissez les colonnes A et B. Cliquez sur le bouton D'accord bouton et notez que cette fois Excel n’a supprimé qu’un des enregistrements «Mary Jones».
En effet, nous avons demandé à Excel de supprimer les doublons en faisant correspondre les enregistrements en fonction des colonnes A et B plutôt que de la colonne A. Plus vous choisissez de colonnes, plus le critère doit être rempli avant qu'Excel considère qu'un enregistrement est un doublon. Choisissez toutes les colonnes si vous souhaitez supprimer les lignes complètement dupliquées.
Excel vous enverra un message vous indiquant le nombre de doublons supprimés. Cependant, il ne vous indiquera pas quelles lignes ont été supprimées! Faites défiler jusqu'à la dernière section pour voir comment mettre en évidence les lignes en double avant d'exécuter cette fonction.
Méthode de filtrage avancée
La deuxième façon de supprimer les doublons consiste à utiliser l'option de filtre avancé. Tout d'abord, sélectionnez toutes les données de la feuille. Ensuite, sous l'onglet Données du ruban, cliquez sur Avancée dans le Trier et filtrer section.
Dans la boîte de dialogue qui apparaît, assurez-vous de cocher la case Enregistrements uniques seulement case à cocher.
Vous pouvez filtrer la liste sur place ou copier les éléments non dupliqués dans une autre partie de la même feuille de calcul. Pour une raison quelconque, vous ne pouvez pas copier les données sur une autre feuille. Si vous le souhaitez sur une autre feuille, choisissez d'abord un emplacement sur la feuille en cours, puis coupez et collez ces données dans une nouvelle feuille.
Avec cette méthode, vous ne recevez même pas un message indiquant le nombre de lignes supprimées. Les lignes sont supprimées et c'est tout.
Surligner les lignes en double dans Excel
Si vous voulez voir quels enregistrements sont en double avant de les supprimer, vous devez effectuer un peu de travail manuel. Malheureusement, Excel ne dispose d'aucun moyen de mettre en évidence des lignes entièrement dupliquées. Il comporte une fonctionnalité de mise en forme conditionnelle qui met en évidence les cellules en double, mais cet article concerne les lignes en double.
La première chose à faire est d’ajouter une formule dans une colonne à droite de votre ensemble de données. La formule est simple: il suffit de concaténer toutes les colonnes de cette ligne.
= A1 et B1 et C1 et D1 et E1
Dans mon exemple ci-dessous, j'ai des données dans les colonnes A à F. Cependant, la première colonne est un numéro d'identification, je l'exclus donc de ma formule ci-dessous. Assurez-vous d'inclure toutes les colonnes contenant des données sur lesquelles vous souhaitez vérifier les doublons.
J'ai mis cette formule dans la colonne H, puis je l'ai déplacée vers le bas pour toutes mes lignes. Cette formule combine simplement toutes les données de chaque colonne sous la forme d’un gros morceau de texte. Maintenant, passez deux colonnes supplémentaires et entrez la formule suivante:
= COUNTIF ($ H 1 $: H $ 34 $, H1 $)> 1
Nous utilisons ici la fonction COUNTIF et le premier paramètre est l'ensemble des données que nous voulons examiner. Pour moi, il s’agissait de la colonne H (qui contient la formule de combinaison de données) des lignes 1 à 34. C’est également une bonne idée de supprimer la ligne d’en-tête avant de procéder ainsi.
Vous voudrez également vous assurer que vous utilisez le signe dollar ($) devant la lettre et le chiffre. Si vous avez 1 000 lignes de données et que votre formule de ligne combinée se trouve dans la colonne F, par exemple, votre formule ressemblerait à ceci:
= COUNTIF (1 $ F: 1 000 $ F, F1)> 1
Le second paramètre a uniquement le signe dollar devant la lettre de la colonne, ce qui le verrouille, mais nous ne voulons pas verrouiller le numéro de la ligne. Encore une fois, vous allez faire glisser ceci vers le bas pour toutes vos lignes de données. Cela devrait ressembler à ceci et les lignes en double devraient avoir la valeur VRAI.
Maintenant, mettons en évidence les lignes qui ont la valeur VRAI car ce sont les lignes en double. Tout d’abord, sélectionnez la feuille de calcul complète des données en cliquant sur le petit triangle situé à l’intersection supérieure gauche des rangées et des colonnes. Maintenant, allez dans l'onglet Accueil, puis cliquez sur Mise en forme conditionnelle et cliquez sur Nouvelle règle.
Dans la boîte de dialogue, cliquez sur Utilisez une formule pour déterminer les cellules à formater.
Dans la case sous Mettez en forme les valeurs où cette formule est vraie:, entrez la formule suivante en remplaçant P avec votre colonne qui a les valeurs TRUE ou FALSE. Assurez-vous d'inclure le signe dollar devant la lettre de la colonne.
= $ P1 = TRUE
Une fois que vous avez fait cela, cliquez sur Format et cliquez sur l'onglet Remplissage. Choisissez une couleur qui sera utilisée pour mettre en évidence la totalité de la ligne en double. Cliquez sur OK et vous devriez maintenant voir les lignes en double sont en surbrillance.
Si cela ne fonctionne pas pour vous, recommencez et recommencez lentement. Cela doit être fait exactement pour que tout cela fonctionne. Si vous manquez un seul symbole $ en cours de route, cela ne fonctionnera pas correctement.
Mises en garde avec la suppression des enregistrements en double
Évidemment, laisser Excel supprimer automatiquement pour vous les enregistrements en double pose quelques problèmes. Tout d'abord, vous devez faire attention à ne pas sélectionner trop ou trop peu de colonnes à utiliser par Excel comme critère d'identification des enregistrements en double.
Trop peu et vous pouvez supprimer par inadvertance les enregistrements dont vous avez besoin. Trop nombreux ou incluant accidentellement une colonne d’identificateur et aucun doublon ne sera trouvé.
Deuxièmement, Excel suppose toujours que le premier enregistrement unique qu'il rencontre est la fiche principale. Tous les enregistrements ultérieurs sont supposés être des doublons. Cela pose un problème si, par exemple, vous n'avez pas modifié l'adresse de l'une des personnes de votre fichier mais avez créé un nouvel enregistrement.
Si le nouvel enregistrement d'adresse (correct) apparaît après l'ancien enregistrement (obsolète), Excel suppose que le premier enregistrement (obsolète) est le fichier principal et supprime tous les enregistrements ultérieurs qu'il trouve. C’est la raison pour laquelle vous devez faire attention à la manière dont vous laissez Excel ou non, de manière libérale ou conservatrice, décider si un enregistrement est en double ou non.
Dans ces cas, vous devez utiliser la méthode de duplication de surbrillance que j'ai décrite et supprimer manuellement l'enregistrement en double approprié.
Enfin, Excel ne vous demande pas de vérifier si vous souhaitez réellement supprimer un enregistrement. En utilisant les paramètres que vous choisissez (colonnes), le processus est complètement automatisé. Cela peut s'avérer dangereux lorsque vous avez un grand nombre d'enregistrements et que vous avez l'assurance que les décisions que vous avez prises sont correctes et permettez à Excel de supprimer automatiquement les enregistrements en double pour vous.
Assurez-vous également de consulter notre article précédent sur la suppression des lignes vides dans Excel. Prendre plaisir!