Supprimer des doublons sur Excel paraît simple jusqu’au moment où la fonction native décale toutes les lignes et désaligne les colonnes voisines. Le problème se pose dès que chaque colonne contient des données indépendantes : une liste de villes à gauche, des noms de produits au centre, des codes internes à droite. Enlever des doublons sur Excel avec l’outil classique du ruban Données fusionne la logique ligne par ligne, ce qui ne convient pas à un nettoyage colonne par colonne.
Outil natif « Supprimer les doublons » : ce qu’il fait vraiment à vos colonnes
La fonction Supprimer les doublons (onglet Données) travaille sur des lignes entières ou sur une sélection de colonnes, mais elle supprime toujours la ligne complète. Si deux colonnes adjacentes n’ont aucun lien logique entre elles, le résultat est un décalage vertical : la colonne B perd des lignes que la colonne A conserve.
A voir aussi : Tableau : comment réaliser un tableau sans utiliser Excel ?
Ce comportement est documenté par Microsoft : la suppression s’applique à la plage sélectionnée et retire physiquement les lignes en double. Les cellules situées sous la plage remontent pour combler le vide. Sur un tableau structuré où chaque ligne représente un enregistrement cohérent, ce fonctionnement est logique. Sur des colonnes indépendantes, il casse l’alignement.
| Scénario | Outil natif (Supprimer les doublons) | Formule UNIQUE() | Power Query |
|---|---|---|---|
| Colonnes liées (même enregistrement) | Adapté | Possible mais plus lent | Adapté |
| Colonnes indépendantes (listes séparées) | Provoque un décalage | Adapté, sans toucher aux données source | Adapté, requête séparée par colonne |
| Données source à conserver intactes | Non (suppression physique) | Oui (extraction dans une autre plage) | Oui (résultat dans un nouveau tableau) |
| Disponibilité | Toutes versions d’Excel | Excel 365 / Excel 2021 | Excel 2016+ et 365 |

A découvrir également : Corriger automatiquement vos erreurs avec Excel formule soustraction
Formule UNIQUE et CHOISIRCOLS : dédupliquer colonne par colonne sans modifier la source
Les formules dynamiques apparues dans Excel 365 et Excel 2021 changent la donne. La fonction UNIQUE() extrait les valeurs distinctes d’une plage sans effacer les données d’origine. Le résultat s’affiche dans une zone libre de la feuille, et la liste source reste intacte.
Pour cibler une seule colonne à l’intérieur d’un tableau structuré, la combinaison avec CHOISIRCOLS est efficace. La syntaxe ressemble à ceci :
=UNIQUE(CHOISIRCOLS(Table1;3))
Cette formule isole la troisième colonne du tableau et en extrait les valeurs uniques. Répétez l’opération pour chaque colonne à nettoyer, en plaçant chaque résultat dans une zone distincte de la feuille.
Points à vérifier avant d’utiliser UNIQUE()
- La plage de destination doit être vide sur un nombre de lignes suffisant, sinon Excel renvoie une erreur de débordement (#EPARS!).
- Les espaces invisibles en fin de cellule créent de faux doublons. Un passage par la fonction SUPPRESPACE() sur la colonne source règle ce problème avant la déduplication.
- UNIQUE() est sensible à la casse dans certains contextes régionaux. Deux valeurs « Paris » et « paris » peuvent être traitées comme distinctes selon la version linguistique d’Excel.
Cette approche préserve la structure de la feuille. Aucune ligne ne disparaît, aucun décalage ne se produit. Chaque colonne est traitée de façon indépendante, ce qui correspond exactement au besoin d’un nettoyage colonne par colonne.
Power Query : dédupliquer sans toucher à la feuille d’origine
Power Query, intégré à Excel depuis la version 2016, propose une autre logique. La déduplication s’applique à une requête, pas directement aux cellules. Les données source restent intactes dans leur feuille d’origine, et le résultat dédupliqué se charge dans un nouveau tableau.
La procédure passe par l’éditeur Power Query :
- Sélectionnez la colonne à dédupliquer dans l’éditeur, puis cliquez sur « Supprimer les doublons » dans le menu contextuel de la colonne.
- Si plusieurs colonnes indépendantes doivent être traitées, créez une requête par colonne pour éviter que la suppression sur l’une n’affecte les lignes de l’autre.
- Le résultat se recharge dans une nouvelle feuille ou un nouveau tableau, sans altérer la plage d’origine.
Power Query conserve un historique des étapes de transformation. Si les données source évoluent, un simple « Actualiser » met à jour le tableau dédupliqué. Cette traçabilité est un avantage sur la formule UNIQUE(), qui recalcule en temps réel mais ne documente pas les étapes intermédiaires.

NB.SI pour repérer les doublons avant de décider quoi supprimer
Avant de supprimer quoi que ce soit, marquer les doublons permet de prendre une décision éclairée. La formule NB.SI, disponible dans toutes les versions d’Excel, compte le nombre d’occurrences d’une valeur dans une colonne.
En ajoutant une colonne auxiliaire avec la formule =NB.SI(A:A;A2), chaque cellule affiche le nombre de fois où sa valeur apparaît dans la colonne A. Toute valeur supérieure à 1 signale un doublon. Cette étape de diagnostic évite les suppressions accidentelles sur des lignes qui semblaient identiques mais ne l’étaient pas.
La mise en forme conditionnelle offre un complément visuel. En appliquant une règle « Valeurs en double » sur la colonne concernée, Excel colore automatiquement les cellules concernées. Ce repérage visuel permet de vérifier manuellement les cas ambigus (espaces en trop, casse différente, abréviations).
Tableau structuré Excel : le réflexe qui limite les dégâts
Convertir une plage en tableau structuré (Insertion, puis Tableau) ajoute une couche de protection. Les références deviennent dynamiques, les colonnes sont nommées, et les formules comme NB.SI ou NB.SI.ENS fonctionnent avec des références structurées du type =NB.SI(Tableau1[Ville];[@Ville]).
Un tableau structuré facilite aussi le travail avec Power Query et les formules dynamiques. Les nouvelles lignes ajoutées sont automatiquement prises en compte dans les requêtes et les plages nommées, ce qui réduit le risque d’oublier des données lors d’une déduplication ultérieure.
Le choix de la méthode dépend de la version d’Excel et de la structure des données. Pour des colonnes indépendantes sur Excel 365, UNIQUE() combinée à CHOISIRCOLS() reste la solution la plus directe. Sur des versions antérieures, Power Query offre la même sécurité avec une requête par colonne. Dans tous les cas, travailler sur une copie ou sur une extraction plutôt que sur les données source reste la précaution la plus fiable pour ne rien casser.

