重複データを抽出
- Excel 2019, 2016, 2013, 2010
- Office 365
(conditional-formatting-duplicate.xlsx 17.9KB)
スポンサーリンク
Excelで重複データをチェック・抽出するには、条件付き書式にもともと備わっている、重複データに色を付ける機能を使います!
スポンサーリンク
テーブルでもテーブルじゃなくてもOK
重複データがあるのか不安になるということは、ある程度ボリュームのあるデータであることが考えられます。
ということは、今、あなたが重複チェックをしたいデータは、もしかすると大量データを扱いやすいテーブルになっているかもしれません。
今回ご紹介する技は、テーブルになっていないデータでも、テーブルになっているデータにも使えます。
練習用データを操作しながらご覧いただく方には、両方の練習ができるよう、テーブルになっていないデータと、テーブルになっているデータを、2つのシートに分けてご用意しました。
重複チェックをする条件付き書式
条件付き書式の重複チェックでは、同じデータがあるかどうか確認したい範囲を、最初に選択します。
「氏名」欄で同じデータがあるのかどうかを確認したいのであれば、「氏名」欄を範囲選択します。
この時、先頭の見出しは重複チェックする必要はないので、「氏名」の列の、見出しを除いたデータ部分だけを範囲選択します。
範囲選択の際、テーブルになってはいないけれど、結構な量のデータがあるのであれば、「長〜い範囲も一発選択!」の技を使えば、どんなに量があっても一瞬で範囲選択できるので便利です。
テーブルになっているのであれば、「巨大テーブルでも安心!テーブルの選択」でご紹介している方法を使えば、列のデータ部分のみを簡単に選択できて便利です。
範囲選択をしたら、[ホーム]タブ、
[スタイル]グループにある[条件付き書式]ボタンをクリックし、
[セルの強調表示ルール]から[重複する値]をクリックします。
表示されたダイアログボックスの左側が[重複]になっていることを確認し、
右側で、重複データに付けたい色を選択します。
[OK]ボタンをクリックすると、
条件付き書式を設定する際に選択した範囲内(今回の場合は「氏名」欄)で、同じデータに色が付きました!
スポンサーリンク
複数の列に重複チェックの条件付き書式を設定
今回のような名簿の場合、同姓同名もあるので、氏名だけで同一人物かどうかを判断するのは不安です。
そんな場合には、他の列にも、重複チェックの条件付き書式を設定します。
今回は「生年月日」欄にも、重複チェックの条件付き書式を設定してみましょう。
条件付き書式の重複チェックでは、同じデータがあるかどうか確認したい範囲を、最初に選択することから始めました。
今回は「生年月日」欄で同じデータがあるかを確認したいので、「生年月日」欄を範囲選択します。
この時、先頭の見出しは重複チェックする必要はないので、「生年月日」の列の、見出しを除いたデータ部分だけを範囲選択します。
[ホーム]タブ、
[スタイル]グループにある[条件付き書式]ボタンをクリックし、
[セルの強調表示ルール]から[重複する値]をクリックします。
表示されたダイアログボックスの左側が[重複]になっていることを確認し、
右側で、重複データに付けたい色を選択します。
この時、他の列に設定した色と同じにするか、別の色にするかは完全にお好みで。
同じ色にしようが、他の色にしようが、他の列に設定した重複チェックと、今設定しようとしている重複チェックは、別の条件付き書式のルールとして、Excelには認識されます。
[OK]ボタンをクリックすると、
条件付き書式を設定する際に選択した範囲内(今回の場合は「生年月日」欄)で、同じデータに色が付きました!
フィルターで抽出
ここで、「氏名」欄と「生年月日」欄を見比べると、「氏名」と「生年月日」の両方に色が付いているものと、「生年月日」だけに色が付いているものとがあります。
条件付き書式の重複チェックは、条件付き書式を設定する際に選択した範囲の中で、同じデータがあるものに色が付きます。
「氏名」欄と「生年月日」欄では、それぞれ別々に範囲選択して条件付き書式を設定したので、「氏名」欄の中だけ、「生年月日」欄の中だけと、それぞれ別々に重複チェックが行われ、このような結果になっています。
「氏名」欄と「生年月日」欄で、それぞれ別々に重複チェックを行ったので、両方に色が付いていれば、同一人物のデータが、表の中にある可能性が高いということになります。
(同姓同名、生年月日も一緒の別人ということもあるので、不安であれば、他の列でも重複チェックをかけてみるといいと思います。)
色が付いているものだけを表示したいのであれば、色フィルターが便利です。
条件付き書式を設定する際に、重複したデータに、文字の色と背景の色の両方を付けるように設定した場合には、
どちらでフィルターをかけてもOKです。
データを入力する前から考えておきたいこと
例えば、同じ住所があるかどうかを見たい場合、「住所」欄に重複チェックの条件付き書式を設定すればよいわけですが、同じ住所にもかかわらず、一方は都道府県名から入力していて、一方は都道府県名は入力せず市区町村名から入力していると、データはすっかり同じではないため、重複とはみなされません。
(この図は、「住所」だけに重複チェックをかけて、「氏名」や「生年月日」には設定していない図になります。)
また、英数字に関しては、一方は全角で入力されているのに、一方は半角で入力されているという風になっていると、これもすっかり同じになっていないため、重複とはみなされません。
(ただし、住所のような、1つのセルの中に「文字と数字」が入力されているパターンではなく、1つのセルの中に「数字だけ」しか入力されていない範囲で重複チェックをかけると、全角・半角を区別しないようです。
英字は、1つのセルの中に「文字と英字」が入力されていようが、「英字のみ」の場合だろうが、全角と半角は区別されます。)
Excelの機能をフル活用するためにも、都道府県名は入力するのかしないのか、英数字は全角で入力するのか、半角で入力するのか(ちなみに当サイトでは英数字は半角で入力することをおすすめしています)と、あらかじめ入力のルールを決めておくことが大切です。
スポンサーリンク