Googleスプレッドシートの2つの列の間の重複を見つける方法

Googleスプレッドシートの条件付き書式機能を使用して、2つの列の間で重複するエントリを見つけて強調表示できます。

大きなデータセットを使用してGoogleスプレッドシートで作業しているときに、多くの重複する値を処理しなければならないという問題が発生する可能性があります。一部の重複エントリは意図的に配置されていますが、他のエントリは間違いです。これは、チームと同じシートで共同作業している場合に特に当てはまります。

Googleスプレッドシートのデータを分析する場合、重複を除外で​​きることが不可欠で便利な場合があります。 Googleスプレッドシートには、シート内の重複を検索するためのネイティブサポートはありませんが、セル内の重複データを比較、識別、削除するためのいくつかの方法があります。

場合によっては、ある列の各値を別の列と比較して、その列に重複があるかどうかを確認したり、その逆を行ったりすることがあります。 Googleスプレッドシートでは、条件付き書式機能を使用して、2つの列間の重複を簡単に見つけることができます。この記事では、Googleスプレッドシートの2つの列を比較し、それらの間の重複を見つける方法を紹介します。

条件付き書式を使用して、2つの列間の重複エントリを検索する

条件付き書式は、ユーザーが特定の条件に基づいてセルまたはセルの範囲にフォントの色、アイコン、データバーなどの特定の書式を適用できるようにするGoogleスプレッドシートの機能です。

この条件付き書式を使用して、セルを色で塗りつぶすか、テキストの色を変更することにより、2つの列間の重複エントリを強調表示できます。列の各値を別の列と比較して、値が繰り返されているかどうかを確認する必要があります。これを機能させるには、条件付き書式を各列に個別に適用する必要があります。これを行うには、次の手順に従います。

Googleスプレッドシートで重複を確認するスプレッドシートを開きます。まず、最初の列(A)を選択して、列Bで確認します。列の上にある列の文字をクリックすると、列全体を強調表示できます。

次に、メニューバーから[フォーマット]メニューをクリックし、[条件付きフォーマット]を選択します。

条件付き書式メニューがGoogleスプレッドシートの右側に開きます。セル範囲が[範囲に適用]オプションで選択したものであることを確認できます。範囲を変更したい場合は、「範囲アイコン」をクリックして別の範囲を選択してください。

次に、[フォーマットルール]の下のドロップダウンをクリックして、[カスタム数式]オプションを選択します。

次に、[値または数式]ボックスにカスタム数式を入力する必要があります。

列全体(B:B)を選択した場合は、フォーマットルールの下の[値または数式]ボックスに次のCOUNTIF数式を入力します。

= countif($ B:$ B、$ A2)> 0

または、

列内のセルの範囲(たとえば、100個のセル、A2:A30)を選択した場合は、次の数式を使用します。

= COUNTIF($ B $ 2:$ B $ 30、$ A2)> 0

数式を入力するときは、数式内の文字「B」のすべてのインスタンスを、強調表示した列の文字に置き換えてください。セル参照の前に「$」記号を追加して絶対範囲にするため、数式を適用しても変更はありません。

[書式設定スタイル]セクションで、重複するアイテムを強調表示するための書式設定スタイルを選択できます。デフォルトでは、緑色の塗りつぶし色が使用されます。

[フォーマットスタイル]オプションの下の[デフォルト]をクリックして、プリセットの1つを選択することにより、プリセットのフォーマットスタイルの1つを選択できます。

または、[書式設定スタイル]セクションの下にある7つの書式設定ツール(太字、斜体、下線、取り消し線、テキストの色、塗りつぶしの色)のいずれかを使用して、重複を強調表示できます。

ここでは、[塗りつぶしの色]アイコンをクリックし、[黄色]の色を選択して、複製セルの塗りつぶしの色を選択します。

フォーマットを選択したら、[完了]をクリックしてセルを強調表示します。

COUNTIF関数は、「列A」の各セル値が「列B」に表示される回数をカウントします。したがって、項目が列Bに1回でも表示される場合、数式はTRUEを返します。次に、選択したフォーマットに基づいて、そのアイテムが「列A」で強調表示されます。

これは重複を強調表示するのではなく、列Bに重複があるアイテムを強調表示します。つまり、黄色で強調表示された各アイテムは、列Bに重複があります。

次に、同じ数式を使用して列Bに条件付き書式を適用する必要があります。これを行うには、2番目の列(B2:B30)を選択し、[フォーマット]メニューに移動して、[条件付きフォーマット]を選択します。

または、[条件付きフォーマットルール]ペインの下にある[別のルールを追加]ボタンをクリックします。

次に、[範囲に適用]ボックスで範囲(B2:B30)を確認します。

次に、[セルの書式設定if ..]オプションを[カスタム数式]に設定し、数式ボックスに次の数式を入力します。

= COUNTIF($ A $ 2:$ A $ 30、$ B2)> 0

ここでは、最初の引数に列Aの範囲($ A $ 2:$ A $ 30)を使用し、2番目の引数に「$ B2」を使用しています。この数式は、「列B」のセル値を列Aのすべてのセルと照合します。一致(重複)が見つかった場合、条件付き書式は「列B」のその項目を高くします。

次に、[書式設定スタイル]オプションで書式設定を指定し、[完了]をクリックします。ここでは、列Bにオレンジ色を選択しています。

これにより、列Aに重複がある列Bのアイテムが強調表示されます。これで、2つの列の間に重複するアイテムが見つかり強調表示されました。

A列に「Arcelia」の重複がありますが、強調表示されていません。これは、重複値が列間ではなく1つの列(A)にのみ存在するためです。したがって、強調表示されません。

同じ行の2つの列間の重複を強調表示

条件付き書式を使用して、2つの列間で同じ値(重複)を持つ行を強調表示することもできます。条件付き書式ルールは、各行をチェックし、両方の列に一致するデータがある行を強調表示できます。これを行う方法は次のとおりです。

まず、比較する両方の列を選択してから、[フォーマット]メニューに移動し、[条件付きフォーマット]を選択します。

[条件付き書式のルール]ウィンドウで、[範囲に適用]ボックスで範囲を確認し、[数式セルの場合]ドロップダウンから[カスタム数式は]を選択します。

次に、[値または数式]ボックスに次の数式を入力します。

= $ A2 = $ B2

この数式は、2つの列を行ごとに比較し、同じ値(重複)を持つ行を強調表示します。ご覧のとおり、ここに入力した数式は、選択した範囲の最初の行のみを対象としていますが、条件付き書式機能により、選択した範囲のすべての行に数式が自動的に適用されます。

次に、[書式設定スタイル]オプションから書式設定を指定し、[完了]をクリックします。

ご覧のとおり、2つの列間で一致するデータ(重複)がある行のみが強調表示され、他のすべての重複は無視されます。

複数の列の重複セルを強調表示する

多くの列を持つ大きなスプレッドシートで作業する場合は、1つまたは2つの列だけでなく、複数の列にまたがって表示されるすべての重複を強調表示することをお勧めします。条件付き書式を使用して、複数の列で重複を強調表示することもできます。

まず、1列または2列だけでなく、重複を検索するすべての列と行の範囲を選択します。 Ctrlキーを押しながら各列の上部にある文字をクリックすると、列全体を選択できます。または、Shiftキーを押しながら範囲内の最初と最後のセルをクリックして、一度に複数の列を選択することもできます。

この例では、A2:C30を選択しています。

次に、メニューの[フォーマット]オプションをクリックして、[条件付きフォーマット]を選択します。

[条件付き書式ルール]で、[書式ルール]を[カスタム数式]に設定し、[値または数式]ボックスに次の数式を入力します。

= countif($ A $ 2:$ C $ 30、A2)>

セル参照の前に「$」記号を追加して絶対列にするため、数式を適用しても変更はありません。 「$」記号なしで数式を入力することもできます。どちらの方法でも機能します。

次に、[書式設定スタイル]オプションを使用して、重複するセルを強調表示する書式設定を選択します。ここでは、「黄色」の塗りつぶし色を選択しています。その後、[完了]をクリックします。

これにより、以下に示すように、選択したすべての列の重複が強調表示されます。

条件付き書式を適用した後、いつでも条件付き書式ルールを編集または削除できます。

現在の条件付き書式ルールを編集する場合は、条件付き書式のセルを選択し、メニューの[書式]に移動して、[条件付き書式]を選択します。

これにより、右側の[条件付きフォーマットルール]ペインが開き、現在の選択に適用されているフォーマットルールのリストが表示されます。ルールの上にマウスを置くと、削除ボタンが表示されます。削除ボタンをクリックしてルールを削除してください。または、現在表示されているルールを編集する場合は、ルール自体をクリックします。

現在のルールに別の条件付き書式を追加する場合は、[別のルールを追加]ボタンをクリックします。

2つの列間の重複をカウントします

ある列の値が別の列で繰り返される回数をカウントしたい場合があります。同じCOUNTIF関数を使用して簡単に実行できます。

列Aの値が列Bに存在する回数を見つけるには、別の列のセルに次の数式を入力します。

= COUNTIF($ B $ 2:$ B $ 30、$ A2)

この数式をセルC2に入力します。この数式は、セルA2の値が列(B2:B30)に存在する回数をカウントし、セルC2のカウントを返します。

数式を入力してEnterキーを押すと、自動入力機能が表示されます。[チェックマーク]をクリックして、この数式を残りのセル(C3:C30)に自動入力します。

自動入力機能が表示されない場合は、セルC2の右下隅にある青い四角をクリックして下にドラッグし、セルC2の数式をセルC3:C30にコピーします。

「比較1」列(C)には、列Aの対応する各値が列Bに表示される回数が表示されます。たとえば、A2の値、つまり「フランクリン」が列Bに見つからないため、 COUNTIF関数は「0」を返します。また、値「Loreta」(A5)が列Bで2回検出されたため、「2」が返されます。

ここで、同じ手順を繰り返して列Bの重複カウントを見つける必要があります。これを行うには、列DのセルD2に次の数式を入力します(比較2)。

= COUNTIF($ A $ 2:$ A $ 30、$ B2)

この数式では、「$ B $ 2:$ B $ 30」から「$ A $ 2:$ A $ 30」、「$ B2」から「$ A2」の範囲を置き換えます。この関数は、セルB2の値が列A(A2:A30)に存在する回数をカウントし、セルD2のカウントを返します。

次に、列Dの残りのセル(D3:D30)に数式を自動入力します。これで、「比較2」に、列Bの対応する各値が列Aに表示される回数が表示されます。たとえば、 、B2の値、つまり「Stark」が列Aで2回検出されたため、COUNTIF関数は「2」を返します。

ノート: すべての列または複数の列にわたる重複をカウントする場合は、COUNTIF関数の最初の引数の範囲を1つの列だけでなく複数の列に変更する必要があります。たとえば、範囲をA2:A30からA2:B30に変更します。これにより、1つではなく2つの列のすべての重複がカウントされます。

それでおしまい。