MySQL の重複データの処理方法 (防止と削除)

MySQL の重複データの処理方法 (防止と削除)

一部の MySQL テーブルには重複レコードが含まれている場合があります。重複データが存在することを許容する場合もありますが、重複データを削除する必要がある場合もあります。

この章では、データ テーブルに重複データが表示されないようにする方法と、データ テーブル内の重複データを削除する方法を紹介します。

テーブルに重複データが表示されないようにする

データの一意性を確保するために、MySQL テーブル内の指定されたフィールドを PRIMARY KEY または UNIQUE インデックスとして設定できます。
例を試してみましょう: 次のテーブルにはインデックスや主キーがないため、テーブル内に複数の重複レコードが許可されます。

テーブル person_tbl を作成する
(
 ファーストネーム CHAR(20)
 姓 CHAR(20)、
 性別 CHAR(10)
);

テーブル内の first_name フィールドと last_name フィールドのデータが重複しないように設定する場合は、二重主キー モードを設定してデータの一意性を設定できます。二重主キーを設定すると、そのキーのデフォルト値は NULL にできず、NOT NULL に設定できます。以下のように表示されます。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 主キー (姓、名)
);

一意のインデックスを設定すると、重複データを挿入するときに SQL ステートメントが正常に実行されず、エラーがスローされます。

INSERT IGNORE INTO と INSERT INTO の違いは、INSERT IGNORE ではデータベースにすでに存在するデータが無視されることです。データベースにデータがない場合、新しいデータが挿入されます。データがある場合、そのデータはスキップされます。このようにして、データベース内の既存のデータを保持し、ギャップにデータを挿入するという目的を達成することができます。

次の例では、INSERT IGNORE INTO を使用しています。実行後にエラーは発生せず、データ テーブルに重複データは挿入されません。

mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、1 行が影響を受けました (0.00 秒)
mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、影響を受けた行は 0 行 (0.00 秒)

INSERT IGNORE INTO データを挿入する際、レコードの一意性を設定した後、重複したデータが挿入された場合、エラーは返されず、警告のみが返されます。 REPLACE INTO に同じプライマリまたは一意のレコードがある場合は、まずそれが削除されます。新しいレコードを再度挿入します。

データの一意性を設定する別の方法は、次に示すように、UNIQUE インデックスを追加することです。

テーブル person_tbl を作成する
(
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 ユニーク (姓、名)
);

重複データのカウント

以下では、テーブル内の first_name と last_name の重複レコードの数をカウントします。

mysql> 繰り返しとして COUNT(*) を選択、姓、名
 -> person_tbl から
 -> GROUP BY 姓、名
 -> 繰り返し回数が 1 回を超える;

上記のクエリは、person_tbl テーブル内の重複レコードの数を返します。 一般に、重複する値を照会するには、次の手順を実行します。

  • 繰り返される可能性のある値が含まれる列を決定します。
  • 列選択リストで COUNT(*) を使用して、それらの列を一覧表示します。
  • GROUP BY 句にリストされている列。
  • HAVING 句は繰り返し回数を 1 より大きく設定します。

重複データのフィルタリング

重複しないデータを読み取る必要がある場合は、SELECT ステートメントで DISTINCT キーワードを使用して重複データを除外できます。

mysql> SELECT DISTINCT 姓、名
 -> person_tbl から;

GROUP BY を使用してテーブル内の一意のデータを読み取ることもできます。

mysql> 姓、名を選択
 -> person_tbl から
 -> GROUP BY (姓、名);

重複排除

テーブル内の重複データを削除する場合は、次の SQL ステートメントを使用できます。

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex FROM person_tbl GROUP BY (last_name, first_name, sex);
mysql> テーブル person_tbl を削除します。
mysql> ALTER TABLE tmp の名前を person_tbl に変更します。

もちろん、データ テーブルに INDEX (インデックス) と PRIMAY KEY (主キー) を追加して、テーブル内の重複レコードを削除することもできます。方法は次のとおりです。

mysql>テーブル person_tbl を無視する変更
 -> 主キーを追加します (last_name, first_name);

以上がMySQLの重複データの処理方法(防止と削除)の詳細です。MySQLの重複データの処理の詳細については、123WORDPRESS.COMの他の関連記事にも注目してください!

以下もご興味があるかもしれません:
  • 重複したMySQLレコードを現場でチェックし、処理する実践的な記録
  • 重複データの処理に関するMySQL学習ノート
  • MySQLデータの同時更新を処理する方法
  • MySQLの実行原理、論理階層化、データベース処理エンジンの変更について詳しく説明します
  • MySQLが大量のデータを処理する際にクエリ速度を最適化するいくつかの方法
  • MySQLデータ処理のソートと追加、削除、変更の操作の説明

<<:  JavaScript 関数型プログラミングの基礎

>>:  MySQLでユーザーを作成し、権限を管理する方法

推薦する

LINUX ポートが占有されているかどうかを確認します

ポートが占有されているかどうかは、これまで一度もわかりませんでした。多くの人に尋ねて、ようやくわかり...

MySQL 5.7.13 のインストールと設定方法のグラフィック チュートリアル (win10 64 ビット)

この記事では、参考までにMySQL 5.7.13 winx64のインストールと設定方法のグラフィック...

Windows (x86、64 ビット) で MySQL 5.7.17 無料インストール バージョンをアップグレードするための詳細なチュートリアル

Laravel 5.4 のデフォルトの utf8mb64 文字エンコーディングをサポートするには、M...

デジタル時計効果を実現するJavaScript

この記事の例では、JavaScriptでデジタル時計効果を実装するための具体的なコードを参考までに共...

Ubuntu 16.04 で Python 3 を使用して Django プロジェクトを作成し、実行する方法

ステップ1: Djangoプロジェクトを作成するターミナルを開き、書き込みたいプロジェクトのアドレス...

MySQL は正常に起動するがポートをリッスンしない場合の解決策

問題の説明MySQL が正常に起動しました。以下に示すように、 ps -ef |grep mysql...

MySQL 数千万のビッグデータに対するSQLクエリ最適化の知識ポイントのまとめ

1. クエリを最適化するには、テーブル全体のスキャンを避けてください。まず、where と orde...

CSS プロパティ display:flow-root 宣言を 1 つの記事でマスターする

zhangxinxu より https://www.zhangxinxu.com/wordpress...

Vue要素と多言語切り替えの詳細な説明

目次序文複数の言語を切り替えるにはどうすればいいですか? 1. vue-i18nパッケージをインスト...

Linux 上で Docker コンテナを作成、一覧表示、削除する方法の概要

1. Dockerコンテナを起動する以下のコマンドを使用して新しい Docker コンテナを起動しま...

Prometheusコンテナのデプロイメントのための実用的なソリューション

環境ホスト名IPアドレス仕えるプロメテウス192.168.237.137プロメテウス、グラファナノー...

Windows 10 でカスタムドメイン名をバインドするように Hexo と GitHub を構成する方法

Hexo は Windows 10 でカスタムドメイン名を GitHub にバインドしますまずドメイ...

Docker-compose インストール db2 データベース操作

db2 データベースをホストマシンに直接インストールするのは面倒で、ユーザーや権限を巻き込むのも不便...

Flexboxレイアウトの最もシンプルなフォーム実装

フレキシブル レイアウト (Flexbox) はますます人気が高まっており、CSS レイアウトの記述...

よくある CSS のヒントと経験談 11 選

1. 画像の下にある数ピクセルの空白を削除するにはどうすればよいですか?コードをコピーコードは次のと...