MySQL の重複データの処理方法 (防止と削除)

一部の MySQL テーブルには重複レコードが含まれている場合があります。重複データが存在することを許容する場合もありますが、重複データを削除する必要がある場合もあります。

この章では、データテーブルに重複データが表示されないようにする方法と、データテーブル内の重複データを削除する方法を紹介します。

テーブルに重複データが表示されないようにする

データの一意性を確保するために、MySQL テーブル内の指定されたフィールドを PRIMARY KEY または UNIQUE インデックスとして設定できます。
例を試してみましょう: 次のテーブルにはインデックスや主キーがないため、テーブル内に複数の重複レコードが許可されます。

テーブル person_tbl を作成する
（
 ファーストネーム CHAR(20)
 姓 CHAR(20)、
 性別 CHAR(10)
);

テーブル内の first_name フィールドと last_name フィールドのデータが重複しないように設定する場合は、二重主キーモードを設定してデータの一意性を設定できます。二重主キーを設定すると、そのキーのデフォルト値は NULL にできず、NOT NULL に設定できます。以下のように表示されます。

テーブル person_tbl を作成する
（
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 主キー (姓、名)
);

一意のインデックスを設定すると、重複データを挿入するときに SQL ステートメントが正常に実行されず、エラーがスローされます。

INSERT IGNORE INTO と INSERT INTO の違いは、INSERT IGNORE ではデータベースにすでに存在するデータが無視されることです。データベースにデータがない場合、新しいデータが挿入されます。データがある場合、そのデータはスキップされます。このようにして、データベース内の既存のデータを保持し、ギャップにデータを挿入するという目的を達成することができます。

次の例では、INSERT IGNORE INTO を使用しています。実行後にエラーは発生せず、データテーブルに重複データは挿入されません。

mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、1 行が影響を受けました (0.00 秒)
mysql> person_tbl (姓、名) に IGNORE を挿入します
 -> VALUES('ジェイ', 'トーマス');
クエリは正常、影響を受けた行は 0 行 (0.00 秒)

INSERT IGNORE INTO データを挿入する際、レコードの一意性を設定した後、重複したデータが挿入された場合、エラーは返されず、警告のみが返されます。 REPLACE INTO に同じプライマリまたは一意のレコードがある場合は、まずそれが削除されます。新しいレコードを再度挿入します。

データの一意性を設定する別の方法は、次に示すように、UNIQUE インデックスを追加することです。

テーブル person_tbl を作成する
（
 first_name CHAR(20) NOT NULL、
 last_name CHAR(20) NOT NULL、
 性別 CHAR(10)
 ユニーク (姓、名)
);

重複データのカウント

以下では、テーブル内の first_name と last_name の重複レコードの数をカウントします。

mysql> 繰り返しとして COUNT(*) を選択、姓、名
 -> person_tbl から
 -> GROUP BY 姓、名
 -> 繰り返し回数が 1 回を超える;

上記のクエリは、person_tbl テーブル内の重複レコードの数を返します。一般に、重複する値を照会するには、次の手順を実行します。

繰り返される可能性のある値が含まれる列を決定します。
列選択リストで COUNT(*) を使用して、それらの列を一覧表示します。
GROUP BY 句にリストされている列。
HAVING 句は繰り返し回数を 1 より大きく設定します。

重複データのフィルタリング

重複しないデータを読み取る必要がある場合は、SELECT ステートメントで DISTINCT キーワードを使用して重複データを除外できます。

mysql> SELECT DISTINCT 姓、名
 -> person_tbl から;

GROUP BY を使用してテーブル内の一意のデータを読み取ることもできます。

mysql> 姓、名を選択
 -> person_tbl から
 -> GROUP BY (姓、名);

重複排除

テーブル内の重複データを削除する場合は、次の SQL ステートメントを使用できます。

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex FROM person_tbl GROUP BY (last_name, first_name, sex);
mysql> テーブル person_tbl を削除します。
mysql> ALTER TABLE tmp の名前を person_tbl に変更します。

もちろん、データテーブルに INDEX (インデックス) と PRIMAY KEY (主キー) を追加して、テーブル内の重複レコードを削除することもできます。方法は次のとおりです。

mysql>テーブル person_tbl を無視する変更
 -> 主キーを追加します (last_name, first_name);

以上がMySQLの重複データの処理方法（防止と削除）の詳細です。MySQLの重複データの処理の詳細については、123WORDPRESS.COMの他の関連記事にも注目してください！

以下もご興味があるかもしれません:

重複したMySQLレコードを現場でチェックし、処理する実践的な記録
重複データの処理に関するMySQL学習ノート
MySQLデータの同時更新を処理する方法
MySQLの実行原理、論理階層化、データベース処理エンジンの変更について詳しく説明します
MySQLが大量のデータを処理する際にクエリ速度を最適化するいくつかの方法
MySQLデータ処理のソートと追加、削除、変更の操作の説明

<<: JavaScript 関数型プログラミングの基礎

>>: MySQLでユーザーを作成し、権限を管理する方法

MySQL の重複データの処理方法 (防止と削除)

MySQL 最適化のヒント: 重複削除の実装方法の分析 [数百万のデータ]

Docker 環境で JMeter+Grafana+influxdb ビジュアルパフォーマンス監視プラットフォームを構築するチュートリアル

Docker環境でMySQLを実行し、Binlogを有効にしてマスタースレーブ同期を構成する方法

HarborをベースにしたDocker専用倉庫の構築方法

Vue2.xは、ユーザーのログインと終了を実装するためにルーティングナビゲーションガードを設定します。

react-beautiful-dnd はコンポーネントのドラッグアンドドロップ機能を実装します

指定されたIEブラウザのレンダリング方法の詳細な理解

MySQLの文字列インターセプト関連関数の概要

HTML  コメントタグの役割の詳細な分析

MySQL 外部キー (FOREIGN KEY) の使用例の詳細な説明

推薦する

LINUX ポートが占有されているかどうかを確認します

MySQL 5.7.13 のインストールと設定方法のグラフィックチュートリアル (win10 64 ビット)

Windows (x86、64 ビット) で MySQL 5.7.17 無料インストールバージョンをアップグレードするための詳細なチュートリアル

デジタル時計効果を実現するJavaScript

Ubuntu 16.04 で Python 3 を使用して Django プロジェクトを作成し、実行する方法

MySQL は正常に起動するがポートをリッスンしない場合の解決策

MySQL 数千万のビッグデータに対するSQLクエリ最適化の知識ポイントのまとめ

CSS プロパティ display:flow-root 宣言を 1 つの記事でマスターする

Vue要素と多言語切り替えの詳細な説明

Linux 上で Docker コンテナを作成、一覧表示、削除する方法の概要

Prometheusコンテナのデプロイメントのための実用的なソリューション

Windows 10 でカスタムドメイン名をバインドするように Hexo と GitHub を構成する方法

Docker-compose インストール db2 データベース操作

Flexboxレイアウトの最もシンプルなフォーム実装

よくある CSS のヒントと経験談 11 選