MySQLのCOUNT(*)のパフォーマンスについてお話しましょう

MySQLのCOUNT(*)のパフォーマンスについてお話しましょう

序文

基本的に、職場のプログラマーは、count(*)、count(1)、または count(primary key) を使用して、データベース テーブルの行数をカウントします。これらの違いとパフォーマンスを理解していますか?

実際、開発プロセス中に、プログラマーが大きなテーブル内の行の総数を数えることは、非常に時間のかかる作業です。では、より速く数えるにはどの方法を使用すればよいでしょうか?

次に、MySQL で総行数をカウントする方法とパフォーマンスについて説明します。

count(*)、count(1)、count(主キー)のうちどれが速いでしょうか?

1. テーブルを作成し、実験テスト用に 1,000 万件のレコードを挿入します。

# テストテーブルを作成する CREATE TABLE `t6` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `name` varchar(50) NOT NULL,
 `status` tinyint(4) NOT NULL、
 主キー (`id`)、
 キー `idx_status` (`status`)
)ENGINE=InnoDB デフォルト文字セット=utf8;

# 1000w データを挿入するストアド プロシージャを作成する CREATE PROCEDURE insert_1000w()
始める
  i INT を宣言します。
  i=1 を設定します。
  i<=10000000の場合
    t6(name,status) に VALUES('god-jiang-666',1) を挿入します。
    i=i+1 を設定します。
  終了しながら;
終わり;

#ストアド プロシージャを呼び出して 1,000 万行のデータを挿入します。call insert_1000w();

2. 実験結果を分析する

# 0.572秒かかりました select count(*) from t6; 

ここに画像の説明を挿入

# 0.572秒かかりました select count(1) from t6; 

ここに画像の説明を挿入

# 0.580秒かかりました select count(id) from t6; 

ここに画像の説明を挿入

# 0.620秒かかりました select count(*) from t6 force index (primary); 

ここに画像の説明を挿入

上記の実験から、 count(*) と count(1) が最も速く、次に count(id) が続き、count が必須の主キーを使用する場合に最も遅いことがわかります。

それぞれの実行プランをテストし続けましょう。

select count(*) from t6; を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

t6からcount(1)を選択することを説明する。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

t6からcount(id)を選択する方法を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

select count(*) from t6 force index (primary); を説明します。
警告を表示します。 

ここに画像の説明を挿入

ここに画像の説明を挿入

上記の実験から、次の 3 つの点がわかります。

  1. MySQL クエリ オプティマイザーは count(*) を count(0) に書き換え、idx_status インデックスを選択します。
  2. count(1)とcount(id)はどちらもidx_statuxインデックスを選択します。
  3. フォースインデックス(プライマリ)を追加した後、強制インデックスが使用されます。

この idx_status は、セカンダリ補助インデックス ツリーに相当します。その目的は、InnoDB が count(*) を処理するときに、補助インデックス ツリーがある場合は、補助インデックス ツリーを優先して行の総数をカウントすることを示すことです。

count(*) が補助インデックス ツリーを優先するという結論を確認するために、次の実験を続けましょう。

# idx_statusインデックスを削除し、count(*)の実行を続行します。
テーブル t6 を変更してインデックス idx_status を削除します。

select count(*) from t6; を説明します。 

ここに画像の説明を挿入

上記の実験から、補助インデックス ツリー idx_status が削除された場合、count(*) は主キー インデックスの使用を選択することがわかります。結論としては、 count(*) は補助インデックスを優先します。補助インデックスがない場合は、主キー インデックスが使用されます。

count(*) がセカンダリインデックスを優先するのはなぜですか?

MySQL 5.7.18 より前では、InnoDB はクラスター化インデックスをスキャンして count(*) ステートメントを処理していました。

MySQL 5.7.18 以降、InnoDB は利用可能な最小のセカンダリ インデックスをトラバースして COUNT(*) ステートメントを処理します。セカンダリ インデックスが存在しない場合は、クラスター化インデックスがスキャンされます。

新しいバージョンでは、count(*) の処理にセカンダリ インデックスが使用されるのはなぜですか?

InnoDB セカンダリ インデックス ツリーのリーフ ノードには主キーが格納され、主キー インデックス ツリーのリーフ ノードにはデータの行全体が格納されるため、セカンダリ インデックス ツリーは主キー インデックス ツリーよりも小さくなります。したがって、クエリ オプティマイザーはコストを考慮してセカンダリ インデックスを優先します。したがって、インデックス count(*) は count(主キー) よりも高速です。

要約する

この記事の結論はcount(*)=count(1)>count(id)です。

主キーインデックスがないと count(id) が遅くなるのはなぜですか? count(id) は主キーを取得し、それが空かどうかを確認してから累積する必要があるため、コストが高くなります。

Count(*) はすべての NOT NULL および NULL フィールドをカウントしますが、count(id) は NULL フィールドをカウントしません。そのため、テーブルを構築するときは NOT NULL を使用し、デフォルトを空にするようにする必要があります。

最後に、将来的にデータベース テーブルの行数を合計したい場合は、count(*) または count(1) を大胆に使用できます。

参考文献

  • 「ハイパフォーマンス MySQL」(第 3 版)の第 6 章 COUNT() クエリの最適化
  • 「MySQL 実践 45 講義」Lin Xiaobin 著

MySQL COUNT(*)のパフォーマンスに関するこの記事はこれで終わりです。MySQL COUNT(*)の詳細については、123WORDPRESS.COMの以前の記事を検索するか、以下の関連記事を引き続き参照してください。今後とも123WORDPRESS.COMをよろしくお願いいたします。

以下もご興味があるかもしれません:
  • 大規模な MySQL テーブルに対する count() の実装を最適化しました
  • MySQL の集計関数 count の使用法とパフォーマンスの最適化テクニック
  • MySQL の InnoDB におけるカウント最適化の問題の共有
  • MySQL の count 関数の正しい使い方の詳細な説明
  • MySQLの行数カウントに関する簡単な説明
  • MySQL カウントを向上させる方法のまとめ
  • MySQL でのフィルター条件なしのカウントの詳細な説明
  • MySQL における count(*)、count(1)、count(col) の違いのまとめ
  • 複数のテーブルでの MySQL カウント データ例の詳細な説明
  • MySQL COUNT関数の使用と最適化

<<:  HTML テキスト ボックスの入力を数字と小数点のみに制限する

>>:  非ルートユーザーを使用してDockerコンテナでスクリプト操作を実行する

推薦する

MySQLのスリープ関数の特殊現象例の詳しい説明

序文MySQL のスリープ システム機能は、実用的な適用シナリオが少なく、通常は実験的なテストに使用...

pt-heartbeat を使用して MySQL レプリケーションの遅延を監視する方法の詳細な説明

pt-ハートビートデータベースがマスターとスレーブ間で複製される場合、複製ステータスとデータ遅延は非...

Mapper SQL ステートメント フィールドとエンティティ クラス属性名の関係は何ですか?

背景: 1. データベースに通知テーブルがある あなたは見ることができますgmt_create、通知...

Dockerリンクはコンテナの相互接続を実現します

目次1.1. IP経由のコンテナ間のネットワークアクセス1.2. コンテナ名またはコンテナIDによる...

Vue の this.$router と this.$route の違いと push() メソッド

公式文書には次のように記されている。ルーターを挿入することで、どのコンポーネントでも this.$r...

OpenSSL を使用した Kubernetes 証明書の生成の概要

Kubernetes は、基本認証、トークン認証、CA 認証の 3 種類の認証をサポートしています。...

良い広告にはどのような特徴が必要ですか?

広告業は人間であることに似ていると言う人がいます。これは本当です。優れた広告には、優れた人間と同じよ...

CSSは、他のレイヤーを変更せずに、多層ネスト構造の最外層を回転させる効果を実現します。

次のようなシナリオがあります。円形のコンテナで、最も外側のコンテナの背景が円弧になっています。内側の...

Docker デプロイメント RabbitMQ コンテナ実装プロセス分析

1. イメージをプルするまず、次のコマンドを実行して、イメージをローカル コンピューターにダウンロー...

CSS セレクタのグループ化の簡単な分析

セレクタのグループ化h2 要素と段落の両方を灰色にしたいとします。これを行う最も簡単な方法は、次のス...

JavaScript 関数はランダムな色の検証コードをカプセル化します (完全なコード)

数字、文字、またはランダムな色の数字と文字の混合で構成される n 桁の確認コード。以下に完全なコード...

MacにMySQLデータベースをインストールする方法を教えます

Mac 用 MySQL をダウンロード: https://downloads.mysql.com/a...

Docker ベースの Tomcat クラスタと Nginx ロード バランシングの展開の概要

目次前面に書かれた1. Ngixnイメージの作成2. Java Web (Tomcat) アプリケー...

特定の MySQL テーブルの完全データと増分データをメッセージ キューに同期する - ソリューション

目次1. 当初の需要2. 解決策3. 運河の導入と設置運河の仕組み建築インストール4. 検証1. 当...

HTMLの行間設定方法と問題点

<p></p> の行間隔を設定するには、style="line-h...