MySQLカバーインデックスの利点

一般的な提案は、WHERE 条件のインデックスを作成することですが、これは実際には一方的です。インデックスは、WHERE 条件だけでなく、すべてのクエリに対して設計する必要があります。インデックスはデータ行を効率的に見つけるのに役立ちますが、MySQL ではインデックスを使用して、データ行をまったく読み取ることなく列データを取得することもできます。結局のところ、インデックスのリーフノードには、インデックスに対応する値が含まれます。必要なデータを取得するにはインデックスを読み取るだけでよいのに、なぜ行を読み取る必要があるのでしょうか?インデックスにクエリのすべてのデータが含まれている場合、そのインデックスはカバーリングインデックスと呼ばれます。

カバーリングインデックスは非常に強力なツールとなり、パフォーマンスを大幅に向上させることができます。データを読み取る必要はなく、インデックスのみを読み取る必要がある場合を考えてみましょう。

インデックス値は通常、行のストレージスペース全体よりもはるかに小さいため、MySQL はインデックス値のみを読み取る場合、少量のデータしか読み取ることができません。これはキャッシュワークロードにとって特に重要です。応答時間の大部分はデータのコピーに費やされます。ディスク I/O についても同じことが言えます。インデックスデータは行データよりもストレージスペースをはるかに少なく占めるため、I/O 負荷とメモリ使用量がさらに節約されます (MyISAM エンジンでは、インデックスをパッケージ化してストレージスペースを小さくできるため、これはさらに重要です)。
インデックスはインデックス値の順序で保存されるため、I/O アクセススパンでは、ランダムなディスクの場所から行データを取得する場合よりも I/O 頻度が少なくなります。 MyISAM や Percona XtraDB などの一部のストレージエンジンでは、OPTIMIZE を使用してテーブルを最適化し、完全に順序付けられたインデックスを取得することもできます。これにより、単純な範囲クエリで完全に順次アクセスが使用されるようになります。
MyISAM などの一部のストレージエンジンは、MySQL メモリ内のインデックスのみをキャッシュします。オペレーティングシステムは MyISAM のデータをキャッシュするため、通常、アクセスにはシステムコールが必要です。これは、特にシステムコールがデータにアクセスするための最もコストのかかる方法であるキャッシュがロードされるシナリオでは、パフォーマンスに大きな影響を与える可能性があります。
InnoDB のクラスター化インデックスにより、カバーリングインデックスは InnoDB にとって非常に役立ちます。 InnoDB のセカンダリインデックスは、行の主キー値をリーフノードに格納します。したがって、セカンダリインデックスはクエリをカバーし、プライマリキークエリを回避します。

いずれの場合も、最も典型的なのは、インデックス付き列のみを含むクエリのコストが、データ行を検索するコストよりもはるかに低くなることです。クラスター化インデックスは単なるインデックスの種類ではないことに注意することが重要です。クラスター化インデックスには、インデックスが付けられたデータ列に対応する値を格納する必要があります。ハッシュ、空間、およびフルテキストインデックスにはこれらの値は保存されないため、MySQL ではクエリをカバーするためにバイナリツリーのみを使用できます。さらに、異なるストレージエンジンは異なる方法でカバーリングインデックスを実装しており、すべてのストレージエンジンがカバーリングインデックスをサポートしているわけではありません (たとえば、Memory ストレージエンジンは現在これをサポートしていません)。

クエリ内のインデックスがカバーリングインデックスを使用していることを確認すると、Explain ステートメントの使用時に [Extra] 列に [Using index] が表示されます。たとえば、store_goods テーブルには複数列のインデックス (shop_id、goods_category_id1) があります。 MySQL は、クエリが次の 2 つの列のデータのみを返す場合にインデックスを使用できます。

EXPLAIN SELECT `goods_category_id1`,`shop_id` FROM `store_goods` WHERE 1

インデックスクエリをカバーすると、場合によってはこのような最適化が無効になることがあります。 MySQL クエリオプティマイザーは、クエリを実行するときにインデックスがクエリをカバーするかどうかを判断します。インデックスが WHERE 条件をカバーしているが、クエリ全体をカバーしていないとします。評価の結果、カバーリングインデックスを使用しないことが決定された場合、MySQL 5.5 以前のバージョンでは、データが不要であってもデータ行を直接フェッチし、それらをフィルター処理します。

なぜこのようなことが起こるのか、そしてこの問題を解決するためにクエリを書き直す方法を見てみましょう。最初のクエリは次のようになります。

EXPLAIN SELECT * FROM products WHERE actor='SEAN CARREY' AND title like '%APOLLO%'

この時点での結果は、カバーインデックスではなく通常のインデックスが使用されることです。その理由は次のとおりです。

テーブルからすべての列を読み取り、すべての列をカバーするインデックスがないため、クエリ列をカバーするインデックスはありません。理論的には、MySQL には使用できる別のショートカットがあります。つまり、インデックスでカバーされている列が WHERE 条件で使用されるため、MySQL は最初にこのインデックスを使用して対応する俳優を見つけ、次にその役職が一致するかどうかを確認し、条件を満たすすべてのデータ行を読み取ることができます。
ストレージエンジン API の以前のバージョン (MySQL 5.5 より前のバージョン) では、MySQL はインデックスで LIKE 操作を使用できず、単純な比較操作 (=、IN、>=) のみをサポートします。 MySQL では、プレフィックス一致の LIKE クエリを比較演算に変換できるため、インデックスで使用できます。ただし、先頭のワイルドカード文字 (つまり、LIKE の先頭の %) により、ストレージエンジンは一致条件を評価できなくなります。したがって、MySQL はインデックス値ではなく行データを比較のために取得します。

インデックスを巧みに組み合わせてクエリを書き換えることで、これを実現する方法があります。インデックスを (artist、title、prod_id) に拡張し、クエリを次のように書き換えることができます。

説明選択 * 
製品から
	参加する （
    prod_idを選択
    製品から
    俳優が「ショーン・キャリー」でタイトルが「%アポロ%」の場合
 ) AS t1 ON (t1.prod_id=products.prod_id)

列へのアクセスを遅らせるため、これを「遅延結合」と呼びます。クエリの最初のフェーズでは、サブクエリ内で一致する行が見つかると、MySQL はカバーインデックスを使用します。クエリ全体でカバーされているわけではありませんが、何もないよりはましです。

この最適化の有効性は、WHERE 条件で見つかったデータの行数によって異なります。製品テーブルに数百万行のデータが含まれていると仮定します。合計 100 万行のデータを使用して、これら 2 つのクエリのパフォーマンスを比較できます。

ケース 1: 俳優「SEAN CARREY」の商品は 30,000 個あり、そのうち 20,000 個にタイトル「APOLLO」があります。
ケース 2: 俳優「SEAN CARREY」の商品は 30,000 個あり、そのうち 40 個に「APOLLO」というタイトルが付いています。
ケース3: 俳優「SEAN CARREY」の商品は50件あり、そのうち10件のタイトルが「APOLLO」です。

比較結果を次の表に示します。

データセット	元のクエリ	最適化されたクエリ
最初のケース	5qps	5qps
2番目のケース	7qps	35qps
3番目のケース	2400qps	2000qps

結果は次のように説明されます。

最初のケースでは、クエリは非常に大きな結果セットを返すため、最適化の効果は見られません。ほとんどの時間はデータの読み取りと送信に費やされます。
2 番目のケースでは、カバーインデックスを使用したサブクエリフィルタリングによって結果セットが小さくなり、パフォーマンスが 5 倍向上します。この効果の理由は、30,000 行のデータセットと比較して、読み取る必要がある行が 40 行だけであるためです。
3 番目のケースでは、サブクエリが失敗していることがわかります。カバーインデックスフィルタリングによって返される結果セットが小さすぎるため、データテーブルから直接データを読み取る場合よりもサブクエリのコストが高くなります。

ほとんどのストレージエンジンでは、インデックスはインデックスの一部である列へのアクセスのみをカバーできます。ただし、InnoDB は実際にはさらに最適化を行います。 InnoDB のセカンダリインデックスがリーフノードに主キーの値を格納すると考えてください。つまり、InnoDB のセカンダリインデックスには、InnoDB がカバーインデックスを使用するのに役立つ追加の列が実際に存在します。たとえば、sakila.actor テーブルは InnoDB を使用し、last_name にインデックスがあるため、この列がインデックスの一部ではない場合でも、このインデックスは主キー actor_id に基づくクエリをカバーできます。

EXPLAIN SELECT 俳優ID、姓
sakila.actor から last_name = 'HOPPER'

上記はMySQLカバーリングインデックスの利点の詳細な内容です。MySQLカバーリングインデックスの詳細については、123WORDPRESS.COMの他の関連記事に注目してください。

以下もご興味があるかもしれません:

MySQLはカバーインデックスを使用してテーブルリターンを回避し、クエリを最適化します。
MySQLカバーインデックスの使用例
MySQLのカバーインデックスに関する知識ポイントのまとめ
インデックスとテーブルリターンをカバーするMySQLの使い方
MySQLカバーインデックスの詳しい説明
MySQL パフォーマンス最適化の事例 - インデックス共有のカバー
MySQL パフォーマンス最適化のケーススタディ - インデックスと SQL_NO_CACHE をカバー

<<: JavaScriptはXiaomi Mall公式サイトの完全なページ実装プロセスを模倣します

>>: border-image を使用してテキストバブルの境界線を実装する方法のサンプルコード

MySQLカバーインデックスの利点

VUEプロジェクトでXSS攻撃に遭遇した実体験

Dockerでmongodbデータベースを使用するための実装コード

WeChatミニプログラムでEchartとサブパッケージを使用するための完全な手順

React 非親子コンポーネントパラメータ渡しのサンプルコード

MySQL テーブルの断片化を解消し、スペースを再利用する方法

node_modulesを削除して再インストールする方法

npm グローバルモジュールのデフォルトのインストールパスを変更するためにノードのインストールをカスタマイズする手順

Zookeeper 不正アクセステストの問題

XHTML 入門チュートリアル: リストタグの使用

Linux の wget コマンドの詳細な紹介

推薦する

MySQL DDL による同期遅延を解決する方法

Vueのメソッドとプロパティの詳細な説明

Linuxサービスの監視と運用および保守

Docker 階層化パッケージを使用して Spring Boot を設定する方法

Vue+ElementUI で超大規模なフォーム例を処理する方法

Centos7.3 に mysql5.7.18 をインストールするための詳細なチュートリアル

Docker デプロイメント RabbitMQ コンテナ実装プロセス分析

CentOS 8にdockerをインストールする最も詳細な方法

Ubuntu 20.04 に Xrdp サーバー (リモートデスクトップ) をインストールする方法

MySQL で 1000 万件のレコードをすばやくクエリする方法

HTML に基づいてページを更新せずにフォーム送信を実装する

JSで実施された機雷掃海プロジェクトの概要

WMLタグの概要

MySQL 2級コンピュータ試験共通テストポイント 8つのMySQLデータベース設計最適化方法

MySQL GTID の総合概要