序文 group by と distinctive のパフォーマンス比較について: インターネット上の結論は次のとおりです。distinct はインデックスなしの少量データではパフォーマンスが良く、group by は大量データではパフォーマンスが良くなります。インデックス付きの group by の方がパフォーマンスが良いです。インデックスを調べるとき、グループ化の種類が少ないほど、distinct は高速になります。導き出された結論をオンラインで検証します。 準備フェーズ中にクエリキャッシュを無効にする MySQL でクエリ キャッシュが設定されているかどうかを確認します。テスト結果に影響を与えないようにするには、クエリ キャッシュをオフにする必要があります。 '%query_cache%' のような変数を表示します。 クエリ キャッシュが有効かどうかを確認します。これは、
グローバル query_cache_size を 0 に設定します。 方法 3: クエリ キャッシュをオフにしたくない場合は、 現在のテスト環境では、query_cache_type=2 はオンデマンドのクエリ キャッシュを意味します。デフォルトのクエリ モードはキャッシュしません。キャッシュが必要な場合は、クエリ ステートメントに データ準備 テーブルt0には 存在する場合はテーブルを削除します t0; テーブルt0を作成( id bigint 主キー auto_increment、 varchar(255) は null ではない ) エンジン=InnoDB デフォルト文字セット=utf8mb4 照合=utf8mb4_bin; 1 2 3 4 5 プロシージャ insert_t0_simple_category_data_sp を削除します。 区切り文字 // プロシージャ insert_t0_simple_category_data_sp(IN num int) を作成します。 始める @i = 0 に設定します。 @i < num の間 t0(a) に値を挿入します(truncate(@i/1000, 0)); @i = @i + 1 と設定します。 終了しながら; 終わり // insert_t0_simple_category_data_sp(100000) を呼び出します。 テーブルt1には 存在する場合はテーブル t1 を削除します。 t0 のようにテーブル t1 を作成します。 1 2 プロシージャ insert_t1_complex_category_data_sp を削除します。 区切り文字 // プロシージャ insert_t1_complex_category_data_sp(IN num int) を作成します。 始める @i = 0 に設定します。 @i < num の間 t1(a) に値を挿入します(truncate(@i/10, 0)); @i = @i + 1 と設定します。 終了しながら; 終わり // insert_t1_complex_category_data_sp(10000) を呼び出します。 t2 テーブルには 存在する場合はテーブルを削除します t2; t1 と同じようにテーブル t2 を作成します。 1 2 プロシージャ insert_t2_complex_category_data_sp を削除します。 区切り文字 // プロシージャ insert_t2_complex_category_data_sp(IN num int) を作成します。 始める @i = 0 に設定します。 @i < num の間 t1(a) に値を挿入します(truncate(@i/10, 0)); @i = @i + 1 と設定します。 終了しながら; 終わり // insert_t2_complex_category_data_sp(5000000) を呼び出します。 テストフェーズ 少量のデータを検証する インデックスされていない プロファイリングを 1 に設定します。 t0 から別の a を選択する。 プロフィールを表示します。 t0 から a を選択し、 a でグループ化します。 プロフィールを表示します。 テーブル t0 を変更し、インデックス `a_t0_index`(a) を追加します。 これは、型数が少なくデータが少ない場合、インデックスなしでは、distinct と group by のパフォーマンスはほぼ同じであることを示しています。 インデックスを追加 テーブル t0 を変更し、インデックス `a_t0_index`(a) を追加します。 上記のようなクエリを実行した後 これは、タイプ数が少なくデータが少ない場合、インデックスを追加すると、distinct と group by のパフォーマンスがほぼ同じであることを示しています。 少量で多くの種類のデータがインデックス化されていないことを確認する 上記と同様のインデックスなしのクエリを実行した後 このことから、少量のデータで種類が多く、インデックスがない場合、distinct のパフォーマンスは group by よりもわずかに高いものの、その差は大きくないことがわかります。 インデックスを追加 テーブル t1 を変更し、インデックス `a_t1_index`(a) を追加します。 同様のインデックスなしのクエリを実行した後 このことから、データ量が少なく型が多い場合、インデックスを追加すると、distinct と group by のパフォーマンスはほぼ同じであることがわかります。 大量のデータを検証する インデックスされていない count(1)をt2から選択します。 上記と同様のインデックスなしのクエリを実行した後 これは、多くの種類のデータが大量にあり、インデックスがない場合、DISTINCT の方が GROUP BY よりもパフォーマンスが優れていることを示しています。 インデックスを追加 テーブル t2 を変更し、インデックス `a_t2_index`(a) を追加します。 上記の同様のインデックスクエリを実行した後 これは、多くの種類の大量のデータの場合、インデックスを追加すると、distinct と group by のパフォーマンスがほぼ同じであることを示しています。 要約する | パフォーマンス比 | 数量が少なく、種類も少ない | 少量、多品種 | カテゴリの数が多いインデックスなしやや優れている明確な方が優れているインデックスありやや異なるやや異なるやや異なるやや異なるやや異なる |
---|
<<: Tencent Cloud Serverをゼロから導入する方法
>>: Vue+echarts でプログレスバーのヒストグラムを実現
Hiveのインストールディレクトリで、confディレクトリに入り、hive-site.xmlファイル...
Mac を返却して以来、元のラップトップは使用されていません。このラップトップの構成は非常に良好で...
Apache Superset は、データを表示および探索する方法を提供する強力な BI ツールで...
CSS3 パターン ギャラリーこの CSS3 パターン ライブラリには、純粋な CSS3 を使用して...
1 MySQLの自動コミット設定MySQL はデフォルトで自動的にコミットします。つまり、各 DML...
目次序文シナリオシミュレーション要約する序文最近、sql_mode の話題については何度も話し合われ...
目次1. インストール1. はじめに3. インターフェースルートアドレス4. 使用例4.1 ダウンロ...
1.1 ディレクトリ構造の構築この操作は、nginx+mysql+tomcat+dbのディレクトリ構...
1. refがコピーされ、ビューが更新されますrefを使用してオブジェクトのプロパティ値をレスポンシ...
イメージをダウンロードします(オプションの手順です。省略した場合は、手順 3 と 4 で自動的にイン...
まず問題の説明から始めましょう:同じページで、1 つのタブに float:left が必要で、もう ...
目次序文Websocketの使用Websocketオブジェクトの構築Websocket ステータスW...
MySQL sql_modeの適切な設定sql_mode は見落とされやすい変数です。デフォルト値は...
前回の記事で、MySQL ステートメントの最適化には限界があると述べました。MySQL ステートメン...
目次1. SQL最適化の一般的な手順1. SQL実行計画の分析を説明する2. プロフィール分析を表示...