MySQLにデータを素早くインポートする方法

MySQLにデータを素早くインポートする方法

序文:

日々の勉強や仕事の中で、データをエクスポートする必要に迫られることがよくあります。たとえば、データの移行、データの回復、新しいスレーブ データベースの作成などです。これらの操作には、大量のデータのインポートが伴う場合があります。インポートの進行が遅く、コンピューターのファンが激しく回転しているときがあり、非常にイライラします。実際、インポートを高速化できるヒントがいくつかあります。この記事では、データをすばやくインポートする方法について説明します。

注: この記事では、論理バックアップによって生成された SQL スクリプトをすばやくインポートする方法のみを説明し、他のファイル形式については現時点では説明しません。

1. インポートするファイルのサイズを小さくしてみてください

まず、提案させていただきたいのですが、データのエクスポートやインポートを行う際は、MySQL に付属しているコマンドラインツールを使用するようにし、Navicat や workbench などのグラフィカルツールは使用しないでください。特に大量のデータを扱う場合、MySQL の組み込みコマンドラインツールを使用したエクスポートとインポートは、Navicat などのグラフィカルツールを使用するよりも数倍高速です。さらに、Navicat などのグラフィカルツールは、大量のデータに対して操作を実行すると簡単に停止する可能性があります。以下は、MySQL に付属するコマンドライン ツールを使用してインポートおよびエクスポートを行う方法の簡単な紹介です。

# インスタンス全体をエクスポートします。mysqldump -uroot -pxxxxxx --all-databases > all_database.sql

# 指定されたライブラリをエクスポートします mysqldump -uroot -pxxxxxx --databases testdb > testdb.sql

# 指定されたテーブルをエクスポートします mysqldump -uroot -pxxxxxx testdb test_tb > test_tb.sql

#指定されたSQLファイルをインポートします(testdbライブラリへのインポートを指定します)
mysql -uroot -pxxxxxx testdb < testdb.sql

インポートされた SQL スクリプトのほとんどは、最初にデータベースとテーブルを作成し、次にデータを挿入します。最も時間のかかる部分は、おそらくデータの挿入です。ファイル サイズを縮小するには、拡張挿入メソッド、つまり insert into table_name values ​​(),(),(),...,(); のように複数の行をまとめてバッチ挿入する方法を使用することをお勧めします。拡張挿入を使用すると、ファイル サイズが大幅に小さくなり、1 つずつ挿入する場合よりも挿入速度が数倍速くなります。 mysqldump を使用してエクスポートされたファイルは、デフォルトでバッチ挿入方式を使用します。エクスポート時に、--skip-extended-insert パラメータを使用して、1 つずつ挿入するように変更できます。以下では、1,000 万のデータ ポイントを含むデータ テーブルを例に、さまざまな方法でエクスポートされたファイルを挿入する速度をテストします。

上図からわかるように、拡張挿入を使用して SQL スクリプトをインポートするには約 10 分かかりますが、SQL スクリプトを 1 つずつインポートすると時間がかかりすぎて、約 1 時間経ってもまだ完了しません。2G を超えるテキストのインポートが 1 時間以上完了せず、作成者は待ちきれず手動でキャンセルしますか? ただし、複数のエントリをまとめて挿入すると、データを 1 つずつ挿入するよりも数倍の時間を節約できることがわかります。

2. インポートを高速化するためにパラメータを変更してみる

MySQL には、innodb_flush_log_at_trx_commit と sync_binlog という有名な「ダブル ワン」パラメータのペアがあります。セキュリティ上の理由から、これら 2 つのパラメータのデフォルト値は 1 です。スクリプトをすばやくインポートするために、これら 2 つのパラメータを一時的に変更できます。以下は、これら 2 つのパラメータの簡単な紹介です。

innodb_flush_log_at_trx_commitのデフォルト値は1で、0、1、または2に設定できます。

innodb_flush_log_at_trx_commit が 0 に設定されている場合、ログ バッファは 1 秒ごとにログ ファイルに書き込まれ、同時にログ ファイルのフラッシュ操作が実行されます。このモードでは、トランザクションがコミットされると、ディスクへの書き込み操作はアクティブにトリガーされません。
innodb_flush_log_at_trx_commit が 1 に設定されている場合、MySQL はトランザクションがコミットされるたびにログ バッファー内のデータをログ ファイルに書き込み、ディスクにフラッシュします。
innodb_flush_log_at_trx_commit が 2 に設定されている場合、MySQL はトランザクションがコミットされるたびにログ バッファー内のデータをログ ファイルに書き込みます。ただし、フラッシュ操作は同時に実行されません。このモードでは、MySQL は 1 秒ごとにフラッシュ操作を実行します。

sync_binlogのデフォルト値は1で、[0,N)に設定できます。
sync_binlog = 0 の場合、オペレーティング システムのその他のファイルをフラッシュするメカニズムと同様に、MySQL はディスクに同期せず、オペレーティング システムに依存してバイナリ ログを更新します。
sync_binlog = N (N>0) の場合、MySQL はバイナリ ログを N 回書き込むたびに fdatasync() 関数を使用してバイナリ ログをディスクに同期します。

これら 2 つのパラメータはオンラインで変更できます。すばやくインポートしたい場合は、次の手順に従ってください。

# 1. MySQL コマンドラインを入力して、これら 2 つのパラメータを一時的に変更します。set global innodb_flush_log_at_trx_commit = 2;
グローバルsync_binlogを2000に設定します。

# 2. SQLスクリプトを実行してmysqlをインポートします -uroot -pxxxxxx testdb < testdb.sql

# 3. インポートが完了したら、パラメータを元に戻して、global innodb_flush_log_at_trx_commit = 1 に設定します。
グローバルsync_binlogを1に設定します。

新しいスレーブ データベースを作成する必要がある、または binlog を生成する必要がないという別のシナリオもあります。この場合、SQL スクリプトをインポートするときに一時的に binlog を記録しないように設定できます。スクリプトの先頭に set sql_log_bin=0; を追加してからインポートを実行すると、プロセスがさらに高速化されます。 MySQL インスタンスで binlog が有効になっていない場合は、このステートメントを実行する必要はありません。

要約:

この記事では主にデータを素早くインポートする方法を紹介します。データのロードやマルチスレッド挿入用のプログラムの作成など、データを素早くインポートする方法は他にもあるかもしれません。この記事で説明する方法は、SQL スクリプトを手動でインポートする場合にのみ適しています。以下は、この記事で説明した方法の概要です。

  1. エクスポートとインポートには、MySQL に付属するコマンドライン ツールを使用します。
  2. 拡張挿入メソッドを使用して、複数の値を一度に挿入します。
  3. innodb_flush_log_at_trx_commit および sync_binlog パラメータを一時的に変更します。
  4. binlog を閉じるか、一時的に binlog の記録を停止します。

実際には、最初にインデックスを作成せず、データを挿入した後にインデックスを追加する、最初にテーブルを MyISAM または MEMORY エンジンに変更し、インポートが完了した後に InnoDB エンジンに変更するなど、他の解決策もいくつかあります。しかし、これら 2 つの方法は実装が面倒であり、その効果も不明です。上記の方法は、著者の個人的な経験に基づく要約に過ぎず、包括的ではない可能性があります。追加していただいても結構です。

上記は、MySQL にデータを素早くインポートする方法の詳細です。MySQL へのデータのインポートの詳細については、123WORDPRESS.COM の他の関連記事に注目してください。

以下もご興味があるかもしれません:
  • MySQLからHiveにさらにデータをインポートするためのソリューション
  • MySQL 4 データをインポートする方法
  • Navicat を使用して MySQL データベースをエクスポートおよびインポートする方法
  • JavaはMYSQL LOAD DATA LOCAL INFILEを使用して大量のデータをMySQLにインポートします。
  • MySQL コマンドラインのエクスポートとデータベースインスタンスのインポートの詳細な説明
  • Wampserver で MySQL データベースをインポートする手順
  • MySQL コマンドラインによるデータベースのエクスポートとインポート
  • mysqldump を使用してデータをインポートし、mysqldump 増分バックアップを実行します (mysqldump の使用方法)
  • MYSQLにデータをインポートするいくつかの方法
  • php.ini を変更して、Mysql インポート データベース ファイルの変更方法の最大制限を実装します。
  • .Net Core を使用して数千万のデータを MySQL にインポートする手順

<<:  jQueryは従業員情報の追加と削除の機能を実装します

>>:  Windows 10 は使いにくいです。Ubuntu をカスタマイズするにはどうすればいいでしょうか?

推薦する

MySQL パフォーマンス最適化のための魔法のツール、Explain の基本的な使用分析

導入MySQL には、SELECT ステートメントを分析し、開発者が最適化できるように SELECT...

QT が MYSQL データベースに接続するための詳細な手順

最初のステップは、対応するデータベースモジュール(sql)をプロジェクトファイル( .pro )に追...

CentOS 7 パスワードを忘れた場合の解決プロセス図

必要Windows システムでも Linux システムでも、さまざまな理由でパスワードを忘れてしまう...

Vueプロジェクトの最適化とパッケージ化の詳細な説明

目次序文1. ルーティングの遅延読み込み1. ルートの遅延読み込みが必要なのはなぜですか? 2. ル...

Linux環境にMySQLデータベースをインストールする詳細なチュートリアル

1. データベースをインストールする1) yum -y install mysql-server (...

完全バックアップとポイントインタイムバックアップにmysqldumpを使用する方法

Mysqldump は MySQL の論理バックアップに使用されます。高速ではありませんが、柔軟性が...

vscode dockerプラグインのdocker.socket権限問題を解決する

解決策: システム内のすべての .vscode 関連プロセスを終了します (または、remote-s...

.htaccess を使用して特定の IP からの Web サイトへのアクセスを禁止する方法

序文コストを考慮して、ほとんどのウェブマスターは、多数の小規模なウェブサイト用にサーバーを個別に購入...

テーブルを使用する場合と CSS を使用する場合 (経験の共有)

TW のメインテキスト ページは、以前は小さなモニターと低解像度のユーザーを考慮して幅が 850 ピ...

MySQLアカウントのパスワード変更方法(概要)

序文:データベースを日常的に使用すると、パスワードが単純すぎて変更する必要がある場合、パスワードの有...

process.env.NODE_ENV 本番環境モードを設定する方法

始める前に、process.env.NODE_ENV にはデフォルトで開発と本番の 2 つの状態しか...

VUE ユニアプリの条件付きコーディングとページレイアウトに関する簡単な説明

目次条件付きコンパイルページレイアウト要約する条件付きコンパイル条件付きコンパイルでは、特別なコメン...

jsを使用してスライダーをドラッグする効果を実現します

この記事では、jsでスライダーをドラッグする方法の具体的なコードを参考までに共有します。具体的な内容...

Linux での MySql centos7 のバイナリコンパイルとインストールに関するチュートリアル

// これをインストールするのに丸一日かかったので、記録するためにメモを書きました。 //何か問題が...

Linux Bash スクリプトを使用してユーザーを識別する方法の例

多くの場合、bash スクリプト内またはスクリプト自体内で直接 sudo を使用してコマンドを実行す...