クローラー対策ポリシー ファイルを追加しました: vim /usr/www/server/nginx/conf/anti_spider.conf ファイルの内容 #Scrapyなどのツールによるクロールを無効にする if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) { 403 を返します。 } # 指定された UA または空の UAif によるアクセスを無効にします ($http_user_agent ~ "WinHttp|WebZIP|FetchURL|node-superagent|java/|FeedDemon|Jullo|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|Java|Feedly|Apache-HttpAsyncClient|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|BOT/0.1|YandexBot|FlightDeckReports|Linguee Bot|^$" ) { 403 を返します。 } #GET|HEAD|POST以外の方法によるクロールを無効にする if ($request_method !~ ^(GET|HEAD|POST)$) { 403 を返します。 } #単一のIPをブロックするコマンドは#deny 123.45.6.7です #123.0.0.1 から 123.255.255.254 までのセグメント全体をブロック#deny 123.0.0.0/8 #123.45.0.1 から 123.45.255.254 までの IP 範囲をブロックします #124.45.0.0/16 を拒否します #123.45.6.1から123.45.6.254までのIP範囲をブロックするコマンドは#deny 123.45.6.0/24です # 以下の IP はすべて不正です #deny 58.95.66.0/24; 構成の使用法 サイトのサーバーに導入する # クローラー対策には /usr/www/server/nginx/conf/anti_spider.conf を含める 最後にnginxを再起動します 有効かどうかを確認する YYSpiderのシミュレーション λ curl -X GET -I -A 'YYSpider' https://www.myong.top HTTP/1.1 200 接続が確立されました HTTP/2 403 サーバー: marco/2.11 日付: 2020年3月20日金曜日 08:48:50 GMT コンテンツタイプ: text/html コンテンツの長さ: 146 xソース: C/403 x-リクエストID: 3ed800d296a12ebcddc4d61c57500aa2 Baiduspiderをシミュレートする λ curl -X GET -I -A 'BaiduSpider' https://www.myong.top HTTP/1.1 200 接続が確立されました HTTP/2 200 サーバー: marco/2.11 日付: 2020年3月20日金曜日 08:49:47 GMT コンテンツタイプ: text/html 変化: Accept-Encoding xソース: C/200 最終更新日: 2020年3月18日水曜日 13:16:50 GMT 電子タグ: "5e721f42-150ce" x-リクエストID: e82999a78b7d7ea2e9ff18b6f1f4cc84 クローラーの一般的なユーザーエージェント FeedDemon コンテンツ コレクション BOT/0.1 (JCE 用 BOT) SQL インジェクション CrawlDaddy SQL インジェクション Java コンテンツ コレクション Jullo コンテンツ コレクション Feedly コンテンツ コレクション UniversalFeedParser コンテンツ コレクション ApacheBench cc 攻撃者 Swiftbot 役に立たないクローラー YandexBot 役に立たないクローラー AhrefsBot 役に立たないクローラー YisouSpider 役に立たないクローラー (UC Shenma Search に買収されました。このスパイダーはリリースできます!) jikeSpider 役に立たないクローラーMJ12bot 役に立たないクローラーZmEu phpmyadmin 脆弱性スキャンWinHttp コレクションcc 攻撃EasouSpider 役に立たないクローラーHttpClient tcp 攻撃Microsoft URL コントロール スキャンYYSpider 役に立たないクローラーjaunty wordpress ブラスト スキャナーoBot 役に立たないクローラーPython-urllib コンテンツ コレクションIndy ライブラリ スキャンFlightDeckReports Bot 役に立たないクローラーLinguee Bot 役に立たないクローラー 上記は、UA による Web サイトのクロールを防ぐための Nginx アンチクローラー戦略の詳細です。Nginx アンチクローラーの詳細については、123WORDPRESS.COM の他の関連記事をご覧ください。 以下もご興味があるかもしれません:
|
<<: MySQLのファジークエリのような遅い速度を解決する方法
>>: Web インタビュー: MVC と MVVM の違いと、Vue が MVVM に完全に準拠していない理由
DPlayer.jsビデオプレーヤープラグインは使いやすい主な用途: ビデオの再生、監視の開始、終了...
目次MySQLネイティブレプリケーションに基づくマスター-マスター同期ソリューションGaleraレプ...
インストールインストールするには、次のコマンドを入力します。 // ネプ npm で react-r...
ネットワーク データを読み込むときは、ユーザー エクスペリエンスを向上させるために、通常は円形の読み...
始める前に、process.env.NODE_ENV にはデフォルトで開発と本番の 2 つの状態しか...
この本「グラフィックデザイナーとして成長する」は多くの人が読んでおり、私もオリジナルの PDF 版を...
最近、Docker を使用して Java アプリケーションをデプロイしていたときに、タイムゾーンが間...
最近、vue について読みました。これまで基本的に見落としていた単一ファイル コンポーネントを見つけ...
質問コードにはプロンプトがありません: RN 開発に不慣れな、フロントエンド以外の学生の多くは、「ど...
目次アプリを登録するときに何をすればよいですか?ページを登録するときに通常何をする必要がありますか?...
tomcat の解凍されたディレクトリを開くと、次のディレクトリ構造が表示されます。 1.Tomca...
私は長い間PHPに触れてきましたが、インストール環境は非常に不慣れです。多くの問題に遭遇しました。B...
目次1. ノード、ツリー、仮想DOM 2. 仮想DOM 2.1 データオブジェクトの詳細2.2 制約...
DockerでGit環境を構成する仕事上、Docker 環境で GitLab リポジトリを操作する必...
Ⅰ. 問題の説明: html+css を使用してシンプルなナビゲーション バーを実装します。 **...