英語の単語の出現頻度を数えるtrコマンドの魔法

英語の単語の出現頻度を数えるtrコマンドの魔法

置換を削除したり文字列を削除したりできる tr コマンドは、誰もがよく知っています。 英語では、英語に出現する単語の頻度を数える必要があることがよくあります。従来の方法を使用して計算機を設定し、1つずつ数えると、かなり時間がかかります。このとき、trコマンドを使用して、分割されたスペースを改行文字に置き換え、次にtrコマンドを使用して、いくつかの単語の後のピリオド、カンマ、感嘆符を削除します。まず、置き換えるthis.txtファイルを確認します

ティム・ピーターズ著『Pythonの禅』
美しいものは醜いものより良い。
明示的なものは暗黙的なものよりも優れています。
複雑なものよりシンプルなものの方が良いです。
複雑なものより複雑なものの方が良い。
フラットな方がネストされたよりも優れています。
密集よりも疎集の方が良いです。
読みやすさが重要です。
特別なケースは、ルールを破るほど特別ではありません。
実用性は純粋さに勝りますが。
エラーは決して黙って通過してはなりません。
明示的に沈黙させない限り。
曖昧な状況に直面しても、推測する誘惑を拒否してください。
それを実行する明白な方法が 1 つ (できれば 1 つだけ) あるはずです。
ただし、オランダ人でない限り、その方法は最初は明らかではないかもしれません。
今がやらないよりはましだ。
とはいえ、今より決して良いことはない場合が多いです。
実装を説明するのが難しい場合は、それは悪い考えです。
実装が簡単に説明できる場合は、良いアイデアかもしれません。
名前空間は素晴らしいアイデアです。もっと活用しましょう!

上記のテキストファイルで、テキスト内で最も多く出現する上位10個の単語をカウントしたい場合は、次のコマンドを使用できます。

[root@linux ~]# cat this.txt | tr ' ' '\n' | tr -d '[.,!]' | sort | uniq -c | sort -nr | head -10
10は
8 より良い
8 より
5から
5の
3の
3 しかし
3 決して
3 する
3 1つ

とても便利ですよ!

要約する

以上がこの記事の全内容です。この記事の内容が皆様の勉強や仕事に何らかの参考学習価値をもたらすことを願います。123WORDPRESS.COM をご愛顧いただき、誠にありがとうございます。これについてもっと知りたい場合は、次のリンクをご覧ください。

以下もご興味があるかもしれません:
  • Linux でファイルを削除するときに「操作は許可されていません」というプロンプトが表示される場合の対処方法
  • Linux シェルコマンドは重複排除後の列の値をカウントします
  • Linux で履歴レコードを表示し、タイムスタンプを追加するためのヒント
  • LinuxのバックグラウンドでPythonプログラムを実行するいくつかの方法
  • Linux シェルスクリプトの作成と実行
  • PythonはLinuxを操作するためにparamikoを使用する
  • 2つのLinuxサーバー間でファイルとフォルダを転送する手順
  • Linux で削除できないファイル/フォルダの解決方法
  • Linuxターミナルでシェルスクリプトを実行して現在実行中のアプリのログを直接出力するAndroidの実装方法
  • Linux シェル環境での Zabbix API の使用

<<:  データベースマルチテーブル接続クエリの実装方法の詳細説明

>>:  Vue3のサンドボックスの仕組みの詳しい説明

推薦する

Vueはテーブルページング機能を実装します

この記事では、テーブルページング機能を実現するためのVueの具体的なコードを例として紹介します。具体...

Nest.js のハッシュと暗号化の例の詳細な説明

0x0 はじめにまず、ハッシュアルゴリズムとは何でしょうか?メッセージやセッション項目など、一部のデ...

Dockerでランナーコンテナを構成する方法

1. ランナーコンテナを作成する mk@mk-pc:~/Desktop$ docker run -d...

JavaScript プロトタイプオブジェクトの this ポイント問題の詳細な説明

目次1. これは2. この点を修正する1. call() メソッド2. apply() メソッド要約...

CentOS 7にChromeブラウザをインストールする方法

この記事では、CentOS 7 に Chrome ブラウザをインストールする方法を紹介します。詳細は...

選択ドロップダウンボックスの値をIDに渡してコードを実装する方法

完全なコードは次のとおりです。 HTMLコード:コードをコピーコードは次のとおりです。 <!-...

MacBook 向け Python 3.7 インストール チュートリアル

MacBookにpython3.7.0をインストールする詳細な手順は、参考までに記録されています。具...

Swiper.jsプラグインを使用すると、カルーセル画像を非常に簡単に実装できます。

Swiper は、携帯電話やタブレットなどのモバイル端末向けに設計された、純粋な JavaScri...

要素UIテーブルはドロップダウンフィルタリング機能を実現します

この記事の例では、要素UIテーブルにドロップダウンフィルタリングを実装するための具体的なコードを参考...

JSが5つ星の賞賛を獲得

この記事では、5つ星の評価を獲得するためのJSの具体的なコードを参考までに共有します。具体的な内容は...

CSS でよく使用されるフォントサイズ、フォント単位、行の高さの詳細な説明

px(ピクセル)ピクセルという言葉は皆さんもよくご存知だと思います。次に、この単位に関するちょっとし...

MySQL の 3 つの浮動小数点型 (float、double、decimal) の違いと概要について簡単に説明します。

各浮動小数点型のストレージ サイズと範囲は、次の表に示されています。タイプサイズ範囲(符号付き)範囲...

a タグをクリックして入力ファイルのアップロードダイアログボックスを表示する方法

htmlコードをコピーコードは次のとおりです。 <SPAN class=tag><...

VMware 仮想マシンでの CentOS7 ネットワーク構成 (ホストのワイヤレス インターネット アクセス)

CentOS7 システムを使用するのは今回が初めてで、ネットワーク構成を行う際に多くの問題が発生し...

要素を中央に配置するための配置方法 (Web ページ レイアウトのヒント)

ブラウザウィンドウの中央に要素を配置する方法まず、コード ブロックを示します。すでにコードを理解して...