1. データ重複排除 日常業務では、Hive や Impala を使用してクエリとエクスポートを行う際にデータの重複が発生することがありますが、クエリを再実行したくない (クエリ時間が少し長く、エクスポートされたファイルの内容が大きい) ため、Linux コマンドを使用してファイルの内容から重複データを削除することを考えます。 次に例を示します。 aaa.txxには3つの重複データがあることがわかります。 重複したデータを削除して1つだけ残したい aaa.txt | uniq > bbb.txt を並べ替える aaa.txt ファイルから重複データを削除し、bbb.txt に出力します。 bbb.txtファイルには1つのデータのみが保存されていることがわかります。 2. データの交差、結合、差異 1) 交差 (user_2019 の内部結合 user_2020 と user_2019.user_no=user_2020.user_no の結合に相当) 2) ユニオン(user_2019.user_no union user_2020.user_noに相当) 3) 違い
以上がこの記事の全内容です。皆様の勉強のお役に立てれば幸いです。また、123WORDPRESS.COM を応援していただければ幸いです。 以下もご興味があるかもしれません:
|
導入クロージャは JavaScript の非常に強力な機能です。いわゆるクロージャは関数内の関数です...
この記事の例では、商品詳細ページ機能を実現するためのVueの商品タブの具体的なコードを参考までに共有...
私たちのコンピューターには、ディレクトリ、写真、ソース コードなどのファイルが保存されています。たく...
/******************** * 仮想ファイルシステム VFS **********...
ミックスインは、コンポーネントに分散された再利用可能な機能を柔軟な方法で提供します。 Mixin オ...
この記事では、よく使用される MySQL 関数について説明します。ご参考までに、詳細は以下の通りです...
目次MySQL マスター スレーブ データベースが同期されない問題を解決する 2 つの方法1. 非同...
ここでは、dockerがインストールされたcentosサーバーを紹介し、リモートリンクサービスを開始...
<br />内容はインターネットから転載したものです。どこから見つけたのか忘れてしまいま...
[問題の説明]アプリケーション側では、次のエラーが時々表示されます。メソッド 'mysql_...
写真といえば、まず背景画像が思い浮かびます。私たちの装飾の多くは背景画像を使用して実現されているから...
SVG (Scalable Vector Graphics)は、XML 構文に基づいた画像形式です。...
ネットワークが分離されているため、MySQL は yum を使用してインストールできません。ここでは...
新しいコンピューターに変更したので、すべての環境を新しいコンピューター上で設定する必要があります。ふ...
Docker は、アプリケーションをより速く配信するのに役立つオープンソースのコンテナ エンジンです...