Web ページでの Unicode 文字の使用の概要 (&#、\u など)

Web ページでの Unicode 文字の使用の概要 (&#、\u など)

初期のコンピュータでは ASCII 文字しか使用できませんでしたが、コンピュータのアプリケーションの範囲が拡大するにつれて、多くの国がコンピュータ用の特別な文字セットを設計し、中国の GB2312 コードなど、自国や国民の文字やテキストをコンピュータで表示および処理できるようにしました。その後、インターネットが登場して全世界がつながり、複数の国や民族のテキストを 1 台のコンピューター、あるいは 1 つのインターフェースで表示することが実際的なニーズとなりました。国際組織が、世界中のすべてのテキストと記号に対応できる文字エンコード方式を開発しました。これは、Universal Character Set の略称である Unicode と呼ばれ、言語間およびプラットフォーム間のテキスト変換と処理の要件を満たすために使用されます。1994 年のリリース以来、継続的に拡張され、現在はバージョン 10 に達しています。

最新バージョンのコード テーブルのダウンロードなど、詳しい情報については、https://www.unicode.org/ をご覧ください。

Web ページを設計するときに、Unicode 文字セットを使用できます。HTML、CSS、JavaScript のいずれで使用するかに応じて、使用方法が異なります。

1) HTML での使用: &#dddd; または &#xhhhh;

このうち、dddd は 4 桁の 10 進数値を表し、hhhh は 4 桁の 16 進数値を表します。2 つの形式にはそれぞれ &# と &#x がプレフィックスとして付いており、10 進コードまたは 16 進 Unicode コードであることを示します。また、どちらもセミコロンを末尾に付ける必要があります。現在、4 ビットの 16 進コードを使用する Unicode 文字は十分にサポートされており、そのほとんどは Web ページで正常に表示できますが、他の多くの Unicode 文字は表示されないことがよくあります。これは、使用しているコンピューター プラットフォームに関連する Unicode サポートがインストールされていないためです。例:
<p>Unicode 文字 --∰ を表示します</p>
これは、Unicode コード 2230 の数学記号を示しています。この特殊文字を出力するには、「&#x2230;」または「&#8752;」を使用し、ページに表示することができます。

2) CSSでの使用: \hhhh

Unicode 文字は CSS ではほとんど使用されませんが、時々使用されます。Unicode 文字は通常、先頭にバックスラッシュが付いた 4 桁の 16 進 Unicode コードで表されます。

3) JavaScript での使用: \uhhhh

JavaScript コードでは、特殊文字がよく使用されます。たとえば、ギリシャ文字やローマ数字などを使用して、要素内に温度や角度の記号を出力するには、4 ビットの Unicode 16 進コードの前にプレフィックス「\u」を追加するだけです。例:

ドキュメントのbody要素を次のように変更します。

Unicode コード 25D0 が使用されます。幾何図形表では、半月のように、通常は白で塗りつぶされ、半分が黒で塗りつぶされた円形のパターンです。

もちろん、中国人による Unicode の最も一般的な使用は、漢字です。より多くの中国語の文字を表示するために、中国語の文字ライブラリはまず GB2312 から GBK に拡張され、現在は GB18030 に拡張されています。 GB18030 の最新バージョンには、70,000 を超える中国語の文字、さまざまな少数言語、および一部の特殊文字が含まれています。この標準は、Unicode コード方式と一致しています。もちろん、一部のコンピュータにはサポート ソフトウェアの完全な新しいバージョンがインストールされていないため、一部の文字しか表示できない場合があります。

中国語文字の Unicode コードを取得するには、JavaScript 関数 charCodeAt() を使用できます。次に例を示します。

var ucode="赵".charCodeAt();

このようにして、変数 ucode に漢字「赵」の Unicode コードが格納され、得られた Unicode コードは 36213 となり、これは 10 進 Unicode コードです。 toString(16) メソッドを使用して、この 10 進コードを 16 進コードに変換できます。

var ucode="赵".charCodeAt().toString(16);

これにより、中国語の文字「赵」の 16 進 Unicode コードが得られ、値は 8d75 になります。

一般的に、中国語の文字を出力する場合、中国語の文字を含む文字列をそのまま表示することができます。中国語文字の Unicode コードを使用して、対応する中国語文字やその他の文字を出力することもできます。

文字列.fromCharCode(36213);

これにより、10 進 Unicode コード 36213 の文字が文字列に変換され、この文字列を出力すると、中国語の文字「赵」が表示されます。入力メソッドを使用して中国語の文字を直接文字列に変換できるため、このメソッドはいくつかの特殊文字を出力するためによく使用されます。

&#エンコーディングを文字に変換する

これは Unicode エンコーディングであり、エンコーディング プロセスは次のとおりです。

たとえば、「杨」をエンコードする場合は、新しいメモ帳を作成し、「杨」と入力して Unicode エンコードとして保存することを選択し、ファイルのバイナリ コンテンツを表示します。最初の 2 バイト FF FE は Unicode エンコード ファイル ヘッダー フラグであり、次の 2 バイト 68 67 は「杨」の Unicode エンコードです。計算機を使用して 10 進数に変換すると、26472 になります。これで、HTML ファイルに「杨」と書き込むことができ、IE で開くと「杨」という単語が表示されます。

もちろん、一般的な ASCII コードの場合、Unicode エンコーディングは ASCII エンコーディングと一貫しているため、A は大文字の「A」を表示できます。

&#エンコーディングを文字に変換する

関数 uncode(str) {
str.replace(/&#(x)?([^&]{1,5});?/g を返します。関数 (a, b, c) {
String.fromCharCode(parseInt(c, b ? 16 : 10)) を返します。
});
}

文字を&#エンコーディングに変換する

関数encode(str) {
var a = []、i = 0;
(; i < str.length ;) の場合、a[i] = str.charCodeAt(i++);
"&#" + a.join(";&#") + ";" を返します。
}

ウェブページでの Unicode 文字の使用 (&amp;#、\u など) に関するこの記事はこれで終わりです。より関連性の高い Unicode コンテンツについては、123WORDPRESS.COM の過去の記事を検索するか、以下の関連記事を引き続き参照してください。今後とも 123WORDPRESS.COM をよろしくお願いいたします。

<<:  CSS を解析して画像のテーマカラー機能を抽出する (ヒント)

>>:  HTML iframe で親ページと子ページ間の双方向メッセージングを実装する例

推薦する

MySQL累積計算実装方法の詳しい説明

目次序文需要分析MySQL ユーザー変数累積計算にMysqlユーザー変数を使用する要約するこの記事で...

Vue3は独自のページングコンポーネントをカプセル化します

この記事の例では、vue3 が独自のページングコンポーネントをカプセル化する具体的なコードを参考まで...

HTMLはBaidu百科事典のナビゲーションドロップダウンメニュー機能を模倣します

HTML は、Baidu 百科事典のナビゲーション ドロップダウン メニュー機能を模倣します。具体的...

iframe ページで js 関数を呼び出すには js を使用します

最近、私は毎日論文提案に取り組んでいます。自分のスキルを発揮して、再びWebをデザインしたくてうずう...

HTMLのposition属性の使い方(4種類)の詳しい説明

位置の 4 つのプロパティ値は次のとおりです。 1.相対的な2.絶対3.修正4.静的これら 4 つの...

ウェブデザインにおける階層化インターフェースの設計経験

多くのネットユーザーは、なぜ自分のウェブサイトはいつも色の問題を抱えていて、いつも地味に見え、注目を...

Linux でソースインストールされたパッケージを簡単に削除する方法

ステップ1: Stowをインストールするこの例では CentOS を使用しているため、拡張 EPEL...

CSSカスケーディングメカニズムについての簡単な説明

CSS にカスケード メカニズムがあるのはなぜですか? CSS では、同じ要素の特定のプロパティに同...

docker compose helloworld を使い始めるための詳細なプロセス

前提条件Compose は、Docker コンテナをオーケストレーションするためのツールです。Doc...

PXEを使用してLinuxシステムを自動的に展開する方法

目次背景DHCPの設定DHCP ファイル (動的ホスト構成プロトコル) の編集tftp 設定sysl...

MySQLアカウントのパスワード変更方法(概要)

序文:データベースを日常的に使用すると、パスワードが単純すぎて変更する必要がある場合、パスワードの有...

MySQL 文字セットの概要

目次文字セット比較ルール4つのレベルの文字セットと比較規則3つのシステム変数このノートは主にMySQ...

フォームから Vue ElementUI を使用してログイン効果を実装する例

目次1. ElementUIで基本的なスタイルを構築する2. [送信]ボタンをクリックして、アカウン...

HTML の著作権記号のフォント選択問題 (著作権記号をより美しくする方法)

1. 問題を発見する&copy; は HTML の著作権記号ですが、間違ったフォントを選択す...

Linux システムでの Selenium クローラー プログラムの導入の概要

目次序文1. セレンとは何ですか? 2. 使用手順1. ライブラリをインポートする2. テストコード...