|
|
| Table of contents |
|
2 問題点 3 「2バイト圏」 4 補足事項 5 関連記事 |
背景
コンピュータに各国の言語を実装しようとした頃、英語などの言語は当時の1バイト文字で充分な表現が行えたが、1バイト文字の範囲で扱えない多数の文字言語を使う国では、2バイトの文字を扱う必要に迫られた。(マルチバイト処理)
これには大変な困難が伴ったほか、その後も英語版のソフトウェアを他の言語に移植する際、フランス語版を作るのと日本語版(あるいは中国語版など)を作るのとでは必要な労力が桁違いだった。それはいわゆる1バイト文字だけ扱っていたソフトウェア(特に文書処理など)を、2バイト文字も扱えるようにするには大幅な拡張が必要だったためである。
そのため、英語やフランス語などの言語をひとまとめにして1バイト言語、2バイト文字が必要となるものを2バイト言語とする呼び方が一部で生まれた。
また、ウィキペディアで使用しているUnicodeでは、多言語対応のため1文字が最大4バイト長となっており、単純に1バイト2バイトと言うことはできない。問題点
ただし、1バイト文字で「This is a pen」と書いても2バイト文字で「This is a pen」と書いても英語は英語である。
また逆に「おはようございます」を「Ohayougozaimasu」と記述したものを日本語ではないということはできない。(「言語」と言ってしまうと文字言語に限らないため)
そのため、この表現自体に問題があると言えるが、1群として指し示すのに便利で、代替の適切な単語が知られていないことから現在でもIT関連のメディアや、それらのソフトウェアを販売する会社などでも使われているようである。