|
|
ASCII (アスキー ) は、もともとAmerican Standard Code for Information Interchange の略であり、以下の意味を持つ。
| Table of contents |
|
2 ASCII制御文字 3 ASCIIの印刷可能な文字 |
ASCII (文字コード)
ASCII または ASCIIコード は、7桁の2進数で表すことのできる整数の数値のそれぞれに、大小のアルファベットや数字、英文でよく使われる記号などを割り当てたものである。
1963年6月17日に、American Standards Association(ASA、後の ANSI)によって制定された。
現在、世界中で使用されている様々な文字の符号化方式の多くは、このASCIIコードで使用されていない128番以降の部分に、その他の文字を割り当てたものである。(文字コードの項も参照されたし。)
他のコードと同じく、ASCIIは整数で表されるデジタルデータと文字記号とが対応づけられたコードである。このコードに従い文字等を整数に変換する事で、通信、文字情報の処理や保存を行うのが容易になる。ASCIIやASCII互換コードは、ほとんど全てのコンピュータ(特にパーソナルコンピュータやワークステーション)で扱う事が出来る。MIMEでは、"US-ASCII"とするのが望ましい。
ASCIIは7ビットコードである。つまり、情報を表すのに7桁の二進数(十進数では0~127)を用いる。ASCIIが紹介された頃ですらほとんどのコンピュータの扱う最少単位は8ビットであるバイトであった。そのため8ビット目は通信におけるエラーチェック用のパリティビットとして用いられた。
ASCIIはテキストの構造や見た目に関する情報は持たない。そのような情報はマークアップ言語などを使用する事で補うことが出来る。
日本で「ASCII」と呼ばれる文字コードは、本来のものとは、92番の文字に「バックスラッシュ」ではなく「円記号」(\\)が当てられている点が異なる。
ASCIIの構成は次のようになっている。
| コード範囲(16進) | 内容 |
|---|---|
| 0x00~0x1f | 制御文字 |
| 0x20 | 空白 |
| 0x21~0x7e | 図形文字 |
| 0x7f | 制御文字(DEL) |
初めの32文字(十進数で0-31)はASCIIでは制御文字として予約されている。基本的にはこれらの制御文字は表示するための文字ではなく、モニタやプリンタなどの機器を制御するために用いられる。例えば、ASCII 10(10進)はline feed(改行)を表し(プリンタの紙送りなどに用いる)、ASCII 27はエスケープを表す。
ASCII 127(全てのビットがON、つまり、2進数で1111111)は、deleteとして知られる制御文字である。この制御文字だけ先頭部分になく一番最後にある理由は、パンチテープへの記録は上書きが出来ないため、削除する際には全てに穴を空けることで対応できるというところからきている(1111111は全てに穴の開いた状態を示す)。また、ASCII 0(全てのビットがOFF、つまり2進数で0000000)は、多くのコンピュータシステムでは無視される。
コードの多くは、データ転送プロトコルで用いられる。(例:ヘッダ開始、テキスト開始、テキスト終了など。)
セパレータは磁気テープへの保存のために設計された。
XON や XOFF は、プリンタのような処理の遅いデバイスにおいて、データを失うことがないように情報の流れを制御するために用いる事がある。
ASCII制御文字
| 2進 | 10進 | 16進 | 略語 | Printable Representation | Name/Meaning |
|---|---|---|---|---|---|
| 0000 0000 | 0 | 00 | NUL | ␀ | 空文字(Null) |
| 0000 0001 | 1 | 01 | SOH | ␁ | ヘッダ開始 |
| 0000 0010 | 2 | 02 | STX | ␂ | テキスト開始 |
| 0000 0011 | 3 | 03 | ETX | ␃ | テキスト終了 |
| 0000 0100 | 4 | 04 | EOT | ␄ | 転送終了 |
| 0000 0101 | 5 | 05 | ENQ | ␅ | 問い合わせ |
| 0000 0110 | 6 | 06 | ACK | ␆ | 肯定応答 |
| 0000 0111 | 7 | 07 | BEL | ␇ | ベル |
| 0000 1000 | 8 | 08 | BS | ␈ | 1文字後退 |
| 0000 1001 | 9 | 09 | HT | ␉ | 水平タブ |
| 0000 1010 | 10 | 0A | LF | ␊ | 改行 |
| 0000 1011 | 11 | 0B | VT | ␋ | 垂直タブ |
| 0000 1100 | 12 | 0C | FF | ␌ | 改ページ |
| 0000 1101 | 13 | 0D | CR | ␍ | 復帰(キャリッジ・リターン) |
| 0000 1110 | 14 | 0E | SO | ␎ | シフトアウト |
| 0000 1111 | 15 | 0F | SI | ␏ | シフトイン |
| 0001 0000 | 16 | 10 | DLE | ␐ | データリンク拡張 |
| 0001 0001 | 17 | 11 | DC1 | ␑ | 装置制御1,XON |
| 0001 0010 | 18 | 12 | DC2 | ␒ | 装置制御2 |
| 0001 0011 | 19 | 13 | DC3 | ␓ | 装置制御3,XOFF |
| 0001 0100 | 20 | 14 | DC4 | ␔ | 装置制御4 |
| 0001 0101 | 21 | 15 | NAK | ␕ | 否定応答 |
| 0001 0110 | 22 | 16 | SYN | ␖ | 同期信号 |
| 0001 0111 | 23 | 17 | ETB | ␗ | ブロック転送終了 |
| 0001 1000 | 24 | 18 | CAN | ␘ | キャンセル |
| 0001 1001 | 25 | 19 | EM | ␙ | 媒体終端 |
| 0001 1010 | 26 | 1A | SUB | ␚ | 置換 |
| 0001 1011 | 27 | 1B | ESC | ␛ | エスケープ |
| 0001 1100 | 28 | 1C | FS | ␜ | ファイルセパレータ |
| 0001 1101 | 29 | 1D | GS | ␝ | グループセパレータ |
| 0001 1110 | 30 | 1E | RS | ␞ | レコードセパレータ |
| 0001 1111 | 31 | 1F | US | ␟ | ユニットセパレータ |
| 0111 1111 | 127 | 7F | DEL | ␡ | 削除 |
注:上の表の第5列には制御文字をあらわす図形文字のコードが入っているが、インストールしてあるフォントなどの環境によっては表示されないかもしれない。
|
|
|
Note: 大文字のASCII値に32を加えると小文字に変換することが出来る。この変換は、2進法では、6ビット目に1をセットするだけでよい。