ASCII

ASCII ist ein Akronym für "American Standard Code for Information Interchange" (dt.: Amerikanischer Standard-Code für den Informationsaustausch), der als ANSI-Standard X3.4 im Jahr 1968 eingeführt wurde.

Er beschreibt einen Zeichensatz, der auf dem lateinischen Alphabet basiert, wie es im modernen Englisch und von Computern und anderen Kommunikationseinrichtungen, die Text darstellen, verwendet wird. Wie andere Codes auch (etwa IBMs EBCDIC), spezifiziert er eine Korrespondenz zwischen Ganzzahlen (Integer), wie sie in digitaler Form dargestellt werden und den in der normalen Schriftsprache geschriebenen Zeichen. Auf diese Weise können solche Geräte durch den Austausch von binären Zeichen derart codierte Informationsinhalte miteinander austauschen und verarbeiten.

Geschichte

{| align="right" |+ Die Buchstaben A, B und C als Sieben-Bit-Code ! Schriftzeichen !! Dezimal !! Hexadezimal !! Binärzeichen |- | A || 65 || 41 || (0)1000001 |- | B || 66 || 42 || (0)1000010 |- | C || 67 || 43 || (0)1000011 |- | ... || ... || ... || ... |}

ASCII beinhaltet ursprünglich einen Sieben-Bit-Code, was bedeutet, dass er binäre Ganzzahlen verwendet, die mit sieben binären Ziffern dargestellt werden (entspricht 0 bis 127), um Informationen darzustellen. Selbst damals haben allerdings Computer bereits Acht-Bit-Zahlenworte verwendet, nur wurde das achte Bit meistens für Fehlerkorrekturzwecke auf den Kommunikationsleitungen oder für andere Steuerungsaufgaben verwendet. Der ehemals 7-Bit-Code wurde daher zur 8-Bit-Darstellung erweitert.

Fortschritte in der Technik und die internationale Verbreitung erzeugten eine Reihe von Variationen und Erweiterungen des Codes, die nicht alle untereinander kompatibel sind und auch nicht für alle Systeme gleichermaßen verwendet werden können.

Zusammensetzung

{| border style="font-family:monospace" |+ASCII-Zeichensatz inklusive nicht-druckbarer Zeichen !Code!!-0 !!-1 !!-2 !!-3 !!-4 !!-5 !!-6 !!-7 !!-8 !!-9 !!-A !!-B !!-C !!-D !!-E !!-F |- !0- |NUL||SOH||STX||ETX||EOT||ENQ||ACK||BEL||BS||HT||LF||VT||FF||CR||SO||SI |- !1- |DLE||DC1||DC2||DC3||DC4||NAK||SYN||ETB||CAN||EM||SUB||ESC||FS||GS||RS||US |- !2- |SP||!||"||#||$||%||&||'||(||)||*||+||,||-||.||/ |- !3- |0||1||2||3||4||5||6||7||8||9||:||;||<||=||>||? |- !4- |@||A||B||C||D||E||F||G||H||I||J||K||L||M||N||O |- !5- |P||Q||R||S||T||U||V||W||X||Y||Z||[||\\||]||^||_ |- !6- |`||a||b||c||d||e||f||g||h||i||j||k||l||m||n||o |- !7- |p||q||r||s||t||u||v||w||x||y||z||{|||||}||~||DEL |}

Die ersten 32 Zeichencodes in ASCII sind reserviert für Steuerzeichen (control character) -- Zeichen, die eigentlich keine Schriftzeichen darstellen, sondern die zur Steuerung von solchen Geräten dienen (oder dienten), die ASCII verwenden (etwa Drucker). Darin sind solche Dinge enthalten wie Wagenrücklauf für den Zeilenumbruch oder Bell (die Glocke) - überwiegend Relikte aus der Steinzeit der Computertechnik.

Code 0x20 (SP) ist das Leerzeichen (engl. space oder blank), welches ein Leerzeichen zwischen den Wörtern angibt und auf der Tastatur durch die große breite Leertaste erzeugt wird. Die Codes 0x21 bis 0x7E sind alle 'druckbaren' Zeichen, die sowohl Buchstaben, Ziffern und Satzzeichen (siehe Tabelle) beinhalten. Code 0x7F (mit allen sieben Bits eins gesetzt) ist ein Sonderzeichen, welches auch als "Löschzeichen" bezeichnet wird (DEL). Obwohl es ähnlich wie ein Steuerzeichen eingesetzt wird/wurde, wurde diese Stelle im Zeichensatz verwendet, um auf den früheren Papierstreifen oder Lochmaschinen eine Möglichkeit zu haben, ein geschriebenes Zeichen durch Löschen aller Bits -- d.h. durch Auslochen aller sieben Markierungen -- löschen zu können.

Erweiterung

ASCII beinhaltet keine diakritischen Zeichen, die in vielen Sprachen verwendet werden, die auf Basis des Lateinischen Alphabets geschrieben werden.

Der internationale Standard ISO 646 (1972) war der erste Versuch, dieses Problem anzugehen. Leider wurden hierdurch wiederum auch andere Kompatibilitätsprobleme geschaffen. Er ist immer noch ein Sieben-Bit-Code und weil keine anderen Codes erhältlich waren, wurden einige Codes in immer neuen Varianten verwendet.

So ist etwa der ASCII Code 93 für die rechte eckige Klammer (]) in der deutschen Zeichensatz-Variante ISO 646-DE für den Großbuchstaben U als Umlaut (Ü) und in der dänischen Varianten ISO 646-DK für den Großbuchstaben A mit oben angebrachtem Kreis (Å) vorgesehen.

Spätere Standards wie ISO 8859 und insbesondere auf Unicode (ISO 10646) basierende wie UTF-8 rufen weniger oder keine derartigen Probleme hervor, so dass die Sieben-Bit-Varianten nicht mehr verwendet werden müssen -- allerdings lässt sich auch Unicode in 7 Bit kodieren: UTF-7. Unicode verwendet bis zu 32-bit pro Zeichen, so dass alle von Menschen verwendeten Schriftzeichen dargestellt werden können.

ASCII enthält fast keine Vereinbarungen oder Zeichen, die in irgendeiner Weise zur Textformatierung oder zur Textstrukturierung verwendet werden (es gibt jedoch besagte Steuerzeichen, die auch zur Textformatierung verwendet werden, darunter Linefeed, Carriage Return, horizontaler Tabulator, Form Feed, vertikaler Tabulator). Dazu werden andere Kodierformen verwendet, etwa Markup. In der Kryptographie werden Codes und komplexere Beziehungen zwischen Zeichen verwendet, um solche Information nur bestimmten Empfängern zugänglich zu machen.

Siehe auch

Kompatible Kodierungen:




Websites: Tagoror | Guajara | Tacoronte Guia | Todo Gomera | Deranet | Radioaficionados | Cinebso | Mi Buscador

Enciclopedia On Line: GNU FDL.