|
|
Hypertext Markup Language(HTML)は、SGMLのアプリケーションの一つで、ハイパーテキストを利用してワールドワイドウェッブ上で情報を発信するために作られ、ワールドワイドウェッブの基幹的役割をなしている。情報を発信するための文書構造を定義するために使われ、ある程度機械が理解可能な言語で、写真の埋め込みや、フォームの作成、ハイパーテキストによるHTML間の連携が可能である。
文書構造を定義することにより、文字列と文字列の関係が明確になり、ユーザが内容にすぐたどり着く助けとなる。
HTMLはすべてのユーザエージェントに対応するため、HTMLを書く側、HTMLを読む側で矛盾が起こらぬよう標準化された勧告がなされている。HTML 3.2からは、W3Cがその役目を担っていて、SGMLからXMLに移植したXHTMLへその機軸は動いている。
| Table of contents |
|
2 HTML文書 3 歴史 4 関連項目 |
HTMLの特徴は、ハイパーテキストを利用した、相互間文書参照のフレームワークである。マークアップはプレインテキストの文書を要素で括って意味付けすることで行い、文書の特定要素にURIへのリンクを記載しておけば、ユーザエージェントはそれを解釈して他のURIへ移動することが出来る。また、マークアップを施す際に引用や画像の埋め込み、文書のタイトルの指定などを定める要素を記載すれば、ユーザエージェントが解釈し、形態に見合った表示をすることが出来る。HTMLはそのマークアップの規則を定めている。
規則はDTDとして公開され、要素ごとに記載することの出来る属性、内容に含むことの出来る要素などが定められ、HTML 4.01では過渡期のためのもの (Transitional)、厳密なもの (Strict)、フレームを用いた文書のためのもの (Frameset) の三つのDTDが公開されている。
要素は開始タグ、内容、終了タグの三つで成り立ち、<、>で括る。属性は開始タグの中の、要素名の後ろで>の前に書くことが出来、その要素のおのおのに終了タグの省略の可否がある。また、内容をもたない空要素は、開始タグのみ書くことが出来る。
HTML 3.2では見栄えを左右する要素や属性が追加されたが、HTMLは文書構造を示すためにあり、それらの要素はその妨げになるとしてスタイルシート(一般にはその中のCSS)で操作すべきであるとして厳密なHTML 4.01 Strictからはそれらは非推奨とされている。
HTMLで書かれた文書をHTML文書と言い、DTDに沿って書くことが期待される。DTDはSGML宣言で使用すると宣言したバージョンのものが選択される。
ここから以下はHTML 4.01 Strictを使い、要素名は大文字、属性は小文字で記すものとする。ただし、HTMLにおいて要素内の大文字小文字は区別されない。
HTMLではまずSGML宣言が必要となる。このバージョンでは
日本語を扱えるHTMLのバージョンとしては、最も古い。
この後、HTML4.01をベースとしてXHTML 1.0が策定されることになる。
特徴
HTML文書
である。このとき、HTML 4.01 Strictの使用およびそのDTDの場所が明示されている。
とあったとき、
という構造をなしていると言う意味である。要素によって文字列を括ることによりその文字列の意味付けがなされ、ユーザエージェントはそれを解釈して、例えばGUIによるウェブブラウザであればSTRONG要素で括られたテキストを太字として表示するなどする。このとき、スタイルシートで表示を操作することができるようになっている。
歴史
HTML1.0
(未稿)
HTML2.0
1995年11月に、IETFのHTMLワーキンググループによってRFC 1866として仕様が発表された。HTML2.0はRFC 2854によって破棄された。
HTML+
(未稿)
HTML3.0
策定作業が行われたが、ドラフトの段階で策定途中に破棄された。
HTML3.2
1997年1月14日に、W3C勧告として仕様が発表された。1997年12月にHTML4.0によって破棄された。
HTML2.x
1997年1月、RFC2070として発表された。「HTML i18n」とも呼ばれるが、現在はRFC2854によって破棄された。HTML4.0、HTML4.01
1997年12月18日に、W3C勧告としてHTML4.0の仕様が発表された。HTML4.0は1998年4月24日に仕様が改訂された。この仕様にいくらかのマイナーな修正が加えられたHTML4.01は1999年12月24日にW3C勧告となった。