HTML

用於創建網頁的標準標記語言

超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。HTML是一种基础技术,常与CSSJavaScript一起被众多网站用于设计网页、网页应用程式以及流动应用程序的用户界面[3]网页浏览器可以读取HTML文件,并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现,使之成为一种标记语言而非编程语言

HTML
(超文本标记语言)
扩展名
  • .html
  • .htm
互联网媒体类型
text/html
类型代码英语Type codeTEXT
开发者W3C & WHATWG
首次发布1993年,​31年前​(1993
最新版本
5.2[1]/ 5.3(工作草案)[2]
2017年12月14日,​6年前​(2017-12-14
格式类型文档文件格式
扩展自SGML
扩展为XHTML
标准
免费格式?
网站

HTML元素是构建网站的基石。HTML允许嵌入图像与对象,并且可以用于创建交互式表单,它被用来结构化资讯——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素(如<html>),浏览器使用HTML标签和脚本来诠释网页内容,但不会将它们显示在页面上。

HTML可以嵌入如JavaScript脚本语言,它们会影响HTML网页的行为。网页浏览器也可以引用层叠样式表(CSS)来定义文本和其它元素的外观与布局。维护HTML和CSS标准的组织万维网联盟(W3C)鼓励人们使用CSS替代一些用于表现的HTML元素[4]

历史

 
W3C制作的早期HTML标志

发展

 
蒂姆·伯纳斯-李

1980年,物理学家蒂姆·伯纳斯-李欧洲核子研究中心(CERN)在承包工程期间,为使CERN的研究人员使用并共享文档,他提出并创建原型系统ENQUIRE。1989年,伯纳斯-李在一份备忘录中提出一个基于互联网超文本系统[5]。他规定HTML并在1990年底写出浏览器和伺服器软件。同年,伯纳斯-李与CERN的数据系统工程师罗伯特·卡里奥联合为项目申请资助,但未被CERN正式批准。在他的个人笔记中[6]伯纳斯-李列举“一些使用超文本的领域”,并把百科全书列为首位[7]

HTML的首个公开描述出现于一个名为HTML Tags[8]的文件中,由蒂姆·伯纳斯-李于1991年底提及[9][10]。它描述18个元素,包括HTML初始的、相对简单的设计。除了超链接标签外,其他设计都深受CERN内部一个以标准通用标记语言(SGML)为基础的文件格式SGMLguid的影响。这些元素仍有11个存在于HTML 4中[11]

伯纳斯-李认为HTML是SGML的一个应用程式。1993年中期互联网工程任务组(IETF)发布首个HTML规范的提案:“超文本标记语言(HTML)”互联网草案页面存档备份,存于互联网档案馆),由伯纳斯-李与丹·康纳利英语Dan Connolly (computer scientist)撰写。其中包括一个SGML文档类型定义来定义语法[12]。草案于6个月后过期,不过值得注意的是其对NCSA Mosaic浏览器嵌入在线图像的自定义标签的认可,这反映IETF把标准立足于成功原型的理念[13]。同样,戴夫·拉格特英语Dave Raggett在1993年末提出的与之竞争的互联网草案“HTML+(超文本标记格式)”建议规范已经实现的功能,如表格与填写表单[14]

在HTML和HTML+的草案于1994年初到期后,IETF创建一个HTML工作组,并在1995年完成"HTML 2.0",这是第一个旨在成为对其后续实现标准的依据的HTML规范[15]

在IETF的主持下,HTML标准的进一步发展因竞争利益而遭受停滞。自1996年起,HTML规范一直由万维网联盟(W3C)维护,并由商业软件厂商出资[16]。不过在2000年,HTML也成为国际标准(ISO/ IEC15445:2000)。HTML 4.01于1999年末发布,进一步的勘误版本于2001年发布。2004年,网页超文本应用技术工作小组(WHATWG)开始开发HTML5,并在2008年与W3C共同交付,2014年10月28日完成标准化[17]

版本时间线

HTML 2

1995年11月24日
HTML 2.0作为IETF RFC 1866发布。追加RFC的附加功能:

HTML 3

1997年1月14日
HTML 3.2[18]作为W3C推荐标准发布。这是首个完全由W3C开发并标准化的版本,因IETF于1996年9月12日关闭它的HTML工作组[19]。最初代号为“威尔伯”(Wilbur)[20],HTML 3.2完全去除数学公式,协调各种专有扩展,并采用网景设计的大多数视觉标记标签。由于两家公司达成了协议,网景的Blink元素和微软Marquee元素被移除[16]。HTML对数学公式的支持最后成为另外一种被称为MathML的标准。

HTML 4

1997年12月18日
HTML 4.0[21]作为W3C推荐标准发布。它提供三种变化:
  • 严格,过时的元素被禁止。
  • 过渡,过时的元素被允许。
  • 框架集,大多只与框架相关的元素被允许。
最初代号“美洲狮”(Cougar)[20], HTML 4.0采用许多特定浏览器的元素类型和属性,并试图淘汰网景的视觉标记功能,将其标记为不赞成使用。HTML 4是遵循ISO 8879 - SGML的SGML应用程式[22]
1998年4月24日
HTML 4.0[23]进行微调,不增加版本号。
1999年12月24日
HTML 4.01[24]作为W3C推荐标准发布。它同样提供三种变化,最终勘误版页面存档备份,存于互联网档案馆)于2001年5月12日发布。
2000年5月
ISO/IEC 15445:2000[25][26]("ISO HTML",基于HTML 4.01严格版)作为ISO/IEC国际标准发布。在ISO中这一标准位于ISO/IEC JTC 1/SC 34英语ISO/IEC JTC 1/SC 34域(ISO/IEC联合技术委员会1、小组委员会34 – 文档描述与处理语言)[25]

HTML 5

2014年10月28日
HTML 5[27]作为W3C推荐标准发布[28]

草案时间线

1991年10月
HTML标签[9],一个非正式CERN文件首次公开18个HTML标签。
1992年6月
HTML DTD的首个非正式草案[29], 后续有七个修订版[30][31][32](7月15日,8月6日,8月18日,11月17日,11月19日,11月20日,11月22日)。
1992年11月
HTML DTD 1.1(首个版本号,基于RCS修订版,版本号从1.1开始而非1.0),非正式草案。[32]
1993年6月
超文本标记语言[33]IETF IIIR工作小组作为互联网草案(一个粗略的建议标准)。在被第二版[34]取代一个月后,IETF又发布6个草案[35],最终在RFC1866中发布HTML 2.0。
1993年11月
HTML+由IETF作为互联网草案发布,是超文本标记语言草案的一个竞争性提案。它于1994年5月到期。
1995年4月 (1995年3月编写)
HTML 3.0[36]被提议作为IETF的标准,但直到提案在五个月过期后(1995年9月28日)[37]仍没有进一步的行动。它包含许多拉格特HTML+提案的功能,如对表格的支持、围绕数据的文本流和复杂的数学公式的显示[37]。W3C开始开发自己的Arena浏览器作为HTML 3和层叠样式表的试验台英语Test bed[38][39][40],但HTML 3.0并没有获得成功。浏览器厂商,包括微软和网景,选择实现HTML3草案功能的不同子集并引入它们自己的插件(见浏览器大战[16]
 
HTML5的Logo
2008年1月
HTML5由W3C作为工作草案(链接页面存档备份,存于互联网档案馆))发布[41]。虽然HTML5的语法非常类似于SGML,但它已经放弃任何成为SGML应用程式的尝试,除了一种替代的基于XML的HTML5序列,它已明确定义自己的“HTML”序列[42]
2011年 HTML5 – 最终征求
2011年5月,工作小组将HTML5推进至“最终征求”(Last Call)阶段,邀请W3C社区内外人士以确认本规范的技术可靠性。W3C开发一套综合性测试包来实现完整规范的广泛交互操作性,完整规范的目标日期为2014年[43]。2011年1月,WHATWG将其“HTML5”活动标准重命名为“HTML”。W3C仍然继续其发布HTML5的项目[44]
2012年 HTML5 – 候选推荐
2012年7月,WHATWG和W3C的工作产生一定程度的分离。W3C继续HTML5规范工作,重点放在单一明确的标准上,这被WHATWG称为“快照”。WHATWG组织则将HTML5作为一个“活动标准”(Living Standard)。活动标准的概念是从未完成但永远保持更新与改进,可以蒂姆加新特性,但功能点不会被删除。[45]
2012年12月,W3C指定HTML5作为候选推荐[46]阶段。该阶段的标准为“两个100%完成,完全实现交互操作”。
2014年 HTML5 – 提案推荐与推荐
2014年9月,HTML5进入提案推荐阶段。[47]
2014年10月28日,HTML5作为稳定W3C推荐标准发布[48],这意味着HTML5的标准化已经完成[49]

XHTML版本

XHTML是使用XML 1.0改写自HTML 4.01的独立语言。它不再被作为单独标准开发。

  • XHTML 1.0[50], 2000年1月26日作为W3C推荐标准发布。修订版于2002年8月1日发布,它提供与HTML 4.0和4.01相同的三个变化,这些变化被重新在XML中制定。
  • XHTML 1.1[51],基于XHTML 1.0 严格版,2001年5月31日 作为W3C推荐标准发布。修订版可使用模块化XHTML页面存档备份,存于互联网档案馆)的模块,2001年4月10日作为W3C推荐标准发布。
  • XHTML 2.0为工作草案,但为支持HTML5XHTML5的工作,此草案被放弃[52][53][54]。 XHTML 2.0与XHTML 1.x不兼容,因此更确切的说这是一个XHTML风格的新语言而不是XHTML 1.x的更新。
  • 在HTML5草案中规定一个XHTML语法,称为“XHTML5.1”[55]

标记

HTML标记包含标签(及其属性)、基于字符的数据类型、字符引用和实体引用等几个关键部分。HTML标签是最常见的,通常成对出现,比如<h1></h1>。这些成对出现的标签中,第一个标签是开始标签,第二个标签是结束标签。两个标签之间为元素的内容,有些标签没有内容,为空元素,如<img>

HTML另一个重要组成部分为文档类型声明英语document type declaration,这会触发标准模式渲染。

以下是一个经典的Hello World程序的例子:

<!DOCTYPE html>
<html>
  <head>
    <title>This is a title</title>
  </head>
  <body>
    <p>Hello world!</p>
  </body>
</html>

<html></html>之间的文本描述网页,<body></body>之间的文本为可视页面内容。标记文本<title>This is a title</title>定义了浏览器的页面标题。

文档标记类型<!DOCTYPE html>用于HTML5。 如果未进行声明,浏览器会使用“怪异模式”进行渲染。[56]

元素

HTML文档由嵌套的HTML元素构成。它们用HTML标签表示,包含于尖括号中,如<p>[57]

在一般情况下,一个元素由一对标签表示:“开始标签”<p>与“结束标签”</p>。元素如果含有文本内容,就被放置在这些标签之间。

在开始与结束标签之间也可以封装另外的标签,包括标签与文本的混合。这些嵌套元素是父元素的子元素。

开始标签也可包含标签属性。这些属性有诸如标识文档区块、将样式资讯绑定到文档演示和为一些如<img>等的标签嵌入图像、引用图像来源等作用。

一些元素如换行<br>,不允许嵌入任何内容,无论是文字或其他标签。这些元素只需一个单一的空标签(类似于一个开始标签),无需结束标签。

许多标签是可选的,尤其是那些很常用的段落元素<p>的闭合端标签。HTML浏览器或其他介质可以从上下文识别出元素的闭合端以及由HTML标准所定义的结构规则。这些规则非常复杂,不是大多数HTML编码人员可以完全理解的。

因此,一个HTML元素的一般形式为:<tag attribute1="value1" attribute2="value2">''content''</tag>。一些HTML元素被定义为空元素,其形式为<tag attribute1="value1" attribute2="value2">。空元素不能封装任何内容。例如<br>标签或内联标签<img>。一个HTML元素的名称即为标签使用的名称。注意,结束标签的名称前面有一个斜杠“/”,空元素不需要也不允许结束标签。如果元素属性未标明,则使用其默认值。

例子

HTML文档的页眉:<head>...</head>。标题被包含在头部,例如:

<head>
  <title>The Title</title>
</head>

标题:HTML标题由<h1><h6>六个标签构成,字体由大到小递减:

<h1>Heading level 1</h1>
<h2>Heading level 2</h2>
<h3>Heading level 3</h3>
<h4>Heading level 4</h4>
<h5>Heading level 5</h5>
<h6>Heading level 6</h6>

段落:

<p>第一段</p>  <p>第二段</p>

换行:<br><br><p>之间的差异是br换行但不改变页面的语义结构,而p部分的页面成段。

<p>這是<br>一個<br>使用換行<br>段落</p>

链接:使用<a>标签来创建链接。href属性包含链接的URL地址。

<a href="https://zh.wikipedia.org/">中文維基百科的連結!</a>

注释:

<!-- This is a comment -->

注释有助于理解标记,但它不会在网页上显示。

HTML中存在以下几种类型的标记元素:

用于文本的结构式标记
例如,<h2>羽毛球</h2>将“羽毛球”定义为二级标题。结构式标记不指示任何特定的渲染,但大多数网页浏览器都会采用元素格式的默认样式。要在内容上实现进一步的风格可以使用层叠样式表(CSS)[58]
用于文本外观的表现式标记,不论其目的
例如,'''粗体'''表示视觉输出装置应将文本“粗体”加粗,但如果装置无法做到这一点(如朗读文本的听觉装置),就不会发生什么现象。在这种情况下,'''粗体'''''斜体''也可能有相同的视觉效果,但在本质上它们更加语义化。如同'''加强文字'''''强调文字''的区别。为支持CSS的使用,大多数表现式标记在HTML 4.0规范中不再被推荐使用。
超文本标记使文档的一部分链接到其他文档
锚元素在文档中创建超链接,其href属性设置链接的目标URL。例如:HTML标记<a href="https://zh.wikipedia.org/">中文维基百科</a>会将文字"中文维基百科页面存档备份,存于互联网档案馆"渲染为超链接。要将图片渲染为超链接,img元素要作为内容插入到a元素中:<a href="https://example.org"><img src="image.gif" alt="说明文字" width="50" height="50" border="0"></a>

属性

大多数元素的属性以“名称-值”的形式成对出现,由“=”分离并写在开始标签元素名之后。值一般由单引号或双引号包围,有些值的内容包含特定字符,在HTML中可以去掉引号(XHTML不行)[59][60]。不加引号的属性值被认为是不安全的[61]。有些属性无需成对出现,仅存在于开始标签中即可影响元素[9],如img 元素的ismap 属性[62]

许多元素存在一些共通的属性:

  • id属性为元素提供了在全文档内的唯一标识。它用于识别元素,以便样式表可以改变其表现属性,脚本可以改变、显示或删除其内容或格式化。对于蒂姆加到页面的URL,它为元素提供了一个全局唯一标识,通常为页面的子章节。例如,ID "属性"对于https://zh.wikipedia.org/wiki/HTML#属性
  • class属性提供一种将类似元素分类的方式。常被用于语义化或格式化。例如,一个HTML文档可指定类<class="标记">来表明所有具有这一类值的元素都从属于文档的主文本。格式化后,这样的元素可能会聚集在一起,并作为页面脚注而不会出现在HTML代码中。类属性也被用于微格式的语义化。类值也可进行多声明。如<class="标记 重要">将元素同时放入標記重要两类中。
  • style属性可以将表现性质赋予一个特定元素。比起使用idclass 属性从样式表中选择元素,“style”被认为是一个更好的做法,尽管有时这对一个简单、专用或特别的样式显得太繁琐。
  • title属性用于给元素一个附加的说明。 大多数浏览器中这一属性显示为工具提示英语Tooltip
  • lang属性用于识别元素内容的语言,它可能与文档的主要语言不同。例如,在中文文档中:
    <p>法语<span lang="fr">c'est la vie</span>在法国的应用很普遍,意为“这就是生活” 。<p>
    

缩写元素abbr可用于说明一些属性:

<abbr id="ID" class="术语" style="color:purple;" title="超文本标记语言">HTML</abbr>

这个例子显示为HTML; 在大多数浏览器中,光标指向缩写时会显示标题文字“超文本标记语言”。

大多数元素采用与语言相关的属性dir 来指定文字方向,如 "rtl"采用从右到左的文本,比如阿拉伯语波斯语以及希伯来语[63]

字符与实体引用

在4.0版本中,HTML定义了一系列共252个字符实体引用和1,114,050个字符值参考。二者都支持单个字符通过简单的标记写入。文字字符与其对应的标记渲染的效果相同。

用这种方式“转义”字符的能力允许字符<&(当分别被写作&lt;&amp;时)被理解为字符数据而不是标记。例如<通常为标签的开头,&通常为字符实体引用与数字字符引用的开头;&amp;&#x26;&#38;&作为元素的内容或属性的值。双引号字符"在不被用于属性值的标示时必须转义为&quot;&#x22;&#34;;相等地,当于单引号字符'不被用于属性值的标示时,也必须转义为&#x27;&#39;(或HTML5与XHTML文档中的&apos;[64][65])。

如果文档作者忽略了转义这样的字符,一些浏览器会尝试通过上下文猜测他们的意图。如果结果仍为无效标记,这会使其他浏览器或用户代理难以访问到该文档,并使它们尝试使用搜索和索引来解析该文档。

那些难以输入或不在该文档字符编码中的字符也可通过转义来实现。例如通常只在西欧或南美的键盘出现的重音符eé),可以在HTML文档中用作实体引用&eacute; 或数字引用&#xE9;&#233;。 诸如UTF-8Unicode字符编码与所有的现代浏览器兼容并允许直接访问全球书写系统几乎所有的字符 [66]

数据类型

HTML为元素内容定义了多种数据类型,如脚本数据、样式表数据以及许多属性值的类型,包括ID、名称、URI、数字长度单位、语言、媒体描述符颜色、字符编码、日期和时间等等。所有这些数据类型都是字符数据的特殊化。

文档类型声明

HTML文档需要以文档类型声明英语document type declaration(英语非正式说法“doctype”)开头。在浏览器中,文档类型声明有助于确定渲染模式——特别是是否使用怪异模式

文档类型声明的初衷是通过基于文档类型定义(DTD)的SGML工具来解析并验证HTML文档。

HTML5未定义DTD,所以在HTML5中文档类型声明更为简短:[67]

<!DOCTYPE html>

HTML 4文档类型声明举例:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

该声明引用HTML 4.01“严格”版的DTD。基于SGML的验证器可读取DTD,正确解析这些文档并执行验证。在现代浏览器中,一个有效的文档类型激活标准模式有别于怪异模式

另外,HTML 4.01提供过渡型与框架集型的DTD。过渡型涵盖最广,它可集成当前以及老旧或“过时”的标签,而严格型DTD排除了过时的标签。框架集拥有所有构建框架所需的标签以及过渡型的标签。[68]

语义化HTML

语义化HTML是一种编写HTML的方式,它强调编码资讯的含义在其格式(样子)之上。HTML从创立之初就包括语义化标记[69],但也包括标识性标记如<font><i><center>标签。也存在一些语义上中立的span与div标签。自1990年代末CSS开始应用于大多数浏览器,网页制作者就被鼓励使用CSS以便呈现与内容分离[70]

在2001年一次对语义网的讨论中,蒂姆·伯纳斯-李等人给出了一种的方法,使智慧软件“代理人”可能有一天会自动抓取网页进行查找、过滤并将之前不相关的联络起来[71]。这种代理甚至在现在也不普遍,但一些Web 2.0混搭价格比较网站的想法可能会结束。这些网页应用程式的混合与伯纳斯-李的语义代理人的之间主要区别基于以下事实:当前的聚合与资讯混合通常由网页开发者设计,他们早已知道网络位置和他们希望混搭、比较与结合的特定数据的API语义。

网页代理的一个重要类型是网络爬虫或搜索引擎蜘蛛。这些软件代理依赖于它们发现的网页的语义清晰度,因为它们一天要使用各种技术与算法来读取和索引数百万个网页并给网页用户提供搜索工具,没有这些万维网的有效性就会大大降低。

为使搜索引擎蜘蛛评估它们在HTML文档中发现的文本片段的重要性,也为那些创建标记等混合的人与更多的自动化代理工具,HTML中的语义结构需要广泛一致地应用从而将文本的含义呈现给浏览者。[72]

表示性标记在当前的HTML和XHTML推荐中不被鼓励使用。旧版本HTML中的大多数表示功能不再被允许使用,因为它们导致可访问性变差、站点维护成本变高和文档大小变大。[73]

好的语义化HTML也改善了网页文档的可访问性(参见网页内容无障碍指南英语Web Content Accessibility Guidelines)。例如,当屏幕阅读器或音频浏览器可以正确判定一个文档的结构时,视觉障碍用户不会再因阅读重复或无关的资讯而浪费时间。

分发

HTML文档分发的方法和其他电脑文件相同。不过,它们最常通过网页伺服器超文本传输协议电邮传输。

HTTP

万维网主要由从伺服器通过HTTP协议向浏览器发送的HTML文档组成。但是,HTTP也可以被用于传输HTML之外的数据,例如图像、声音和其他内容。为使浏览器了解如何处理接收到的文档,在传输文档时必须同时传递文件类型。这种元数据包含MIME类型(对于HTML 4.01或更早版本是text/html,而对于XHTML 1.0或之后的版本是application/xhtml+xml),以及字符编码(参见HTML字符编码方式)。

在现在的浏览器中,和HTML文档一起发送的MIME类型影响文档的解读方式。和XHTML MIME类型一起发送的文档被认为是良构的XML,而语法错误会导致浏览器无法呈现文档。完全相同的文档如果和HTML MIME类型一起发送,则可能被正常显示,因为浏览器对HTML的语法检查更加松懈些。

W3C的推荐指出,遵循规定的推荐指引的XHTML 1.0文档可标记二者任一的MIME类型[74]。XHTML 1.1还指出,XHTML 1.1文档应[75]标有两种MIME类型[76]

HTML邮件

大多数图形电邮客户端允许使用HTML的子集(经常界限不清)提供格式化和无法使用纯文本语义标记。这可能包括印刷资讯,如彩色标题、强调和引用文本、内嵌图片和图表等。许多这样的客户包含一个编写HTML电邮消息的图形用户界面编辑器和一个用于显示的渲染引擎。在邮件中使用HTML受到了一些兼容性的批评,由于一些盲人或具有视觉障碍的人的访问问题,这种方式有利于伪装的钓鱼攻击。因其消息大小超过明文,所以它可混淆垃圾邮件过滤器。

命名规则

最常用的电脑文件扩展名.html,通用缩写为.htm。它起源于某些早期操作系统与文件系统,如DOS以及FAT数据结构的局限性,它将文件扩展名限制为3个字母[77]

HTML应用程式

HTML应用程式(HTA;文件扩展名".hta")是一个Microsoft Windows应用程式,它在浏览器中使用HTML和动态HTML提供应用程式图形界面。正规HTML文件被限制在浏览器的安全模型中,只能分别通过网页伺服器和网页对象与站点Cookie进行通信和操作。HTA作为完全受信任的应用程式运行,因此拥有更多的权限,如创建/编辑/删除文件与注册表项。因为它们在浏览器安全模式之外操作,所以HTA不能通过HTTP执行,必须下载(就像EXE文件)并在本地文件系统执行。

所见即所得编辑器

所见即所得编辑器使用图形用户界面(GUI)显示HTML文档,常常类似于文字处理器,所以用户可以设计一切。编者面对的是文档,而不是代码,所以作者并不需要太多的HTML知识。这种所见即所得的编辑模式一直受到诟病[78][79],主要因为它生成的代码质量不高;也有人主张将其改变至WYSIWYM模型(所见即所指)。

所见即所得的编辑器仍然是一个有争议的话题,由于人们普遍认为它们存在以下缺陷:

  • 主要依赖于布局而不是其具体含义,经常使用并不能传达预期含义而只是简单复制布局的标记[80]
  • 经常产生非常冗长和重复的代码,而这些代码并没有利用HTML和CSS的级联特性。
  • 经常产生语法不正确的标记,被称为“标签汤”或语义不正确的标记(例如使用<em>来表示斜体)。
  • 由于HTML文档中的大量资讯并是不在布局中,所以这种模型因其“所见即所得”的特性而一直受到诟病[81]

参见

参考文献

  1. ^ HTML 5.2. W3C. 2017-12-14 [2018-03-02]. (原始内容存档于2018-02-21). 
  2. ^ HTML 5.3 Editor’s Draft. W3C. 2017-03-01 [2018-03-02]. (原始内容存档于2018-03-05). 
  3. ^ Flanagan, David. JavaScript - The definitive guide 6. : 1. JavaScript is part of the triad of technologies that all Web developers must learn: HTML to specify the content of web pages, CSS to specify the presentation of web pages, and JavaScript to specify the behaviour of web pages. 
  4. ^ HTML 4.0 Specification — W3C Recommendation — Conformance: requirements and recommendations. World Wide Web Consortium. 1997-12-18 [2015-07-06]. (原始内容存档于2015-05-15). 
  5. ^ Tim Berners-Lee, "Information Management: A Proposal." CERN (March 1989, May 1990). W3.org页面存档备份,存于互联网档案馆
  6. ^ Tim Berners-Lee, "Design Issues"页面存档备份,存于互联网档案馆
  7. ^ Tim Berners-Lee, "Design Issues"页面存档备份,存于互联网档案馆
  8. ^ HTML Tags. [2021-06-29]. (原始内容存档于2019-11-16). 
  9. ^ 9.0 9.1 9.2 Tags used in HTML. World Wide Web Consortium. 1992-11-03 [2008-11-16]. (原始内容存档于2010-01-31). 
  10. ^ First mention of HTML Tags on the www-talk mailing list. World Wide Web Consortium. 1991-10-29 [2007-04-08]. (原始内容存档于2007-02-24). 
  11. ^ Index of elements in HTML 4. World Wide Web Consortium. 1999-12-24 [2007-04-08]. (原始内容存档于2007-05-05). 
  12. ^ Tim Berners-Lee. Re: SGML/HTML docs, X Browser (archived www-talk mailing list post). 1991-12-09 [2007-06-16]. (原始内容存档于2007-12-22). SGML is very general. HTML is a specific application of the SGML basic syntax applied to hypertext documents with simple structure. 
  13. ^ Raymond, Eric. IETF and the RFC Standards Process. The Art of Unix Programming. [2016-01-22]. (原始内容存档于2005-03-17). In IETF tradition, standards have to arise from experience with a working prototype implementation — but once they become standards, code that does not conform to them is considered broken and mercilessly scrapped. ...Internet-Drafts are not specifications; software implementers and vendors are specifically barred from claiming compliance with them as if they were specifications. Internet-Drafts are focal points for discussion, usually in a working group... Once an Internet-Draft has been published with an RFC number, it is a specification to which implementers may claim conformance. It is expected that the authors of the RFC and the community at large will begin correcting the specification with field experience. 
  14. ^ HTML+ Internet-Draft — Abstract. [2016-01-22]. (原始内容存档于2016-05-15). Browser writers are experimenting with extensions to HTML and it is now appropriate to draw these ideas together into a revised document format. The new format is designed to allow a gradual roll over from HTML, adding features like tables, captioned figures and fill-out forms for querying remote databases or mailing questionnaires. 
  15. ^ Berners-Lee, Tim; Connelly, Daniel. RFC 1866 – Hypertext Markup Language – 2.0. Internet Engineering Task Force. November 1995 [2010-12-01]. (原始内容存档于2011-08-27). This document thus defines an HTML 2.0 (to distinguish it from the previous informal specifications). Future (generally upwardly compatible) versions of HTML with new features will be released with higher version numbers. 
  16. ^ 16.0 16.1 16.2 Raggett, Dave. Raggett on HTML 4. 1998 [2007-07-09]. (原始内容存档于2007-06-25). 
  17. ^ HTML5 – Hypertext Markup Language – 5.0. Internet Engineering Task Force. 2014-10-28 [2014-11-25]. (原始内容存档于2014-11-02). This document recommends HTML 5.0 after completion. 
  18. ^ HTML 3.2 Reference Specification. World Wide Web Consortium. 1997-01-14 [2008-11-16]. (原始内容存档于2010-06-19). 
  19. ^ IETF HTML WG. [2007-06-16]. (原始内容存档于2007-06-07). Note: This working group is closed 
  20. ^ 20.0 20.1 Arnoud Engelfriet. Introduction to Wilbur. Web Design Group. [2007-06-16]. (原始内容存档于2007-07-05). 
  21. ^ HTML 4.0 Specification. World Wide Web Consortium. 1997-12-18 [2008-11-16]. (原始内容存档于2011-06-06). 
  22. ^ HTML 4 – 4 Conformance: requirements and recommendations. [2009-12-30]. (原始内容存档于2010-01-06). 
  23. ^ HTML 4.0 Specification. World Wide Web Consortium. 1998-04-24 [2008-11-16]. (原始内容存档于2008-07-27). 
  24. ^ HTML 4.01 Specification. World Wide Web Consortium. 1999-12-24 [2008-11-16]. (原始内容存档于2008-11-15). 
  25. ^ 25.0 25.1 ISO. ISO/IEC 15445:2000 – Information technology – Document description and processing languages – HyperText Markup Language (HTML). 2000 [2009-12-26]. (原始内容存档于2009-07-07). 
  26. ^ Cs.Tcd.Ie页面存档备份,存于互联网档案馆). Cs.Tcd.Ie (2000-05-15). Retrieved on 2012-02-16.
  27. ^ HTML5: A vocabulary and associated APIs for HTML and XHTML. World Wide Web Consortium. 2014-10-28 [2014-10-31]. (原始内容存档于2014-10-30). 
  28. ^ Open Web Platform Milestone Achieved with HTML5 Recommendation (新闻稿). World Wide Web Consortium. 2014-10-28 [2014-10-31]. (原始内容存档于2014-10-30). 
  29. ^ Connolly, Daniel. MIME as a hypertext architecture. CERN. 1992-06-06 [2010-10-24]. (原始内容存档于2010-12-26). 
  30. ^ Connolly, Daniel. HTML DTD enclosed. CERN. 1992-07-15 [2010-10-24]. (原始内容存档于2010-11-20). 
  31. ^ Connolly, Daniel. document type declaration subset for Hyper Text Markup Language as defined by the World Wide Web project. CERN. 1992-08-18 [2010-10-24]. (原始内容存档于2012-03-14). 
  32. ^ 32.0 32.1 Connolly, Daniel. Document Type Definition for the Hyper Text Markup Language as used by the World Wide Web application. CERN. 1992-11-24 [2010-10-24]. (原始内容存档于2012-01-18).  See section "Revision History"
  33. ^ Berners-Lee, Tim; Connolly, Daniel. Hyper Text Markup Language (HTML) Internet Draft version 1.1. IETF IIIR Working Group. June 1993 [2010-09-18]. (原始内容存档于2010-11-16). 
  34. ^ Berners-Lee, Tim; Connolly, Daniel. Hypertext Markup Language (HTML) Internet Draft version 1.2. IETF IIIR Working Group. June 1993 [2010-09-18]. (原始内容存档于2009-04-15). 
  35. ^ Berners-Lee, Tim; Connolly, Daniel. HyperText Markup Language Specification – 2.0 INTERNET DRAFT. IETF. 1994-11-28 [2010-10-24]. (原始内容存档于2010-08-19). 
  36. ^ HTML 3.0 Draft (Expired!) Materials. World Wide Web Consortium. 1995-12-21 [2008-11-16]. (原始内容存档于2008-10-25). 
  37. ^ 37.0 37.1 HyperText Markup Language Specification Version 3.0. [2007-06-16]. (原始内容存档于2007-07-06). 
  38. ^ Raggett, Dave. HyperText Markup Language Specification Version 3.0. HTML 3.0 Internet Draft Expires in six months. World Wide Web Consortium. 1995-03-28 [2010-06-17]. (原始内容存档于2010-03-14). 
  39. ^ Bowers, Neil. Weblint: Just Another Perl Hack. [2016-01-22]. (原始内容存档于2011-05-11). 
  40. ^ Lie, Håkon Wium; Bos, Bert. Cascading style sheets: designing for the Web. Addison Wesley Longman. April 1997: 263 [2010-06-09]. (原始内容存档于2017-07-17). 
  41. ^ HTML5. World Wide Web Consortium. 2008-06-10 [2008-11-16]. (原始内容存档于2015-06-03). 
  42. ^ HTML5, one vocabulary, two serializations. [2009-02-25]. (原始内容存档于2008-12-17). 
  43. ^ W3C Confirms May 2011 for HTML5 Last Call, Targets 2014 for HTML5 Standard. World Wide Web Consortium. 2011-02-14 [2011-02-18]. (原始内容存档于2012-06-07). 
  44. ^ Hickson, Ian. HTML Is the New HTML5. [2011-01-21]. (原始内容存档于2012-06-07). 
  45. ^ HTML5 gets the splits.. netmagazine.com. [2012-07-23]. (原始内容存档于2012-07-25). 
  46. ^ HTML5. W3.org. 2012-12-17 [2013-06-15]. (原始内容存档于2013-06-20). 
  47. ^ Call for Review: HTML5 Proposed Recommendation Published W3C News. W3.org. 2014-09-16 [2014-09-27]. (原始内容存档于2014-09-26). 
  48. ^ Open Web Platform Milestone Achieved with HTML5 Recommendation. W3C. 2014-10-28 [2014-10-29]. (原始内容存档于2014-10-28). 
  49. ^ HTML5 specification finalized, squabbling over specs continues. Ars Technica. 2014-10-29 [2014-10-29]. (原始内容存档于2014-10-29). 
  50. ^ XHTML 1.0: The Extensible HyperText Markup Language (Second Edition). World Wide Web Consortium. 2000-01-26 [2008-11-16]. (原始内容存档于2008-11-14). 
  51. ^ XHTML 1.1 – Module-based XHTML — Second Edition. World Wide Web Consortium. 2007-02-16 [2008-11-16]. (原始内容存档于2008-11-14). 
  52. ^ XHTM 2.0. World Wide Web Consortium. 2006-07-26 [2008-11-16]. (原始内容存档于2008-11-15). 
  53. ^ XHTML 2 Working Group Expected to Stop Work End of 2009, W3C to Increase Resources on HTML5. World Wide Web Consortium. 2009-07-17 [2008-11-16]. (原始内容存档于2011-01-27). 
  54. ^ W3C XHTML FAQ. [2016-01-22]. (原始内容存档于2012-06-07). 
  55. ^ HTML5. W3C. 2013-10-19 [2016-01-22]. (原始内容存档于2013-10-20). 
  56. ^ Activating Browser Modes with Doctype页面存档备份,存于互联网档案馆). Hsivonen.iki.fi. Retrieved on 2012-02-16.
  57. ^ HTML Elements. w3schools. [2015-03-16]. (原始内容存档于2015-03-15). 
  58. ^ CSS Introduction. W3schools. [2015-03-16]. (原始内容存档于2015-03-17). 
  59. ^ On SGML and HTML. World Wide Web Consortium. [2008-11-16]. (原始内容存档于2008-11-17). 
  60. ^ XHTML 1.0 – Differences with HTML 4. World Wide Web Consortium. [2008-11-16]. (原始内容存档于2008-12-21). 
  61. ^ Korpela, Jukka. Why attribute values should always be quoted in HTML. Cs.tut.fi. 1998-07-06 [2008-11-16]. (原始内容存档于2008-11-21). 
  62. ^ Objects, Images, and Applets in HTML documents. World Wide Web Consortium. 1999-12-24 [2008-11-16]. (原始内容存档于2008-03-12). 
  63. ^ H56: Using the dir attribute on an inline element to resolve problems with nested directional runs. Techniques for WCAG 2.0. W3C. [2010-09-18]. (原始内容存档于2010-11-09). 
  64. ^ Character Entity Reference Chart. World Wide Web Consortium. 2012-10-24 [2016-01-26]. (原始内容存档于2013-08-14). 
  65. ^ The Named Character Reference &apos;. World Wide Web Consortium. 2000-01-26 [2006-02-09]. (原始内容存档于2009-02-12). 
  66. ^ The Unicode Standard: A Technical Introduction. [2010-03-16]. (原始内容存档于2010-03-10). 
  67. ^ "HTML: The Markup Language (an HTML language reference)"页面存档备份,存于互联网档案馆). Retrieved 2013-08-19.
  68. ^ SAMS teach yourself html and css 8th edition
  69. ^ Berners-Lee, Tim; Fischetti, Mark. Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor. San Francisco: Harper. 2000. ISBN 978-0-06-251587-2. 
  70. ^ Raggett, Dave. Adding a touch of style. W3C. 2002 [2009-10-02]. (原始内容存档于2009-10-06).  This article notes that presentational HTML markup may be useful when targeting browsers "before Netscape 4.0 and Internet Explorer 4.0". See the list of web browsers to confirm that these were both released in 1997.
  71. ^ Tim Berners-Lee, James Hendler and Ora Lassila. The Semantic Web. Scientific American. 2001 [2009-10-02]. (原始内容存档于2009-10-01). 
  72. ^ Nigel Shadbolt, Wendy Hall and Tim Berners-Lee. The Semantic Web Revisited (PDF). IEEE Intelligent Systems. 2006 [2009-10-02]. (原始内容存档 (PDF)于2009-09-18). 
  73. ^ HTML: The Living Standard. WHATWG. [2018-09-27]. (原始内容存档于2018-09-27). 
  74. ^ XHTML 1.0 The Extensible HyperText Markup Language (Second Edition). World Wide Web Consortium. 2002 [2000] [2008-12-07]. (原始内容存档于2008-12-04). XHTML Documents which follow the guidelines set forth in Appendix C, "HTML Compatibility Guidelines" may be labeled with the Internet Media Type "text/html" [RFC2854], as they are compatible with most HTML browsers. Those documents, and any other document conforming to this specification, may also be labeled with the Internet Media Type "application/xhtml+xml" as defined in [RFC3236]. 
  75. ^ RFC 2119: Key words for use in RFCs to Indicate Requirement Levels. Harvard University. 1997 [2008-12-07]. (原始内容存档于2008-12-06). 3. SHOULD This word, or the adjective "RECOMMENDED", mean that there may exist valid reasons in particular circumstances to ignore a particular item, but the full implications must be understood and carefully weighed before choosing a different course. 
  76. ^ XHTML 1.1 – Module-based XHTML — Second Edition. World Wide Web Consortium. 2007 [2008-12-07]. (原始内容存档于2008-12-17). XHTML 1.1 documents SHOULD be labeled with the Internet Media Type text/html as defined in [RFC2854] or application/xhtml+xml as defined in [RFC3236]. 
  77. ^ Naming Files, Paths, and Namespaces. Microsoft. [2015-03-16]. (原始内容存档于2015-04-02). 
  78. ^ Sauer, C.: WYSIWIKI – Questioning WYSIWYG in the Internet Age. In: Wikimania (2006)
  79. ^ Spiesser, J., Kitchen, L.: Optimization of HTML automatically generated by WYSIWYG programs. In: 13th International Conference on World Wide Web, pp. 355—364. WWW '04. ACM, New York, NY (New York, NY, U.S., May 17–20, 2004)
  80. ^ XHTML Reference: blockquote Archived 2010-03-25 at the Wayback Machine. Xhtml.com.[2023-10-16].
  81. ^ Invisible Revolution. www.invisiblerevolution.net. [2023-10-17]. (原始内容存档于2021-12-09). 

延伸阅读