首页 > 代码库 > HTML5学习笔记简明版(1):HTML5介绍与语法
HTML5学习笔记简明版(1):HTML5介绍与语法
HTML5介绍
HTML5是继HTML4以后的下一代HTML标准规范,它提供了一些新的元素和属性(比如<nav>
站点导航块和<footer>
)。新型的标签有利于搜索引擎和语义分析,同一时候更好地帮助小屏幕装置和视障人士使用。除此之外,也提供了一些新的功能,比方视频音频用的<video>
和<audio>
,总结而言。有例如以下几大特点:
- 取消了一些HTML4里过时的元素和属性标记
当中包含纯粹显示效果的标记,如<font>
和<center>
,它们已经被CSS代替。HTML5 吸取了XHTML2 一些建议,包含一些用来改善文档结构的功能。比方,新的HTML 标签 header
, footer
, dialog
, aside
, figure
等的使用,将使内容创作者更加语义地创建文档,之前的开发人员在实现这些功能时一般都是使用div
。
- 内容与展示分离
b
和 i
标签依旧保留。但它们的意义和之前有所不同。这些标签的意义仅仅是为了将一段文字标识出来,而不是为了为它们设置粗体或斜体式样。u
,font
,center
,strike
这些标签则被全然去掉了。
- 新添加一些全新的表单输入对象
包含日期,URL,Email 地址。其他的对象则添加了对非拉丁字符的支持。
HTML5 还引入了微数据。这一使用机器能够识别的标签标注内容的方法。使语义Web 的处理更为简单。总的来说。这些与结构有关的改进使内容创建者能够创建更干净,更easy管理的网页,这种网页对搜索引擎。对读屏软件等更为友好。
- 全新的、更合理的标签
多媒体对象将不再所有绑定在 object
或 embed
Tag 中。而是视频有视频的Tag,音频有音频的 Tag。
- 本地存储
这个功能将内嵌一个本地的SQL 数据库,以加速交互式搜索。缓存以及索引功能。同一时候,那些离线Web 程序也将因此获益匪浅。不须要插件的富动画。
- Canvas对象
将给浏览器带来直接在上面绘制矢量图的能力,这意味着用户能够脱离Flash 和Silverlight,直接在浏览器中显示图形或动画。
- 新的API扩展
为HTMLDocument
和HTMLElement
借口提供了新的API扩展。
- HTML5代替Flash和Silverlight
语法(Syntax)
1 文档媒体类型
HTML5定义的HTML语法大部分都兼容于HTML4和XHTML1。可是也有一部分不兼容。大多数的HTML文档都是保存成text/html媒体类型。
HTML5为HTML语法定义了具体的解析规则(包含错误处理),用户必须遵守这些规则将它保存成text/html媒体类型。
例如以下是一个符合HTML语法规范的样例:
<!doctype html> <html> <head> <meta charset="UTF-8"> <title>Example document</title> </head> <body> <p>Example paragraph</p> </body> </html>
HTML5为HTML语法也定义了一个text/html-sandboxed媒体类型,以便能够host不信任的内容。
其他可以用在HTML5的语法是XML,它兼容于XHTML1。用XML语法的话须要将文档保存成XML媒体类型,而且依据XML的规范须要设置命名空间(namespace)为http://www.w3.org/1999/xhtml。
以下的样例文档符合HTML5里的XML语法规范,须要注意的是XML文档必须保存成XML媒体类型的。比如application/xhtml+xml或者application/xml。
<?xml version="1.0" encoding="UTF-8"?> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>Example document</title> </head> <body> <p>Example paragraph</p> </body> </html>
2 Character Encoding
HTML5的HTML语法里,有三种形式能够声明字符串的encoding类型:
- 在传输级别(transport level)上。在HTTP实例的header里设置Content-Type。
- 在文件的开头设置一个Unicode的Byte Order Mark(BOM)。该字符为文件的encoding方式提供了一个签名。
- 在文档的前1024个byte之前的内容里,使用带有charset属性的meta元素来声明encoding方式。
比如:<meta charset="UTF-8">表明该文档是UTF-8格式的。它是替换原有的<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">语法声明,虽然原有的语法依旧可用。但在HTML5里不推荐使用。
对于HTML5里的XML语法。依旧和曾经的XML语法声明式一样的。
3 DOCTYPE
HTML5的HTML语法要求文档必须声明DOCTYPE以确保浏览器能够在标准模式下展示页面。这个DOCTYPE没有其他的目的。而且在XML里是可选项,由于XML媒体格式的文档一直就是在标准模式下处理的。
DOCTYPE的声明方式是<!DOCTYPE html>,不区分大写和小写。
HTML的早期版本号声明的DOCTYPE须要非常长是由于HTML语言是建立在SGML的基础上,所以须要关联引用一个相相应的DTD。
HTML5和之前的版本号不一样了,只须要声明DOCTYPE就能够告诉文档启用的是HTML5语法标准了,浏览器会为<!DOCTYPE html>做剩余的工作的。
4 MathML和SVG
HTML5的HTML语法同意在文档里使用MathML(数学标记语言)和SVG(可伸缩矢量图)元素。比如。一个很easy的HTML页面包括一个svg元素画出的圆:
<!doctype html> <title>SVG in text/html</title> <p> A green circle: <svg> <circle r="50" cx="50" cy="50" fill="green"/> </svg> </p>
很多其它复杂的组合标记也是支持的,比方使用svg的foreignObject元素你能够嵌套MathML, HTML,或者自身嵌套。
5 其他
HTML5已经原生支持IRI了,虽然这些IRI仅仅能在UTF-8和UTF-16的文档里使用。
lang属性假设设置的不合法,将会更新为空字符串。以告诉浏览器是一个未知的语言。作用和XML里的xml:lang一样。
HTML5学习笔记简明版(1):HTML5介绍与语法