xml文件由序言,元素(空元素,非空元素)和杂项三部分组成。
序言的结构:
xml的声明信息:
版本信息用于说明xml语言是用的版本,版本为1.0或者1.1 :version=”1.0″
编码信息用于说明xml的编码语言,如果为中文则表示为:encoding=”gb2312″
文档独立性信息用于说明xml文件是否可以独立而不依赖其它文档:standalone=”yes”表示独立显示。
文档类型声明:
1。在其他文件中声明文档类型
2。在xml文档中直接定义文档类型
]>
元素的结构:
元素的内容=(子元素|字符数据|字符数据段|引用|处理指令|注释)*
字符数据:文本内容没有使用标记和实体引用。
除字符数据外,其他元素内容都使用了标记或者实体引用的符号。
另外字符数据中也不能含有 :”^”,”>”,”&”,”]]>”.
xml预定义实体:
实体引用方式 代表的元素
& &
< <
> >
‘ ,
quot; ”
字符数据段:
xml中不希望xml处理的文字片断或者代码,脚本片段。
字符数据段=”
”
字符数据段必须放在根元素中:
例如:
my test
cdata test !]]>
用浏览器打开结果如下:
–
my test
–
cdata test ! ]]>
引用分为实体引用,字符引用。
实体引用首先需要声明,然后进行引用。声明时使用ENTITY关键字进行,引用使用&+实体引用名称+;进行用用。
实体引用示例:
]>
<就业信息>&company;
&company;这个实体引用被解析后会还原为原来的数据“连通公司”。
字符引用:
字符引用使用字符的ascii值,格式:&#+字符的ascii值+;