xml解析技术

xiaoxiao2025-08-17  23

XML解析技术

Xml(可扩展标记语言)全称:extened Markup Language 可扩展的含义:允许程序员按照自己的想法去扩展新的标签 扩展时,需遵循XML规范。 Xml特点: 自带描述性 可支持跨平台 保留了面向对象编程的层次感 编写xml的语法: 1、 头,也称序言 包含了(文档声明 注释 空白) 2、 文档元素包含(注释,空白,标签,内容,标签描述)

注释的作用告诉xml解析器,不要解析 空白的使用: 在xml中,可以使用空格,制表符,回车等等的方式让结构更加的清晰 Xml的文档元素: <开始标签>内容</结束标签>如: 张三 元素是整个文档中最基本的数据存储单位或者逻辑单位 定义标签时,需遵循以下规范: 1、 标签名的定义,可以使用中文,英文,数字,下划线 但是名称必须使用下划线或者字母开始(数字不能开始,下划线中文不推荐使用) 2、 每一个xml 文档中一定要根标签 根标签内部可以扩展子标签 3、 每一个xml文档中,至少需要存在1个标签元素 否则该文档就没有存在的含义。 4、 定义标签名时,一定不能在名称中使用空格 冒号 !;等等其他的符号 5、 定义标签名时,一定不要再名称中包含xml或者xml.等内容。 元素内容: 1、 字符数据 所有的中英文 数字 各种符号,需注意< > & ‘ “ 2、 嵌套标签(嵌套元素) 3、 实体所谓的实体就是<>&’ ”符号的替代 < 你应该用<

你应该使用&glt; & 你应该使用& “ 你应使用"去替代它 ‘你应该使用'去替代它

4、 静态语句块

<![CDATA[]]>

告诉xml解析器,内部没什么特殊含义,就是一个普通的字符串 元素还可以添加属性: 属性的作用:进一步修饰该元素 定义属性名称的时候,也需要遵循一定规则: 1、 属性名称可以包含字母,下划线 中文(但是不推荐使用中文)不能包含<>;”’等无法识别的符号 2、 属性名不能重复 3、 属性名严格区分大小写 4、 定义属性名时一定不能包含xml(XML)及xml.和.xml 5、 属性定义的方式,采用k-v键值对进行定义如type=”String”,值必须包含在“”内,引号必须成对出现 规范格式: DTD Schema XML的解析技术: DOM/SAX ------完成oxM opject-XML-Mapping DOM文档对象模型,采用树形结构来完成对文档的解析,它在解析时,会将整个文档加载内存中,然后形成"节点树"当文档内容过多,或者是需要解析的文档太多,此时可能会造成服务器内存紧张的问题。 SAX基于事件驱动模式下的文档解析技术

DOM4J框架,针对DOM和SAX的解析技术,目前使用较为广泛。

转载请注明原文地址: https://www.6miu.com/read-5034944.html

最新回复(0)