使用Swift原生库解析XML数据

在实现文件操作的时候我意识到了一个事实:由于NSURL是可支持的路径,很多文件的操作实际上可以扩充到网络上去,比如从网上下载一个文件、拿取一些数据……想到这里,埋藏在心中很久的愿望又开始蠢蠢欲动:写一个新闻客户端!
我有一个常看的新闻网站(不要问我是哪个,要FQ),官方客户端很难用,第三方广告满天飞,严重影响心情。所以当初开始学iOS的时候就把重做一 个客户端的目标放在了首位。最开始的时候想得太简单,兴冲冲地开了个project,搞了两下TableView,然后发现……对于我这种从来只写底层代 码,swift/OC语法都不会的人,做这个简直是异想天开好嘛!
折腾的过程中,为了拿到数据,还跑去下了Android的官方客户端反编译,find + grep出来了人家的数据接口地址(论一个爱折腾的程序员是怎么给自己挖坑的),返回的是XML数据,连蒙带猜试了试,可以用!不过后来做UI受挫(其实 不止做UI,挫败感太大),就把那份东西闲置起来了。这两天突然想起来,现在我貌似感觉有点良好,何不捡起来继续写我的客户端?
因为UI我还一窍不通,不懂怎么调试,也不懂怎么把数据显示出来,为了避免到处打印的麻烦,我选择playground。这样也就是需要用原生库,这个很简单,搜一下就有了:NSXMLParserDelegate,还有好些源码,虽然大多是OC的。
问题是有源码,我依!然!看!不!懂!怎么用!每个教程都是扔了源码上来,可没人解释清楚到底怎么运行。我研究了好一阵,终于明白了大概的机制:

引用
自己写一个类继承NSXMLParserDelegate,就叫它XmlReader吧;并且实现一些必须的callback函数,在XmlReader的Init中调用.parse()方法,最后在new XmlReader的时候就会自动完成整个parse了

当然你也可以不把parse()放在init()中调用,而是在new了XmlReader之后强制调用,重要的是那些callback函数的实 现。XmlReader中还可以声明一些变量,来保存解析过程中的状态,而具体的获得到的数据填充,也是需要你自己做的(数据结构自行定义)。
鉴于XML是一个有层级的带递归意味的数据结构,程序会层层解析下去直到结束,中间遇到的各种类似section开始、结束、拿到字符串等情况都会call一个固定的函数,将解析出来的数据作为参数传进去,而你要做的,就是实现这些callback以完成自己想要做的事。
下面是具体的代码示范。首先是定义一个新的类:

Java代码
  1. class XmlReader: NSObject, NSXMLParserDelegate {
  2. var currentName :String? = nil
  3. var level :Int = 0
  4.  init(add :String ) {
  5.     super.init()
  6.     let url = NSURL(string:add)!
  7.     guard let parserXML = NSXMLParser(contentsOfURL: url) else {
  8.         return
  9.     }
  10.     parserXML.delegate = self
  11.     parserXML.parse()
  12.     }
  13. func parserDidStartDocument(parser: NSXMLParser) {}
  14. func parserDidEndDocument(parser: NSXMLParser){}
  15. func parser(parser: NSXMLParser, didStartElement elementName: String, namespaceURI: String?, qualifiedName qName: String?, attributes attributeDict: [String : String]) {}
  16. func parser(parser: NSXMLParser, didEndElement elementName: String, namespaceURI: String?, qualifiedName qName: String?) {}
  17. func parser(parser: NSXMLParser, var foundCharacters string: String) {}
  18. func parser(parser: NSXMLParser, parseErrorOccurred parseError: NSError) {}
  19. }

这是一个基础部分,里面定义了一些callback但没有实现它。我把xml的地址作为参数传给了init(),并且声明了两个变量 currentName和level分别用来保存当前的标签名字和递归深度。然后我们基于下面这个简单的XML文件继续完成callback部分:

Java代码
  1. <?xml version="1.0" encoding="UTF-8" standalone="no"?>
  2. <language cat="it">
  3.     <lan id="1">
  4.         <name>C#</name>
  5.         <IDE>vs</IDE>
  6.     </lan>
  7.     <lan id="2" />
  8. </language>

首先是文档开始和结束时:

Java代码
  1. //文档开始解析时触发,只触发一次
  2. func parserDidStartDocument(parser: NSXMLParser) {
  3.     print("    start")
  4. }
  5. //文档结束时触发,只触发一次,通常需要在这里给出一个信号告诉上层或其他人解析已经结束
  6. func parserDidEndDocument(parser: NSXMLParser){
  7.     print("    end")
  8. }

然后是标签的开始和结束事件:

Java代码
  1. //遇到一个开始标签触发,elementName为当前标签,如果当前标签有属性,则字典sttributeDict不为空
  2. func parser(parser: NSXMLParser, didStartElement elementName: String, namespaceURI: String?, qualifiedName qName: String?, attributes attributeDict: [String : String]()) {
  3.     self.currentName = elementName
  4.     self.level++
  5.     print("\(level) start, \(elementName), \(attributeDict)")
  6.     if currentName == "language" { // 获取language属性的内容
  7.         //print("language: \(attributeDict)")
  8.     }
  9. }
  10. //遇到结束标签触发,该方法主要是做一些清理工作,在这里我修改了当前的深度
  11. func parser(parser: NSXMLParser, didEndElement elementName: String, namespaceURI: String?, qualifiedName qName: String?) {
  12.     print("\(level) end, \(elementName)")
  13.     self.currentName = nil
  14.     self.level--
  15. }

接下来是字符串值的handler

Java代码
  1. // 遇到字符串时触发
  2. func parser(parser: NSXMLParser, var foundCharacters string: String) {
  3.     //删除首尾的回车符和空格
  4.     string = string.stringByTrimmingCharactersInSet(NSCharacterSet.whitespaceAndNewlineCharacterSet())
  5.     if string.isEmpty {
  6.         return
  7.     }
  8.     print("---- \(string)")
  9. }

最后是Error Handler

Java代码
  1. // 文档出错时触发
  2. func parser(parser: NSXMLParser, parseErrorOccurred parseError: NSError) {
  3.     print(parseError)
  4. }

以上的callback函数实现都只放了些打印信息,在实际操作中需要把这些获取的信息一一填充进自己的数据结构中。说实话是挺麻烦的,难怪都说XML快要被JSON全面取代(其实对于曾被libxml折磨过的码农来说,这已经挺好了)。全部的代码传送门:这里

本文转自:http://conanwhf.gitcafe.io/

  1. da shang
    donate-alipay
               donate-weixin weixinpay

发表评论↓↓