
光用正则不用Xpath/DOM,有些时候蛮抓瞎的,比如
<span class='a'><span class='b'>bbb<span>aaaa<span>
其中<span class='b'>bbb<span>有时不出现
想提取出<span class='b'>bbb<span>aaaa很难啊……
试了PHP的几个函数,似乎不支持有错误的Html/Xml?至少没有浏览器那么Robust的样子。
比如http://share.dmhy.org 这种在https://validator.w3.org 能查出1776个错误的网页。
原生PHP有没有办法解决?request_once引用外部库也行,只要不上框架,不用编译PHP。
1 lianyue 2015-05-27 15:17:43 +08:00 噗 |
2 lianyue 2015-05-27 15:22:52 +08:00 |
3 lianyue 2015-05-27 15:27:19 +08:00 |