drupal 采集 开发札记

Submitted by admin on Sat, 07/14/2012 - 18:49

今天对drupal 采集模块进行一次升级.
升级之后,对链接的匹配更强了.之前不能匹配论坛网页里面的link,里面很多table结构.

升级思路实在simple_html_dom写了一个finda方法,调用这个方法后,对连接的匹配大大加强了.

另外就是感觉simple html dom的功能还不够强大.听说phpquery不错.

抽个时间试试phpquery,如果真的够强大,又要重构代码了....一个考验细心的活....

还有个yql.
yql 是yahoo出的一款使用类似SQL的语言,来获取相应的数据,也很强大,无须任何类 库,可以直接调用,支持xpath,如果对SQL语句比较熟悉的话,可以考虑yql。

有空都试试吧.