By admin |

如题,经过一段艰苦卓绝的开发历程,自己的drupal采集模块总算完成了.有以下特色:

1: 采用simple html dom作为html解析武器
2: 可以根据设定的content type进行自定义字段的采集.也就是每个字段可以针对性的写采集规则.
3: 运行taxonomy也进行自定义规则设定,从而产生动态的目录
4: 采用batch方式,可以直观反映当前采集进度
5: 可以把待采集链接写入一个表,通过cron,定期采集并发布文章.
6: 采集动作化,可以创建,编辑,删除采集动作
7: 待采集链接表,使用过vbo的hook后,可以后台进行管理,删除一些不需要定期发表的链接.
8: 就想到这么多,待续....

总体上,采集模块是模仿dede的那套流程,个人认为比dede更为强大.当然某些方面,跟dede也有差距.
不过这个,已经达到我写这个模块的设定目标了.
特此记录
卡萨布兰卡