相关教程
教程地址:帝国CMS采集教程&采集详细教程
1)后台>管理栏目>增加采集节点
2)“选择要增加采集的栏目”
选择终极栏目 后进入增加节点表单:
3)由于前面许多选项是依实际需求而设定。
下面主要讲解正则的主要内容:
1)输入“采集页面地址”列表
如下图:(每个列表用回车格开)
2)由于采集列表页的信息链接正则不包含域名,所以要设置地址前缀:
3)设置“信息页链接正则”:
说明:由于此采集页面不需要设置“信息链接区域正则”,所以直接设置“信息页链接正则”即可。
上面正则由下面得出的:(查看列表页的源文件:http://www.phome.net/document/java/)
说明:因为下面链接地址没有加上域名,所以我们上面要设置“内容页地址前缀”。
4)设置“标题正则”:
上面正则由下面得出的:(查看内容页的源代码:http://www.phome.net/document/java/200505/java111590843215168.html)
5)设置“作者正则”:
上面正则由下面得出的:(查看内容页的源代码)
6)设置“信息来源正则”:
上面正则由下面得出的:(查看内容页的源代码)
7)设置“新闻正文正则”:
上面正则由下面得出的:(查看内容页的源代码)
8)点击“提交”按钮即可增加完毕.