火车采集器帮助文档 --> 多页管理
火车采集器  帮助文档

当采集的信息不在当前默认页,而在当前默认页某一个链接的所在页时,此时就要用到多页管理了,多页管理界面如下:

多页管理包括新建和编辑操作,新建时,所有多页配置清空;在多页列表选中某一多页然后双击或者点击编辑按钮,即可对当前多页进行编辑。

页面名称:用于区分多页的一个标志吧,必填项。

页面地址:获取多页的方式有两种方式,(a)依据规则对默认页地址替换生成地址,(b)在默认页源代码内采集得到地址。

若选择(a)操作, 填写将“XXX”,替换为“YYY”两个文本框,若默认页地址包含XXX,如http://www.abc.com/a/XXX.html,则点击测试按钮时,将得到测试结果http://www.abc.com/a/YYY.html。

若选择(b)操作

填写“正则匹配内容”和“组合结果”文本框,然后填写默认页地址,如:http://www.abc.com,若在默认页地址用正则匹配到的参数值为baidu,点击测试按钮时,则得到的测试结果为:http://www.baidu.com。

保存:保存当前多页配置。

取消:退出多页管理配置。

上一篇   下一篇