有用神箭手的吗,问个正则问题?
我想采集1-45页的内容,helperUrlRegexes: ["http://***\/page\/^(||)$"], //列表页
这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导
来个大佬~~~
static/image/smiley/default/cry.gif
本帖最后由 Carseason 于 2018-1-24 12:19 编辑
http:\/\/[^"]+\/page\/{0,1}$
这样子试一试
Carseason 发表于 2018-1-24 12:17
http:\/\/[^"]+\/page\/{0,1}$
这样子试一试
多谢!
static/image/smiley/default/handshake.gif
按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
static/image/smiley/default/victory.gif
页:
[1]