立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 299|回复: 3

有用神箭手的吗,问个正则问题?

[复制链接]

有用神箭手的吗,问个正则问题?

[复制链接]

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
jshkk

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
2018-1-24 11:51:58 | 显示全部楼层 |阅读模式
我想采集1-45页的内容,
helperUrlRegexes: ["http://***\/page\/^([1-9]|[1-3][0-9]|[4][0-5])$"], //列表页

这样子写似乎不对,在测试时直接提示“测试运行结束,爬虫自动停止,测试完毕!”,只跑了个示例的page=1
是这个正则有问题还是xpath的语法不对啊?求指导


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
jshkk 楼主

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
2018-1-24 12:08:37 | 显示全部楼层
来个大佬~~~

回复

使用道具 举报

6

主题

164

回帖

404

积分

中级会员

积分
404
Carseason

6

主题

164

回帖

404

积分

中级会员

积分
404
2018-1-24 12:17:50 | 显示全部楼层
本帖最后由 Carseason 于 2018-1-24 12:19 编辑

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试
回复

使用道具 举报

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
jshkk 楼主

44

主题

1027

回帖

3747

积分

论坛元老

积分
3747
2018-1-24 12:48:53 | 显示全部楼层

Carseason 发表于 2018-1-24 12:17

http:\/\/[^"]+\/page\/[1-4]{0,1}[0-9]$
这样子试一试

多谢!


按照你的方式测试了下,果然OK..
只要不带^的起始符就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2025-5-8 23:41 , Processed in 0.017143 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表