公告:如果您的账号不能登录,可能是系统对您账号进行了保护,我们发现系统中存在着不安全密码,故对其重置,请您重新激活账号,对于给您造成的不便,敬请谅解!
论坛风格切换切换到宽版
  • 27039阅读
  • 0回复

采集链接地址有错,单页测试能采,但正式采集为空 [复制链接]

上一主题 下一主题
离线hyzhangy
 

发帖
10
贡献值
31
威望值
16
技术分
0
织梦币
0
只看楼主 倒序阅读 使用道具 0 发表于: 2016-11-15
  • 网站地址:www.jsha12320.cn
  • 版本:V5.7
  • 语言编码:UTF8
  • 是否更新最新补丁:已经更新
  • 是否进行过修改:没有做过修改
在采集http://wsj.huaian.gov.cn/wjyw/szdt/list_(*).html时,单个测试页正常采集,
采集页列表区域中文章地址为:   <a href="wjyw/szdt/content/5e38cfb9577bf61b0157b184249b0f11.html" 这种形式,
但在"采集并测试"时,列表页变成了:
            [link] => http://wsj.huaian.gov.cn/wjyw/szdt/wjyw/szdt/content/5e38cfb9577bf61b0157b184249b0f11.html
        中间多了/wjyw/szdt/

导致无法采集正常页面内容, 不知用什么方法使得列表页地址正确?