查看: 807|回复: 7|关注: 0

[已解决] matlab 爬虫,可网址不会随着跳到下一页而变化

[复制链接]

新手

11 麦片

财富积分


050


2

主题

20

帖子

1

最佳答案
网址:北京首都国际机场(我还没有权限法网址,请大家手动搜索),航班信息——航班实况;
1.jpg 2.jpg

新手

11 麦片

财富积分


050


2

主题

20

帖子

1

最佳答案
 楼主| 发表于 2018-1-14 22:08:07 | 显示全部楼层
问题描述地还不够清楚吗??

MATLAB 基础讨论
版块优秀回答者

入门

307 麦片

财富积分


50500


10

主题

347

帖子

65

最佳答案
  • 关注者: 10
发表于 2018-1-15 13:48:41 | 显示全部楼层 |此回复为最佳答案
本帖最后由 逻辑逻辑 于 2018-1-15 15:45 编辑
心花怒放之天空 发表于 2018-1-14 22:08
问题描述地还不够清楚吗??


base = ['ht*tp://ww*w.bcia.com.cn/business/flightInfo.jspx?action=list&ajax=html/'  'language=zh&pageInfo.pageIndex=2&direction=0&dayNo=1&startTime=0&endTime=24&flightNO=%E8%BE%93%E5%85%A5%E8%88%AA%E7%8F%AD%E5%8F%B7&flightCity=%E4%B8%AD%E6%96%87%2F%E6%8B%BC%E9%9F%B3&airline=%E4%B8%AD%E6%96%87%2F%E6%8B%BC%E9%9F%B3&flightStatus=0'];

自己把*去掉,然后pageInfo.pageIndex=1,这个是第一页,第二页pageInfo.pageIndex=2,这个自己循环就行

新手

11 麦片

财富积分


050


2

主题

20

帖子

1

最佳答案
 楼主| 发表于 2018-1-19 09:13:03 | 显示全部楼层
逻辑逻辑 发表于 2018-1-15 13:48
base = ['ht*tp://ww*w.bcia.com.cn/business/flightInfo.jspx?action=list&ajax=html/'  'language=zh&p ...

您好,按照您的回复已经成功获取数据,非常感谢,:handshake,授人以鱼不如授之以渔,所以,大神可不可以简单教教我是指怎样得到bsae的?以期望可以举一反三到其它网站。非常感谢!求回复:lol

MATLAB 基础讨论
版块优秀回答者

入门

307 麦片

财富积分


50500


10

主题

347

帖子

65

最佳答案
  • 关注者: 10
发表于 2018-1-19 09:20:40 | 显示全部楼层
心花怒放之天空 发表于 2018-1-19 09:13
您好,按照您的回复已经成功获取数据,非常感谢,,授人以鱼不如授之以渔,所以,大神可不可以 ...

用浏览器的F12里面,有一个网络功能你可以看数据是怎么来的,这样你就可以改了。(你可以百度一下)

新手

11 麦片

财富积分


050


2

主题

20

帖子

1

最佳答案
 楼主| 发表于 2018-1-19 10:29:48 | 显示全部楼层
逻辑逻辑 发表于 2018-1-19 09:20
用浏览器的F12里面,有一个网络功能你可以看数据是怎么来的,这样你就可以改了。(你可以百度一下) ...

嗯,我又认真思考了一下,发现把base写成 ['h*ttp://w*ww.bcia.com.cn/business/flightInfo.jspx?action=list&ajax=html/language=zh&pageInfo.pageindex=2&direction=1']也可以达到我的要求,而且这里把direction=后面换成1可以得到进港信息,不过我现在任然有地方没看明白,

1:原地址['bcia.com.cn/business/flightInfo.shtml']中的['flightInfo.shtml'] 为什么变成了 ['flightInfo.jspx?action=list&ajax=html'];

2: 再者就是['flightNO=%E8%BE%93%E5%85%A5%E8%88%AA%E7%8F%AD%E5%8F%B7&flightCity=%E4%B8%AD%E6%96%87%2F%E6%8B%BC%E9%9F%B3&airline=%E4%B8%AD%E6%96%87%2F%E6%8B%BC%E9%9F%B3']这里实在看不出%后面的一大堆数字和字母怎么来的。

可以简单讲一下吗?万分感谢!:handshake

MATLAB 基础讨论
版块优秀回答者

入门

307 麦片

财富积分


50500


10

主题

347

帖子

65

最佳答案
  • 关注者: 10
发表于 2018-1-19 10:46:32 | 显示全部楼层
心花怒放之天空 发表于 2018-1-19 10:29
嗯,我又认真思考了一下,发现把base写成 ['h*ttp://w*ww.bcia.com.cn/business/flightInfo.jspx?action= ...

那是中文编码,这个东西你复制到里面就知道了,你用urldecode运行一下就知道了。(另你去用F12里面的网络那个功能,自然就知道了)

新手

11 麦片

财富积分


050


2

主题

20

帖子

1

最佳答案
 楼主| 发表于 2018-1-19 20:33:28 | 显示全部楼层
逻辑逻辑 发表于 2018-1-19 10:46
那是中文编码,这个东西你复制到里面就知道了,你用urldecode运行一下就知道了。(另你去用F12里面的网络 ...

终于明白了,非常感谢!!!祝工作顺利!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /3 下一条

快速回复 返回顶部 返回列表