java 基于selenium实现爬取天气网数据

感觉java做爬虫效果也是还不错的,我总结了下主要有以下三种:

(一)基于jsoup

(二)基于httpcilent

(三)基于selenium

第一种和第二种类似,没多大难度,用法也很相似,但是经我亲自测试有个缺点:不能采集基于ajax请求的数据。这个就很令人蛋疼了。。。

第三种方法实际是基于浏览器的驱动模拟人工操作的,理论上可以采集网页的任何数据。不便之处就是每次需要打开一个浏览器不过也能接受。

今天主要就说说基于selenium实现爬取数据吧!!

第一步:pom.xml引入

第二步:

PageUtis里面的工具法法:

第三步:把浏览器驱动.exe放在项目根目录在此我上传到网盘,自行下载即可

https://xiwen.lanzoui.com/i6A5wgwmcyb