用java爬取数据,不知道该如何对网页中JS代码进行处理

用java爬取数据,不知道该怎么对网页中JS代码进行处理

小的近日在用java开源包htmlparser进行对网页中的数据爬取,但是很多网页中都嵌入了JS函数代码,必须鼠标点击,才触发JS函数,从服务器上索取数据(网页的静态地址不变,例如查看评论,收起回复),所以想问一下这样的话,我们可以利用java进行后台处理,即编写java代码运行网页中JS代码,然后获取数据呢?

谢谢。

------解决方案--------------------
有此类开源实现,本质上相当于Java写的浏览器,已经支持很多JS模拟运行,但并不是十分完美。

不过我认为你的需求不应该通过JS模拟执行去获取数据。这种效率太低。如果你的目标网站是固定的话,直接研究JS代码所访问的目标URL,然后直接取目标URL的内容好了。