重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
使用webbrowser控件来加载网页,然后再 Private Sub WebBrowser1_DocumentCompleted下通过使用WebBrowser1.Document.Body.InnerHtml 来获取网页的源代码,或使用 WebBrowser1.Document.Body.InnerText来获取网页中的文本。之后可以通过字符串控制指令或者正则表达式来精确获取到你所需的数据。
我们一直强调成都网站设计、网站制作、外贸营销网站建设对于企业的重要性,如果您也觉得重要,那么就需要我们慎重对待,选择一个安全靠谱的网站建设公司,企业网站我们建议是要么不做,要么就做好,让网站能真正成为企业发展过程中的有力推手。专业网站建设公司不一定是大公司,创新互联作为专业的网络公司选择我们就是放心。
我前两天刚做过类似的事情,down了一个网站的产品库到数据库里。
第一步:把所有页面下载到本地
第二步:分析页面结构
第三步:通过正则表达式不断去掉没用的内容,找到规律做成2纬数组
第四步:当有二维数组的时候,就什么都有了。
只用python就行了啊。vs和pycharm都算是编辑器没什么关系啊,就是用记事本编辑也行哦。那就用pycharm吧,大家都吹嘘它好用。
就是用python的urllib模块请求网页就可以了。
登录就是post数据,然后获得cookie(可能还有一下其他的东西),带着它就可以做一些评论。
评论就是根据按钮找到相关的网页链接,向它post/get数据。
评论采集就是请求相关的网页,获得评论的数据,可能是html或者json之类的,然后用beautifulsoup或者json分析,获得格式化后的数据。
以前用Python做过一个空间的自动点赞、自动回复说说留言、获取留言的程序。
只要就是分析链接和js脚本费点时间。其他地方都简单。