重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
过程很繁琐,步骤如下:
创新互联于2013年创立,先为昭苏等服务建站,昭苏等地企业,进行企业商务咨询服务。为昭苏企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。
1、写按键精灵脚本,在手机上自动点击公号文章列表页,也就是“查看历史消息”;
2、使用fiddler代理劫持手机端的访问,将网址转发到本地用php写的网页;
3、在php网页上将接收到的网址备份到数据库;
4、用python从数据库取出网址,然后进行正常的爬取。
如果只是想爬取文章内容,似乎并没有访问频率限制,但如果想抓取阅读数、点赞数,超过一定频率后,返回就会变为空值,我设定的时间间隔为10秒,可以正常抓取,这种频率下,一个小时只能抓取360条,已经没什么实际意义了。
微信公众号数据储存
1、腾讯不对你在本服务中相关数据的删除或储存失败负责。
2、腾讯有权根据实际情况自行决定单个用户在本服务中数据的最长储存期限,并在服务器上为其分配数据最大存储空间等。你可根据自己的需要自行备份本服务中的相关数据。
3、如果你停止使用本服务或服务被终止或取消,腾讯可以从服务器上永久地删除你的数据。服务停止、终止或取消后,腾讯没有义务向你返还任何数据。
用curl
GET方法:
//初始化
$ch = curl_init();
//设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
//执行并获取HTML文档内容
$output = curl_exec($ch);
//释放curl句柄
curl_close($ch);
//打印获得的数据
print_r($output);
POST方法:
$url = "";
$post_data = array ("username" = "bob","key" = "12345");
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
// post数据
curl_setopt($ch, CURLOPT_POST, 1);
// post的变量
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
$output = curl_exec($ch);
curl_close($ch);
//打印获得的数据
print_r($output);
你说的应该需要分开
1、爬虫抓取数据
2、逆向微信发送信息(一般通过网页版微信扫二维码授权登录)
回答不够详细可以私信交流,如有需要也可提供有偿私活服务