重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
本篇文章给大家分享的是有关Python如何读取网络数据,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
创新互联公司为您提适合企业的网站设计 让您的网站在搜索引擎具有高度排名,让您的网站具备超强的网络竞争力!结合企业自身,进行网站设计及把握,最后结合企业文化和具体宗旨等,才能创作出一份性化解决方案。从网站策划到网站建设、网站制作, 我们的网页设计师为您提供的解决方案。
很多时候,程序并不能直接展示本地文件中的数据,此时需要程序读取网络数据,并展示它们。
比如前面介绍的 http://lishi.tianqi.com 站点的数据,它并未提供下载数据的链接(前面程序所展示的 csv 文件本身就是使用程序抓取下来的)。在这种情况下,程序完全可以直接解析网络数据,然后将数据展示出来。
前面已经介绍了 Python 的网络支持库 urllib,通过该库下的 request 模块可以非常方便地向远程发送 HTTP 请求,获取服务器响应。因此,本程序的思路是使用 urllib.request 向 lishi.tianqi.com 发送请求,获取该网站的响应,然后使用 Python 的 re 模块来解析服务器响应,从中提取天气数据。
本程序将会通过网络读取 http://lishi.tianqi.com 站点的数据,并展示 2017 年广州的最高气温和最低气温。
import re from datetime import datetime from datetime import timedelta from matplotlib import pyplot as plt from urllib.request import * # 定义一个函数读取lishi.tianqi.com的数据 def get_html(city, year, month): #① url = 'http://lishi.tianqi.com/' + city + '/' + str(year) + str(month) + '.html' # 创建请求 request = Request(url) # 添加请求头 request.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64)' + 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36') response = urlopen(request) # 获取服务器响应 return response.read().decode('gbk') # 定义3个list列表作为展示的数据 dates, highs, lows = [], [], [] city = 'guangzhou' year = '2017' months = ['01', '02', '03', '04', '05', '06', '07', '08', '09', '10', '11', '12'] prev_day = datetime(2016, 12, 31) # 循环读取每个月的天气数据 for month in months: html = get_html(city, year, month) # 将html响应拼起来 text = "".join(html.split()) # 定义包含天气信息的div的正则表达式 patten = re.compile('(.*?)
程序中第 32 行代码使用正则表达式来获取包含全部天气信息的
程序中第 34 行代码使用正则表达式来匹配天气
程序中第 38 行代码使用正则表达式来匹配每日天气
以上就是Python如何读取网络数据,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联行业资讯频道。