重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
利用Python的pandas数据结构来读取excel表格的数据,部分代码如下:
创新互联是一家集网站建设,振安企业网站建设,振安品牌网站建设,网站定制,振安网站建设报价,网络营销,网络优化,振安网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,index_col=u'日期')
#读取数据,指定"日期"列为索引列
大多数书上都是这样写的,但是在Python2.7上运行时出现错误。(没有在Python3.x版本试过)
出现了如下问题:
这里写图片描述
使用help(pd.read_excel)发现参数中有必选参数sheetname,加入到函数中,代码如下:
#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
catering_data="catering_sale.xls"
data=pd.read_excel(catering_data,sheetname=0,index_col=u'日期')
运行成功。
sheetname=0 的意思是:读取xls文件中的第一个表格。(假设文件中有很多个表格)
另外,也可以将文件转换成csv格式,就不需要这个参数了。代码如下:
catering_data="catering_sale.csv"
data=pd.read_csv(catering_data)
import pandas as pd
Python中import的as语法,pd作为pandas的简写,
后续对pandas的引用,可以直接使用pd
pd.DataFrame()函数是创建一个二维表
传入的两个参数:
第一个是所存放的数据
np.random.rand(100,4) 这个的意思是生成指定维度的的[0,1)范围之间的随机数,生成为维度100行4列的二维数组,下面的例子你可以作为参照
请点击输入图片描述
而之后的
cumsum()其实第一个参数本来传入的需要是数组,然后计算轴向元素累加和,
而你的例子中进行了简化,即np.cumsum(a, 0) == a.cumsum(0)
其中的传入参数0表示axis=0,即按照行累加,例子中即随机数的累加
举个例子a =[ [(1,2,3)],
[(4,5,6)] ]
a.cumsum(0)就是
[ [(1,2,3)],
[(5,7,9)] ]~~~~~~~~(1+4)(2+5)(3+6)
第二个参数columns是DataFrame的列名分别为ABCD