重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
本文小编为大家详细介绍“python数据实例分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“python数据实例分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。
站在用户的角度思考问题,与客户深入沟通,找到忻州网站设计与忻州网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:网站设计制作、做网站、企业官网、英文网站、手机端网站、网站推广、域名注册、虚拟主机、企业邮箱。业务覆盖忻州地区。
假设我们的数据是这样的,无异常无缺失值,下面我通过几个问题,我们来练习用Pandas进行探索性数据分析~
year | name | salary | title |
---|---|---|---|
2001 | aa | 1500 | first |
2002 | bb | 4300 | first |
2003 | cc | 7000 | second |
2001 | dd | 5000 | third |
我们将数据读取后命名为df
import pandas as pd
df['salary'].max()
同样的,最低(min)、平均(mean)。
突然想到了SQL,是不是一句话的事情,select...from...where... 当然,我们的pandas也是一句话的事情:
df[df['name']=='bb']['salary']
那我们就定位到收入最高的行~
df[df['salary']==df['salary'].max()]
# or
df.loc[df['salary'].idxmax()]
是不是自然而然想到了分组,group by?
df.groupby('year').mean()['salary']
这里使用nunique()函数,之前有一个小伙伴和我交流中就发现没有搞懂nunique()函数和unique()函数之间的区别,现在应该懂了吧?
df['title'].nunique()
读到这里,这篇“python数据实例分析”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注创新互联行业资讯频道。