重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
python去重并创建一个文件多个路径使用os模块。创建文件路径需要使用到的就是os模块之中的makedirs方法,它的参数必须要是绝对路径,相对路径的话是无法创建多文件夹多层路径的。
平川网站制作公司哪家好,找创新互联!从网页设计、网站建设、微信开发、APP开发、响应式网站等网站项目制作,到程序开发,运营维护。创新互联从2013年开始到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联。
今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数
先看一个小例子
[python] view plain copy
from pandas import Series, DataFrame
data = DataFrame({'k': [1, 1, 2, 2]})
print data
IsDuplicated = data.duplicated()
print IsDuplicated
print type(IsDuplicated)
data = data.drop_duplicates()
print data
执行结果是:
[python] view plain copy
k
0 1
1 1
2 2
3 2
[python] view plain copy
0 False
1 True
2 False
3 True
[python] view plain copy
k
0 1
2 2
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。
而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame
这两个方法会判断全部列,你也可以指定部分列进行重复项判段。
例如,希望对名字为k2的列进行去重,
data.drop_duplicates(['k2'])
具体的公式就不贴出来了,外面一大堆,主要记录一下Python的实现方式
每天至少打卡一道python面试题。以尽量多的方式解锁题目,如果有遗漏的方法,欢迎在评论区补充。希望大家一起提高!
每次从列表中取出两个元素,如果第二个元素不在输出列表,就将这两个元素添加到输出列表。
source = ["a","1","b","1","c","2","d","3","e","4","c","3"]
out = []
for e in zip(source[0::2],source[1::2]):
....if e[1] not in out:
........out = out + list(e)
print(out)