回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
(相关资料图)
鸡
汤
离离原上草,一岁一枯荣。大家好,我是Python进阶者。
一、前言前几天在帮助粉丝解决问题的时候,遇到一个简单的小需求,这里拿出来跟大家一起分享,后面再次遇到的时候,可以从这里得到灵感。
二、需求澄清粉丝的问题来源于实际的需求,她现在想要使用Python批量筛选上千个Excel文件中的某一行数据并另存为新Excel文件,如果是正常操作的话,肯定是挨个点击进去Excel文件,然后CTRL+F找到满足筛选条件的数据,之后复制对应的那一行,然后放到新建的Excel文件中去。
这样做肯定是可以,但是当有上百个文件夹需要复制呢?上千个文件呢?肯定就需要消耗大量的时间和精力了。估计一天都不一定完成的了。
这里使用Python进行批量实现,流程下来,1分钟不到搞定!这里装X了,其实码代码还是需要点时间的,狗头保命!
下面这个代码是初始代码,可以实现的是筛选出来的每一行都另存为新文件,100个文件就存100个文件了。代码如下:
importpandasaspdimportospath=r"./新建文件夹/"#获取文件夹下的所有文件名name_list=os.listdir(path)name_list=(pd.DataFrame(name_list))#for循环遍历读取foriinrange(len(name_list)):df=pd.read_excel(path+name_list[0][i])print("{}读取完成!".format(i))hai=df[df["id"]=="58666"]hai.to_excel("./res/"+name_list[0][i])三、实现过程这里给大家提供两个可行的代码,思路也很简单,直接遍历文件夹,然后加条件筛选,之后符合条件的,直接使用concat进行合并,代码如下:
importpandasaspdimportospath=r"./新建文件夹/"#获取文件夹下的所有文件名name_list=os.listdir(path)name_list=pd.DataFrame(name_list)#计数器res=[]#for循环遍历读取foriinrange(len(name_list)):#len(name_list)等于21df=pd.read_excel(path+name_list[0][i])print("文件{}读取完成!".format(i))target_data=df[df["id"]=="58666"]#print(target_data)res.append(target_data)final_df=pd.concat(res)final_df.to_excel("target.xlsx")代码运行之后,就可以把某一文件夹下的所有Excel满足筛选条件的Excel行,存到一个单独的Excel中去。再也不用挨个去手动复制了,使用Python事半功倍!
后来在【猫药师Kelly】的指导下,还写了一个新的代码,也是可以的,思路和上面的差不多,代码如下所示:
importpandasaspdimportospath=r"./新建文件夹/"#获取文件夹下的所有文件名name_list=os.listdir(path)#print(name_list)#name_list=pd.DataFrame(name_list)#file_path=[xxx,xxx,xxx,......]res=pd.read_excel(path+name_list[0])res=res[res["id"]=="58666"]forfileinname_list[1:]:temp=pd.read_excel(path+file)temp=temp[temp["id"]=="58666"]res=pd.concat([res,temp],ignore_index=True)res.to_excel("res.xlsx")实现的效果如下图所示:
三、总结大家好,我是皮皮。这篇文章主要盘点一个Python自动化办公的实用案例,这个案例可以适用于实际工作中文件处理,大家也可以稍微改进下,用于自己的实际工作中去,举一反三。
大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
-------------------End-------------------
往期精彩文章推荐:
盘点一个JS逆向过程中中文编解码的小案例
盘点一个Python自动化办公实战案例
盘点一个Pandas操作Excel多条件取值的实战案例
盘点一个Python列表转换为字典并排序的问题
欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
想加入Python学习群请在后台回复【入群】
万水千山总是情,点个【在看】行不行
/今日留言主题/
随便说一两句吧~~
最佳答案腐植酸是自然界中广泛存在的大分子有机物,是动植物遗骸,主要是植物的遗骸,经过微生物的分解和转化,以及地球化学的一系列过程造
最佳答案草豆蔻别名草蔻、大草蔻、豆蔻、漏蔻、草蔻仁、飞雷子、草果。草豆蔻来源于姜科山姜属植物,草豆蔻干燥的近成熟种子。草豆蔻味辛,
总台记者从今天(19日)举行的上海市疫情防控新闻发布会上获悉,昨天,上海全市本土确诊病例出院266例,无症状感染者解除集中隔离医学观察270
中新网成都5月19日电 (祝欢)四川省卫健委19日通报,18日0时至24时,四川新增本土确诊病例34例(广安33例),新增本土无症状感染者115例(广安
免费之旅竟是“被骗之路” 山东高青:办理一起以老年人为目标的非法吸收公众存款案 “小王对我那么好,我怎么都没想到都是假的!”日前,山
总台记者从今天(19日)举行的上海市疫情防控新闻发布会上获悉,截至5月18日24时,在定点医疗机构接受治疗的重型患者203例、危重型60例。 5月1
今天(5月19日)上午举行的上海市疫情防控工作新闻发布会上,上海市副市长张为介绍企业复工复产有关情况。 4月中旬以来,从疫情形势最为复杂严
(抗击新冠肺炎)四川广安新增2万个床位隔离点 隔离场所本周内完成交付 中新网成都5月19日电 (王爵)四川邻水县发生新冠疫情以来,牵动各方
中新网沈阳5月19日电 (李晛)据沈阳市官方18日晚发布消息,铁西区海鲜批发市场疫情关联的密接者、次密接者已全部落实分级管控措施 据通报:5
中新网西宁5月19日电(祁增蓓)19日8时07分,记者获悉,5月18日0时至24时,西宁市无新增新冠肺炎确诊病例和无症状感染者,治愈出院确诊病例2