51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 830|回复: 0
打印 上一主题 下一主题

[原创] 如何使用Python处理excel全自动填写?

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2022-11-3 16:19:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
这篇文章主要为大家详细介绍了Python处理excel根据全称自动填写简称,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

在工作中处理excel遇到需要根据器件生产供应商全称填写简称的一列,由于数据表格中器件数多达几万条,单纯靠excel筛选功能手动处理需要耗费大量时间,这里使用Python中的pandas模块,读取excel进行


处理。


1、需求


根据存储有供应商全称简称对应的表格对应关系.xlsx,自动填写带有供应商全称的表格待处理文件.xlsx中简称的一列。



2.脚本思路


首先使用pandas读取第一个表格对应关系.xlsx,然后将其储存在一个字典中,字典的键为供应商的全称,字典的值为供应商的简称。


然后读取第二个表格待处理文件.xlsx,根据列的标题头,找到供应商全称所处在的列,根据这一列每一个供应商的全称查询字典中对应键的值,将其写入表格中对应行的简称处。(这里暂时假设对应关系和待处


理文件中供应商的全称如果是同一家公司则公司全称是一模一样的,存在些许差别的处理的方法在下一篇文章中在记录)。


3.代码


# -*- coding: utf-8 -*-"""
Created on Thu Mar 4 21:25:05 2021@author: ruofei
"""

  import pandas as pd


    #填写待处理文件和对应关系的excel文件路径
#注意:脚本运行时需保证被使用excel文件处于关闭状态
file1 = r'待处理文件.xlsx'
file2 = r'对应关系.xlsx'   


#填写待处理文件中 全称所在的列名和简称要放置的列名
qc1="供应商"
jc1="简称"  


#填写对应关系中  全称所在的列数和简称所在的列数
qc2="全称"
jc2="简称"   


#填写读取excel文件的sheet表名
sheet1="Sheet1"s
heet2="Sheet1"  


#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)  


#print("输出表格所有")
#print(data1)  


row1 = data1.shape[0]#行数
col1=data1.shape[1]#列数  


row2 = data2.shape[0]#行数
col2=data2.shape[1]#  


#print("表格文件有"+str(row1)+"行,"+str(col1)+"列")  

duiying=dict()  

#生成对应关系的字典
for i in range(row2):

    quancheng=data2.loc[i,qc2]  
jiancheng=data2.loc[i,jc2]     

duiying[quancheng]=jiancheng        


#print(quancheng)  

#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一为"+str(company1)+"\n"+"公司二为"+str(company2))  


for i in range(row1):   

a=data1.loc[i,qc1]  
#[qc1-1]  
#print(str(a))     

jiancheng=duiying.get(a)  
if a in duiying.keys():      

#print(jiancheng)   
data1.loc[i,jc1]=jiancheng   
else:         


#此处修改没有简称赋予值,若赋予全称值则=a,若为空则="  "   
data1.loc[i,jc1]=a  

data1.to_excel('处理好的文件.xlsx',sheet_name='Sheet1')


4.实现功能

根据预先整理好的对应关系表格自动填写了表格中简称空白的一列,如果表格中存在对应关系中不存在的公司,则在相应的简称位置填写其全称本身。如下图中,由于表中的小米华为没有给出其简称,因此原


样照填。



5.存在问题


在实际应用中处理几万条数据时,绝大部分正常,存在问题是,比如对应关系中全称为(中国)茅台公司,而在要处理的文件中不存在括号,或者括号中英文不同,或者括号中空格数不同,都会在后面读取为


不同的字符串,在查询字典中显示不存在。处理方式在下篇中解决。








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /1 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2024-11-15 17:07 , Processed in 0.067778 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2024 Comsenz Inc.

快速回复 返回顶部 返回列表