51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 529|回复: 0
打印 上一主题 下一主题

[python] 掌握多表 Excel 操作之 Python

[复制链接]
  • TA的每日心情
    无聊
    3 天前
  • 签到天数: 1050 天

    连续签到: 1 天

    [LV.10]测试总司令

    跳转到指定楼层
    1#
    发表于 2023-4-13 13:16:50 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
    使用 Excel 文件是数据分析师和程序员的常见任务。有时,这些文件包含多个工作表,每个工作表都有自己的数据集。在这种情况下,能够同时读取和操作多张工作表中的数据变得至关重要。在本文中,我们将探索如何使用 Python 和两个流行的库 Pandas 和 openpyxl 来实现这一点。
      先决条件
      在开始之前,请确保您安装了以下 Python 库:
      1. Pandas:一个强大的数据处理和分析库。
      2. openpyxl:一个用于读取/写入 Excel 文件的库。
      您可以使用 pip 安装它们:
      pip install pandas openpyxl

      从多个工作表中读取数据
      假设我们有一个名为“sales_data.xlsx”的 Excel 文件,其中包含三个工作表:“一月”、“二月”和“三月”。我们将从所有三张表中读取数据并执行一些基本分析。
      第一步:导入必要的库
      import pandas as pd

      第 2 步:读取 Excel 文件
      excel_file = pd.ExcelFile('sales_data.xlsx')

      第 3 步:提取工作表名称
      sheet_names = excel_file.sheet_names
      print(sheet_names)


      第 4 步:从每个工作表中读取数据并将其存储在字典中
      data_frames = {}
      for sheet_name in sheet_names:
          data_frames[sheet_name] = excel_file.parse(sheet_name)


      此时,“data_frames”字典将包含来自每个工作表的数据作为 Pandas DataFrame,工作表名称作为键。
      分析来自多个工作表的数据
      现在我们有了字典中所有工作表的数据,我们可以进行各种分析。例如,让我们计算每个月的总销售额。
      total_sales = {}
      for sheet_name, df in data_frames.items():
          total_sales[sheet_name] = df['Sales'].sum()


      要查找销售额最高的月份,我们可以使用以下代码:
      highest_sales_month = max(total_sales, key=total_sales.get)
      print ( f"销售额最高的月份是 {highest_sales_month}。" )


      结论
      在本文中,我们探讨了如何使用 Python、Pandas 和 openpyxl 从 Excel 文件中的多个工作表读取数据。我们还演示了如何对提取的数据进行基本分析。有了这些知识,您现在可以高效地处理多表 Excel 文件并执行更高级的数据分析任务。

    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-24 20:56 , Processed in 0.065785 second(s), 24 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表