数据持久化 - Openpyxl 模块


Microsoft 的 Excel 是最流行的电子表格应用程序。它已使用了 25 年多。更高版本的 Excel 使用Office Open XML (OOXML) 文件格式。因此,可以通过其他编程环境访问电子表格文件。

OOXML是 ECMA 标准文件格式。Python 的openpyxl包提供了读取/写入扩展名为 .xlsx 的 Excel 文件的功能。

openpyxl 包使用类似于 Microsoft Excel 术语的类命名法。Excel 文档称为工作簿,并以 .xlsx 扩展名保存在文件系统中。一个工作簿可以有多个工作表。工作表呈现一个大的单元格网格,每个单元格都可以存储值或公式。形成网格的行和列已编号。列由字母、A、B、C、…、Z、AA、AB 等标识。行从 1 开始编号。

典型的 Excel 工作表如下所示 -

Excel 工作表

pip 实用程序足以安装 openpyxl 软件包。

pip install openpyxl

Workbook 类代表一个带有一个空白工作表的空工作簿。我们需要激活它,以便将一些数据添加到工作表中。

from openpyxl import Workbook
wb=Workbook()
sheet1=wb.active
sheet1.title='StudentList'

我们知道,工作表中的单元格以“ColumnNameRownumber”格式命名。因此,左上角的单元格是A1。我们将一个字符串分配给该单元格:

sheet1['A1']= 'Student List'

或者,使用工作表的cell()方法,该方法使用行号和列号来标识单元格。调用单元格对象的 value 属性来赋值。

cell1=sheet1.cell(row=1, column=1)
cell1.value='Student List'

用数据填充工作表后,通过调用工作簿对象的 save() 方法保存工作簿。

wb.save('Student.xlsx')

该工作簿文件是在当前工作目录中创建的。

以下 Python 脚本将元组列表写入工作簿文档中。每个元组存储学生的学号、年龄和分数。

from openpyxl import Workbook
wb = Workbook()
sheet1 = wb.active
sheet1.title='Student List'
sheet1.cell(column=1, row=1).value='Student List'
studentlist=[('RollNo','Name', 'age', 'marks'),(1,'Juhi',20,100), 
   (2,'dilip',20, 110) , (3,'jeevan',24,145)]
for col in range(1,5):
   for row in range(1,5):
      sheet1.cell(column=col, row=1+row).value=studentlist[row-1][col-1]
wb.save('students.xlsx')

工作簿 Students.xlsx 保存在当前工作目录中。如果使用 Excel 应用程序打开,则显示如下 -

Excel应用程序

openpyxl 模块提供load_workbook()函数,有助于读回工作簿文档中的数据。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')

您现在可以访问由行号和列号指定的任何单元格的值。

cell1=sheet1.cell(row=1, column=1)
print (cell1.value)
Student List

例子

以下代码使用工作表数据填充列表。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')
sheet1 = wb['Student List']
studentlist=[]
for row in range(1,5):
   stud=[]
for col in range(1,5):
   val=sheet1.cell(column=col, row=1+row).value
stud.append(val)
studentlist.append(tuple(stud))
print (studentlist)

输出

[('RollNo', 'Name', 'age', 'marks'), (1, 'Juhi', 20, 100), (2, 'dilip', 20, 110), (3, 'jeevan', 24, 145)]

Excel 应用程序的一项非常重要的功能是公式。要将公式分配给单元格,请将其分配给包含 Excel 公式语法的字符串。将 AVERAGE 函数分配给有年龄的 c6 细胞。

sheet1['C6']= 'AVERAGE(C3:C5)'

Openpyxl 模块具有Translate_formula()函数来跨范围复制公式。以下程序在 C6 中定义 AVERAGE 函数并将其复制到 C7 中计算分数的平均值。

from openpyxl import load_workbook
wb=load_workbook('students.xlsx')

sheet1 = wb['Student List']
from openpyxl.formula.translate import Translator#copy formula
sheet1['B6']='Average'
sheet1['C6']='=AVERAGE(C3:C5)'
sheet1['D6'] = Translator('=AVERAGE(C3:C5)', origin="C6").translate_formula("D6")
wb.save('students.xlsx')

更改后的工作表现在如下所示 -

更改的工作表