读取外部的 excel 文件有三种方法,包括:pandas、xlrd、openpyxl,excel 文件包括后缀为 xls 和 xlsx 的文件,这篇文章分别使用 pandas 和 openpyxl 读取外部的 excel 文件。来自 APP Android 端自动化测试初学者的笔记,写的不对的地方大家多多指教哦。
pandas 读取后缀名为.xls 和.xlsx 的 excel 文件所用的方法是一致的
1.安装:pip3 install pandas
安装成功显示
2.读取 excel 文件的内容
需要用到的 excel 表格及数据
使用 pandas 读取外部表格需要导入 pandas 包
import pandas as pd
def pd_read_excel():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
# 使用pandas.read_excel()方法读取传入的文件,加sheet_name=None,读取出所有的sheet
st_data = pd.read_excel(path, sheet_name=None)
# 1.输出所有子表的名称,list列表形式展现
print(list(st_data))
# 2.控制台直接输出
for i in st_data.keys():
print(i)
输出结果为:
(1)list 列表形式展现
(2)直接输出
import pandas as pd
def pd_read_excel():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
# 1.sheet_name默认显示为0,表示返回第一张子表,读取表的所有数据(包括列名)
st_data = pd.read_excel(path, sheet_name=0)
# 读取第一张表所有数据(list形式)
print(st_data.values)
# 2.sheet_name定义为子表名称,表示返回“test_sheet1”子表,读取表的所有数据
st_data = pd.read_excel(path, sheet_name="test_sheet1")
# 读取test_sheet1表所有数据(list形式)
print(st_data.values)
输出结果为:
import pandas as pd
def pd_read_excel():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
# 1.读取表中固定列的数据(不包括列名)
st_data = pd.read_excel(path, sheet_name="test_sheet1", usecols=[1])
# 读取book表的第一列数据(list形式)
print(st_data.values)
# 2.读取表中1.3列的数据(不包括列名)
st_data = pd.read_excel(path, sheet_name="test_sheet1", usecols=[1, 3])
# 读取book表第一、三列数据(list形式)
print(st_data.values)
import pandas as pd
def pd_read_excel():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
# 读取表中固定行的数据
st_data = pd.read_excel(path, sheet_name="test_sheet1", nrows=1)
# 1.读取book表第一行的数据(data Frame结构)
print(st_data.head())
# 2.读取book表所有数据(list形式)
print(st_data.values)
1.安装:pip install openpyxl
安装成功显示
2.读取 excel 文件的内容
需要用到的 excel 表格及数据
使用 openpyxl 读取外部表格需要导入 openpyxl 包,以下例子中只识别.xlsx 文件
import openpyxl
def opl_read_xlsx():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
st_data = openpyxl.load_workbook(path)
# 1.读取所有子表
print(st_data.worksheets)
# 2.使用索引获取单个子表
sheet = st_data.worksheets[0]
print(sheet)
# 3.active是表示被激活的表单,被选择的sheet,打开文件默认那个表单(默认为第一个表单)
active_sheet = st_data.active
print(active_sheet)
# 4.正规用法,通过名字进行索引
sheet = st_data["test_sheet2"]
print(sheet)
(1)输出结果为:
(2)输出结果为:
(3)输出结果为:
(4)输出结果为:
import openpyxl
def opl_read_xlsx():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
st_data = openpyxl.load_workbook(path)
# 获取某一行
sheet = st_data["test_sheet2"]
columns = sheet[2]
# 获取某一行的值,由于获取到的column相当于单元格对象,所以遍历单元格对象,再使用value来获取单元格内的值
for column in columns:
print(column.value)
输出结果为:
import openpyxl
def opl_read_xlsx():
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
st_data = openpyxl.load_workbook(path)
# 获取某一列
sheet = st_data["test_sheet2"]
rows = sheet["B"]
# 获取某一列的值,由于获取到的rows相当于单元格对象,所以遍历单元格对象,再使用value来获取单元格内的值
for row in rows:
print(row.value)
输出结果为:
1.该类主要实现使用 pandas 获取外部的 excel 表固定列的内容,类名为:get_excel_data.py
# 封装获取外部excel文件内容
import pandas as pd
class GetExcelData:
# 初始化,外部传入一个path参数
def __init__(self, path: ''):
self.path = path
# 使用pandas读取外部excel文件
def pd_read_excel(self, path):
# 读取excel文件中的子表test_sheet1的第二列的内容,列下表从0开始
st_data = pd.read_excel(path, sheet_name="test_sheet1", usecols=[1])
# 读取test_sheet1表的第一列数据(list形式)
data = st_data.values
return data
# 测试函数,执行过程中可以注释
# if __name__ == '__main__':
# path = "E:\\study\\Fork\\other_file\\test.xlsx"
# a = GetExcelData(path)
# a.pd_read_excel(path)
2.该类主要用于调用 get_excel_data 表
# 调用get_excel_data表
from utils.get_excel_data import GetExcelData
class TestOne:
# 需要读取的文件的路径
path = "E:\\study\\Fork\\other_file\\test.xlsx"
driver: webdriver = None
def __init__(self, driver):
super().__init__(driver)
self.excel_data = GetExcelData(self.driver)
def test_01(self):
# 获取excel文件的内容
search_contexts = self.excel_data.pd_read_excel(self.path)