灵魂拷问:读取 excel 测试数据真的慢吗?

  • 📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
  • 📢交流讨论:欢迎加入我们一起学习!
  • 📢资源分享:耗时200+小时精选的「软件测试」资料包
  • 📢 最困难的时候,也就是我们离成功不远的时候!

前言

在实现自动化测试的时候,我们经常会使用数据驱动。所以我们经常会把测试数据单独保存在一个特定格式的文件当中,然后通过读取文件去驱动自动化测试代码。

这篇文章会对比 Excel、CSV 和 YAML 三种主流的文件格式,看看它们哪个更好。

先来看用的最多的 Excel

Excel 是世界上使用最广泛的数据文件格式。使用 python 做自动化测试,可以用 openpyxl 这个第三方库操作 Excel。

经常有人说 Excel 的操作限制很多,写入和读取的速度很慢。真的是这样吗?

我们做个实验。创建一个空的 Excel 文件,然后插入 1000 条数据,看插入数据和读取这些数据会耗费多久的时间。


import openpyxldef test_insert_1000_lines_data():lines = 1000workbook = openpyxl.Workbook()worksheet = workbook.create_sheet('demo')for i in range(lines):data = (i, f'name{i}', f'http://www.example.com/{i}')worksheet.append(data)workbook.save('1000lines.xlsx')def test_read_1000_lines_data():workbook = openpyxl.load_workbook('1000lines.xlsx')worksheet = workbook['demo']for row in worksheet.values:pass

插入 1000 条数据会消耗多少时间呢?答案是 0.09 秒,速度并不慢。而读取这 1000 条测试数据消耗的时间,只需要 0.06 秒。

在这里插入图片描述
在一个项目当中,1000 个测试用例应该是比较合理的,所以在正常的测试场景下,使用 Excel 管理用例数据在读取效率上是合适的。

但是当数据变得越来越大的时候,Excel 的处理速度会越来越慢,读取数据消耗了 7 秒。这就意味着如果你有多个项目需要同时测试,Excel 的解析可能会对测试效率造成一定的影响。

再看 CSV 格式

不论是进行自动化测试还是进行数据分析,CSV 格式都更加合适。这种格式不像 Excel,要去处理表格的样式,它更专注于数据。

而且在 Python 语言当中,内置了 CSV 格式的处理模块,用法非常简单,没有太多额外的学习成本。


import csvdef test_insert_1000_lines_data():lines = 1000with open('1000lines.csv', 'w', newline='') as f:csv_writer = csv.writer(f)for i in range(lines):data = (i, f'name{i}', f'http://www.example.com/{i}')csv_writer.writerow(data)def test_read_1000_lines_data():with open('1000lines.csv', newline='') as f:csv_reader = csv.reader(f)for row in csv_reader:print(row)

分别对 1000 行、5 万行和 10 万行数据进行插入和读取操作,CSV 的速度都比 Excel 要快一个量级。


对于海量数据处理,CSV 比 Excel 要快很多,代码编写也更简单。

但是,使用 CSV 格式一定要注意对逗号的处理。

在 CSV 当中,每一行的数据默认是用逗号分割的,如果你有一个数据当中本身就包含了逗号,一定要记得把这个数据用双引号包裹。

而且,CSV 支持的数据格式非常有限,数据被读取出来后都被当成字符串,需要自己添加额外的解析操作。

id,17,18,“{‘name’: ‘yuz’, ‘age’: 11}”

最后,看看 YAML 表现怎么样?

YAML 的优点在于丰富的数据类型支持。无论是元组、字典、数字、布尔类型都能支持,并且被 python 语言轻松解析成对应的 python 数据类型。


import yamldef test_insert_1000_lines_data():lines = 1000with open('1000lines.yaml', 'w') as f:all_data = [{"id": i,"name": f"name{i}","data": {"username": "yuz", "passoword": 123456}}for i in range(lines)]yaml.safe_dump(all_data, f)def test_read_1000_lines_data():with open('1000lines.yaml',encoding='utf-8') as f:data = yaml.load(f, Loader=yaml.SafeLoader

在少量数据的解析上,YAML 会非常的方便。但是一旦数据增加到上万组,YAML 的解析速度会非常非常慢。当数据达到 10 万行的时候,读取速度竟然接近 1 分钟。


最近有越来越多的自动化测试人员使用 YAML 存储用例,一方面是看重了它支持的丰富的数据格式,另一方面可能是受了一些框架的影响。

httprunner 这个接口自动化测试框架就采用了 YAML 存储用例数据。其实当存在海量数据需要读取的时候,YAML 的处理速度比 Excel 慢一个量级。

所以 httprunner 这样的框架,从测试效率这个维度来讲,更适合做单用例或者少量用例的测试。如果想针对整个项目甚至是多个项目一次性测试的话,httprunner 的执行速度会比较慢。

结 论

通过对 Excel、CSV 和 YAML 三种格式的操作效率对比可以得出以下结论。

一、如果你只想对少量的用例进行测试,或者对测试数据的格式要较高的要求,用 YAML 存储用例数据会更利于解析,但是这种场景下一般可以直接使用 postman 这些成熟的工具,没有必要自己实现。

二、如果你已经习惯了 Excel 的操作。直接使用这种方式就可以了,1 万行以下的数据, Excel 还是非常快的。

三、不管怎么样,我还是更推荐大家去尝试一下 CSV 这种格式。首先、就算是到了 10 万行数据的情况下,它的处理速度也是非常快的。其次,Python 语言当中直接内置了 CSV 的模块,它的使用方式和 open.函数非常的相似,几乎没有额外的学习成本。


最后

如果你想学习自动化测试,那么下面这套视频应该会帮到你很多

如何逼自己1个月学完自动化测试,学完即就业,小白也能信手拈来,拿走不谢,允许白嫖....

最后我这里给你们分享一下我所积累和整理的一些文档和学习资料,有需要直接领取就可以了!


以上内容,对于软件测试的朋友来说应该是最全面最完整的备战仓库了,为了更好地整理每个模块,我也参考了很多网上的优质博文和项目,力求不漏掉每一个知识点,很多朋友靠着这些内容进行复习,拿到了BATJ等大厂的offer,这个仓库也已经帮助了很多的软件测试的学习者,希望也能帮助到你。

​​

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/182654.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

非农数据不及预期,美元回落金价触及2000关口

上周五美国非农数据公布,现货黄金短线拉升近16美元,金价突破2000关口最高至2003.55美元/盎司,但随后金价转头回落,最终报收1992.19美元/盎司,涨幅收窄至0.34%。周线级别金价下跌0.61%,金价终止之前连续三周…

基于ssm+jsp背单词系统的设计与实现

ssm背单词系统,java记单词系统,背单词系统 运行环境: JAVA版本:JDK1.8 IDE类型:IDEA、Eclipse都可运行 数据库类型:MySql(8.x版本都可) 硬件环境:Windows 角色&#xff…

[BUUCTF NewStar 2023] week5 Crypto/pwn

最后一周几个有难度的题 Crypto last_signin 也是个板子题,不过有些人存的板子没到,所以感觉有难度,毕竟这板子也不是咱自己能写出来的。 给了部分p, p是1024位给了922-101位差两头。 from Crypto.Util.number import * flag b?e 655…

Java快速排序算法、三路快排(Java算法和数据结构总结笔记)[7/20]

一、什么是快速排序算法 快速排序的基本思想是选择一个基准元素(通常选择最后一个元素)将数组分割为两部分,一部分小于基准元素,一部分大于基准元素。 然后递归地对两部分进行排序,直到整个数组有序。这个过程通过 par…

私域流量搭建与运营,技巧全攻略!

2023年是比拼运营深度和服务效率的一年,用户对于体验的期望值将持续增长,企业需提供无缝的客户体验,以推动增长、保障收入、确保客户忠诚度。在疫情新常态下,企业已构建起APP、小程序等一系列线上触点矩阵,而各个触点之…

浅谈开口互感器在越南美的工业云系统中的应用

摘 要:分析低压开口式电流互感器的原理,结合工程实例分析开口电流互感器在低压配电系统中,主要是改造项目中的应用及施工细节,为用户快速实现智能配电提供解决方案,该方案具有成本低、投资少、安装接线简便等优点&…

Docker Stack部署应用详解+Tomcat项目部署详细实战

Docker Stack 部署应用 概述 单机模式下,可以使用 Docker Compose 来编排多个服务。Docker Swarm 只能实现对单个服务的简单部署。而Docker Stack 只需对已有的 docker-compose.yml 配置文件稍加改造就可以完成 Docker 集群环境下的多服务编排。 stack是一组共享…

MySQL -- 索引

MySQL – 索引 文章目录 MySQL -- 索引一、索引简介1.简介2.索引效率的案例 二、认识磁盘1.磁盘2.结论3.磁盘随机访问(Random Access)与连续访问(Sequential Access) 三、MySQL 与磁盘交互基本单位1.基本单位2.MySQL中的数据管理 五、索引的理解1.索引案例2.单页mysql page3.管…

库房管理软件采购申请流程代码实现解析

300rmb掏了个javavue2的小系统,学习代码,调整下申请流程。 原有的入库流程是,库管(admin)提出采购申请给采购员(caigou),采购员采购入库时点击入库完成采购入库流程。 想弄清后端代…

figma-如何批量修改字体

一.选择字体 二.批量替换 编辑—>替换相同字体

微信小程序之自定义组件开发

1、前言 从小程序基础库版本 1.6.3 开始,小程序支持简洁的组件化编程。所有自定义组件相关特性都需要基础库版本 1.6.3 或更高。开发者可以将页面内的功能模块抽象成自定义组件,以便在不同的页面中重复使用;也可以将复杂的页面拆分成多个低耦…

HackTheBox-Starting Point--Tier 1---Funnel

文章目录 一 题目二 实验过程三 利用SSH隧道3.1 本地端口转发 一 题目 Tags FTP、PostgreSQL、Reconnaissance、Tunneling、Password Spraying、Port Forwarding、Anonymous/Guest Access、Clear Text Credentials译文:FTP、PostgreSQL、侦察、隧道技术、密码喷洒…

linux内的循环

格式 while 【 条件判断 】 do 语句体 done 上图 第一次代码,输入语句在外面,结果输入完(非hello)程序不断循环,没办法,ctrlc给程序终止了,然后把用户输入的语句放到了循环体里面…

NOIP2023模拟12联测33 A. 构造

NOIP2023模拟12联测33 A. 构造 文章目录 NOIP2023模拟12联测33 A. 构造题目大意思路code 题目大意 构造题 思路 想一种构造方法,使得 y y y 能够凑成尽可能多的答案 第一行 x y r y ⋯ r xyry \cdots r xyry⋯r 第二行 r y x y ⋯ x ryxy \cdots x ryxy⋯x …

C语言100~200中不能整除3的数

#define _CRT_SECURE_NO_WARNINGS 1#include <stdio.h> int main() {int n;for (n 100; n < 200; n){if (n%3 0){continue;}printf("%d\n",n);}}

【亚马逊云科技产品测评】活动征文|亚马逊云科技AWS之EC2详细测评

引言 &#xff08;授权声明&#xff1a;本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 Developer Centre, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道&#xff09; 在当前的数字化时代&#xff0c;云服务已…

RISC-V处理器设计(四)—— Verilog 代码设计

一、前言 从6月底刚开始接触 risc-v 架构&#xff0c;到现在完成了一个 risc-v cpu 的设计&#xff0c;并且成功移植了 rt-thread nano 到本 cpu 上运行&#xff0c;中间经过了 4个多月的时间&#xff0c;遇到了数不清的问题&#xff0c;也想过放弃&#xff0c;但好在最后还是…

Node.js |(五)包管理工具 | 尚硅谷2023版Node.js零基础视频教程

学习视频&#xff1a;尚硅谷2023版Node.js零基础视频教程&#xff0c;nodejs新手到高手 文章目录 &#x1f4da;概念介绍&#x1f4da;npm&#x1f407;安装npm&#x1f407;基本使用&#x1f407;生产依赖与开发依赖&#x1f407;npm全局安装&#x1f407;npm安装指定包和删除…

比SAM小60倍的分割一切模型:MobileSAM

1 MobileSAM SAM就是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同&#xff0c;SAM可以处理所有类型的图像。 在SAM出现前&#xff0c;基本上所有的图像分割模型都是专有模型。比如&#xff0c;在医学领域&#xff0c;有专门分割核磁图…