草帽路飞UU 发表于 2022-11-18 16:06:20

浅谈Python数据模拟库

本帖最后由 草帽路飞UU 于 2022-11-18 16:09 编辑

一.背景



  对于大数据相关项目的测试,往往需要大量的测试数据,而场内测试时很难获取那么大批量的真实数据,这个时候需要测试人员能够快速模拟出符合要求的测试数据。这个时候要是有一个自动化工具或测

试脚本简直不要太爽~

  二.问题引入

  对于互联网大数据测试,当需要快速模拟以万为单位的用户数据(包括用户名、ip地址、主机名、访问url等)时,有什么方法可以推荐吗?

  这个时候你一定要试试python的fake库,简单方便,用了的都说好!

  三.功能介绍

  fake库可以模拟哪些信息?模拟信息主要包括:人物、地址、公司信息、文件信息、互联网信息等,官方地址详见:https://faker.readthedocs.io/en/master/#。



四.案例介绍

  1.接口测试——模拟接口传入参数

  接口测试是几乎是每个测试人员测试生涯中的必经之路。对于接口测试,往往我们需要根据定义传入相应的参数值验证接口返回的正确性。例如:某个接口需要传入int型变量,上下限分别是0、100。写

接口自动化测试的时候我们往往是使用等价类和边界值测试法选择几个测试数据,例如:0、100、-1、101、50进行测试,但毕竟测试数据覆盖不够全面。

  对于这类需要丰富测试数据的需求,我们可以使用fake的python数据功能,随机生成int数(fake.pyint())、生成float数(fake.pyfloat(left_digits=None, right_digits=None, positive=False))等。

  2.业务测试——大数据用户信息模拟

  对于某些项目,需要模拟用户信息进行业务测试(例如:核酸监测系统,并发测试大量用户的信息采集)。假如我们需要生成一万个用户,包括:用户名、联系电话、电子邮箱、出生年月日、所在城市、

公司和身份证号码等信息。使用fake库,该如何模拟呢?

  数据简单代码示例如下图所示:



运行结果,模拟用户如下图所示:



3.安全测试——互联网访问信息模拟

  对于某些互联网访问安全类项目,往往需要模拟用户互联网访问信息,从信息中判定用户是否有危险行为。比如:某公司的安全检测系统,需要从员工的互联网访问信息(包括:员工机器host_name,访

问机器的源ip,访问网站url,访问网站ip等)监测员工是否访问危险网站或危险IP。那么,测试该系统,无法获取真实用户访问信息时,如何使用fake库模拟测试数据进行被测系统的业务测试呢?

  数据模拟简单代码示例如下图所示:




运行结果,模拟用户互联网信息如下图所示:



五.Q&A

  为何上述样例中生成的用户名、地址等信息是中文,如何产生英文信息?

  模拟中文信息,在初始化fake库时,使用Faker(locale='zh_CN')即可,默认Faker()初始化时,产生的用户信息时英文。当然,我们还可以使用其他语言(比如日文)产生相应信息,初始化时使用

Faker(local=’ja_JP’);

  如何自定义产生一些自己定制化的信息,比如使用自定义的单词生成文本?

  可以使用ext_word_list参数。例如:











页: [1]
查看完整版本: 浅谈Python数据模拟库