51Testing软件测试论坛

标题: AI可行性实验之辅助测试工作 [打印本页]

作者: lsekfe    时间: 2024-3-7 13:30
标题: AI可行性实验之辅助测试工作
前言
要说这段时间仅在软件测试领域有什么可以总结的内容,我想应该是人工智能了,简称AI(Artificial Intelligence,人工智能)。
在某本书中有位大佬曾经说过,AI是第四次工业革命。这种说法我消化不了,因为没有亲身体会过工业革命,我能理解的是在大量资本涌入的情况下,AI的推广速度会非常的快,即使不在AI领域内的人,看到哪些让人产生焦虑的视频或文章,也能从侧面感受到,说AI可以替代“这个”,也可以替代“那个”,是不是真的比人做的更好,我想还有待观察。
我始终相信AI只是一种工具,与一把斧子、一个扳手在本质上没什么区别,当然我用的AI都是通用AI,没用过专业AI,也就是专注于某一领域的AI,具体专业AI可以智能到什么程度,我想也只有接触过最前沿的人才有发言权。
再多说两句,现在的通用AI最擅长是生成内容,也就是所谓的AIGC(Artificial Intelligence GeneratedContent,人工智能生成内容),像视频、图片、文本等,但是这些东西你不用AI自己也可以做,即使你要让AI做一段视频,你至少也要清楚做视频的基本知识,才能做出符合要求的视频,如果都让AI做,一点要求都没有,门槛如此之低的视频内容,有什么价值。
同理,本篇文章讨论的是用AI工具辅助测试工作,那你就要具备一名测试工程师的基本知识,才能更好的向AI提问,以及“调教”(训练)AI,让它的正确答案更接近你的需求。
想要更好的向AI提问以及“调教”AI,就要写好提示词,这个和搜索引擎用的关键词差不多,目的都是缩小范围,以便得到更精确的输出,只不过这些提示词组合起来更像人话。
接下来,就要进行一个简单的实验,实验用的人工智能是百度的文心一言,非常方便注册和使用。
使用的示例我在51Testing测试圈中的免费讲堂《测试人员必备的测试技术》中也有引用,都是所有测试工程师都耳熟能详的示例。
正文一、 使用AI分析需求提取测试点
程序名称:判断是否为三角形的软件
程序需求:程序接收3个整数,代表三角形的三个边长,判断3个整数是否可以构成一个三角形,并进一步判断是一般三角形、等腰三角形还是等边三角形。
接下来,使用AI分析测试需求,并提取测试点。
向人工智能(百度文心一言)提出的问题,也就是描述需求,如下图所示。
[attach]147198[/attach]
图1-1 向人工智能提问


人工智能(百度文心一言)根据要求输出的回答内容如下图所示,由于太长,所以分成两个部分展示。
[attach]147199[/attach]
图1-2 回答的第一部分


[attach]147200[/attach]


图1-3 回答的第二部分


当然这个需求说明非常简单,但我也不得不说,非常有参考价值,就不说很好了,免得它骄傲。

接下来,我们继续“调教”AI,把软件测试工程师的基本技能都赋予它,如下图所示。

[attach]147201[/attach]


图1-4 “调教”人工智能

人工智能(百度文心一言)这次输出的内容非常多,我们分成两个部分展示。
[attach]147202[/attach]
图1-5 第一部分
[attach]147203[/attach]


图1-6 第二部分


怎么样?还可以吧,比较中规中矩,但是“调教”AI,重要的是“教”,也就是把你,一个资深的软件测试工程师的经验教给它,这一步实际上是最重要的。

[attach]147204[/attach]

图1-7 继续“调教”通过继续“调教”的步骤,也就是赋予经验给它,它的回答就会更加完善,如下图所示。


[attach]147205[/attach]

图1-8
在“调教”的时候,也可以根据AI自动生成的提示词继续完善回答内容,当然也需要我们根据自己的经验进行取舍,如下图所示。


[attach]147206[/attach]
图1-9
二、使用AI根据测试点生成测试用例
通过一个简单的示例,人工智能(百度文心一言)给出的结果确实具有参考价值,接下来,我们继续使用它,让它生成测试用例,问题非常简单就不截图了,就是根据以上总结的测试点用表格的形式生成测试用例,输出的回答如下图所示。



[attach]147207[/attach]
图1-10 第一部分
[attach]147208[/attach]
图1-11 第二部分
[attach]147209[/attach]
图1-12 第三部分
写的很简单,这是因为我们“调教”的不够好,我们可以根据实际情况修改输出的测试用例的格式,比如更加专业的用例编号、测试项目、重要级别等等。



[attach]147210[/attach]


图1-13
通过以上的“调教”提示词,我们得到了进一步完善的测试用例,只是简单的训练,效果还可以,如下所示。



[attach]147211[/attach]


图1-14 第一部分


[attach]147198[/attach]
图1-15 第二部分图1-15 第二部分图1-15 第二部分

图1-15 第二部分


[attach]147213[/attach]
图1-16 第三部分


我们在问几个比较有趣的问题,看看AI怎么回答,如下图所示。

[attach]147214[/attach]


[attach]147215[/attach]


根据上面几个问题的答案,我们可以得出结论,待“调教”的AI还有很大的成长空间。


由于篇幅所限,这里仅仅使用等价类划分方法进行举例,其它的因果、场景、状态图、条件组合等方法,读者可以自行实验。


三、AI可行性实验总结
结论一,AI可以辅助测试工作,而且效率比搜索引擎要高。


结论二,使用AI的人经验越足,能力越高,则“调教”出来的AI能力越高,这个实际上在上述内容的演示中就可以看出来。一个专业的绘画高手,使用AI设计出的作品,与一个业余绘画爱好者使用AI设计的作品,差距会非常明显,很简单的道理,美学素养都不一样,“调教”出的AI肯定不一样,连专业术语都不熟悉的人,怎么设计提示词嘛。


结论三、AI在测试领域不止可以辅助功能测试,也可以辅助性能、自动化和安全测试,而且效率非常高。当然,需要有专业的人士进行“调教”,要承认一个事实,不同的人“调教”出的AI,能力是不同的。


结论四,“调教”AI实际上是把自己的经验赋给AI的一个过程,像老师教学生,但这个学生有一个超能力,就是强大的计算能力和大数据能力,就是没啥想象力,也会出错,所以需要教,教完以后绝不会犯第二次错。


结论五、这是最重要的,AI就是一个工具!用好了,有加成效果,用不好,那还不如用搜索引擎呢。


最后,我想基于一个问题说说自己的想法,那就是AI是不是可以替代人类工作?当然,你也可以直接问AI,但是问这种问题就好像在问一个卖瓜的人他的瓜甜不甜,他会说不甜吗,只能给你一个看似中肯的答案,还是别人喂给它的答案。


完全替代的可能性不大,反正在我可看见的未来应该机会不大,但是在某些领域减少工作,如果AI大力推广的话,应该问题不大,比如说,一间医院原来有10个医生,用了AI以后,也许5个就够了。


那技术领域会怎么样的?我说的技术领域范围只限定在开发和测试。


开发,先不说复杂多变及跨领域的需求或者基于客户意愿定制化的需求,仅仅从编码层面来看,用AI开发代码的程序员要有很强的测试思维,估计会有很多Bug或者安全漏洞,这很容易理解,因为“喂”给它的代码都是人写的,都有Bug,所以它写的代码也不会很完美,毕竟深度学习这个东西,是模拟人脑的神经元链接方式搞出来的,产生结果的原理具有不可解释性,你仔细体会一下不可解释性这个词。


还有就是测试,我觉得替代不了,用AI测试AI,它都不可解释了,能信任它吗,如果AI全领域覆盖,一旦出问题就是大问题,后果绝对不能承受,就算把所有的代码都规范化处理,AI生成代码完全依据规范开发,这个过程也需要有人监督。


我们都知道AI已经应用在安全领域的某些方面了,但是AI自身的安全性谁来保证,AI只是应用层面的技术,支撑它运行的基础设施从冯诺依曼以来就没变过,这是基础设施层面的,实际上AI系统自身也是非常脆弱的。


所以也不需要太神话AI,AI就是一个工具,到底是不是第四次工业革命,我看现在下结论还为时过早,就算是,也只是刚刚开始,都不一定能成功。


最后开一个玩笑,也许哪天基因工程领域实现了突破性的进展,人脑直接开发到百分之百,去看一下超脑那部电影,还用啥AI。


我不是反对AI。我使用后的感受就是,AI是一个非常有效率的工具,国内的AI产品做的也非常好,但是没必要过度神话AI,搞得很多人焦虑。





作者: oliver.tang    时间: 2024-3-7 14:50
学习下
作者: 赵佳乐SMILE    时间: 2024-3-15 13:58





欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) Powered by Discuz! X3.2