51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 2253|回复: 0
打印 上一主题 下一主题

[原创] 大数据背景下的小数据统计分析

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2014-11-28 17:17:47 | 只看该作者 回帖奖励 |正序浏览 |阅读模式

统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。举个例子:你喜欢上一个姑娘,你会搜集她的兴趣、爱好、星座、闺密、乃至三围等等各种信息吧,然后想自己怎么能搭讪上、约出来,碰壁了会继续找原因、想办法,这就是数据分析。不过落实到工作上,这事儿就没那么有趣了。

在实际工作当中,月度、季度、年度,都需要拿出这段时间的数据来做工作汇报,在数据收集、数据整理和数据分析的过程当中,难度很大。特别对于基层团队管理人员,数据收集统计还可能多次反复,感觉耗时耗力。数据统计上交截止日,赶上新业务上线要交程序,那就是让人崩溃的节奏,我想这目前应该是一个普遍现象。

现在流行一句话就是对数据的理解,说的是对数据挖掘的深度。理解有多深就能挖多深。但是我觉得这建立在数据收集相对比较完善的时候,才能说这句话。公司现在的情况远远没有达到想挖就挖的程度。

现实的困境

    1.基础数据可比性差

如果说BAT公司所掌握的数据是一座金矿的话,我们公司内部流程的数据最多能算一个铁矿,还是贫铁矿。

按统计分析的三个步骤来看,第一个步骤(收集数据)就出现了问题。不算妄自菲薄,而是我们对自己内部流程数据的重视程度决定了这样的事实。拿测试中心来说,我们提供加权的缺陷个数或者是加权缺陷值,因为各部门对缺陷的严重程度把握是不一致,导致横向比较价值打折扣;我们也提供开发个人平均缺陷修复周期,但是因为填写的不规范使数据缺少了客观性;我们也能出缺陷修复成功率或者说是缺陷重开率,但是一方面是流程工具上可能以前没有定义相关字段,另一方面即使定义了相关字段,但是各自有各自的标准。所以能拿出来做整体横向评测度量的数据真的不多。

2.流程工具偏多

接收测试任务和记录缺陷,是测试人员每天工作都要接触的,现在测试中心还是沿用各部以前的做法,比如有用TS+QC的,也有用小球+JIRA的,还有一部分用TS+JIRA

流程工具多,可能可以说有一部分历史原因。但是随着部门的整合,流程工具没有合并调整,给后面的数据收集、分析、统计带来了很多困难。

3.流程差异

如何让得到的数据反映真实的情况,是每个管理者思考的问题。对于测试管理来说也是一样的。流程差异也是造成横向比较的困难的主要原因。流程的差异在加上工具的不一致,更加放大了数据收集、汇总、分析的困难。

除了上述的几个问题,统计过程的每个环节,数据收集、整理、分析或多或少都有问题。特别是统计分析时数据理解这个概念,假如我们数据收集已经能够做到很完备了,我们是不是能真正理解自己掌握的数据呢?

大数据的启示

说到对数据的理解,对数据的挖掘,大家都能想到几位互联网巨头。它们在这个领域无疑领导着时代潮流。我记得有句广告词是这么写的“只要你的电脑连接着网络,你每敲击一下键盘都会成为互联网数据的一部分。”,这词写的很传神,互联网的海量数据就是这么来的。拥有海量数据的几位巨头给我们展示统计、挖掘、技术分析和解释数据的科学与艺术!


分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

本版积分规则

关闭

站长推荐上一条 /1 下一条

小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

GMT+8, 2024-11-9 00:45 , Processed in 0.074954 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2024 Comsenz Inc.

快速回复 返回顶部 返回列表