密斯特厚朴 发表于 2014-11-28 17:17:47

大数据背景下的小数据统计分析


统计,顾名思义即将信息统括起来进行计算的意思,它是对数据进行定量处理的理论与技术。统计分析,常指对收集到的有关数据资料进行整理归类并进行解释的过程。举个例子:你喜欢上一个姑娘,你会搜集她的兴趣、爱好、星座、闺密、乃至三围等等各种信息吧,然后想自己怎么能搭讪上、约出来,碰壁了会继续找原因、想办法,这就是数据分析。不过落实到工作上,这事儿就没那么有趣了。
在实际工作当中,月度、季度、年度,都需要拿出这段时间的数据来做工作汇报,在数据收集、数据整理和数据分析的过程当中,难度很大。特别对于基层团队管理人员,数据收集统计还可能多次反复,感觉耗时耗力。数据统计上交截止日,赶上新业务上线要交程序,那就是让人崩溃的节奏,我想这目前应该是一个普遍现象。
现在流行一句话就是对数据的理解,说的是对数据挖掘的深度。理解有多深就能挖多深。但是我觉得这建立在数据收集相对比较完善的时候,才能说这句话。公司现在的情况远远没有达到想挖就挖的程度。
现实的困境
    1.基础数据可比性差
如果说BAT公司所掌握的数据是一座金矿的话,我们公司内部流程的数据最多能算一个铁矿,还是贫铁矿。
按统计分析的三个步骤来看,第一个步骤(收集数据)就出现了问题。不算妄自菲薄,而是我们对自己内部流程数据的重视程度决定了这样的事实。拿测试中心来说,我们提供加权的缺陷个数或者是加权缺陷值,因为各部门对缺陷的严重程度把握是不一致,导致横向比较价值打折扣;我们也提供开发个人平均缺陷修复周期,但是因为填写的不规范使数据缺少了客观性;我们也能出缺陷修复成功率或者说是缺陷重开率,但是一方面是流程工具上可能以前没有定义相关字段,另一方面即使定义了相关字段,但是各自有各自的标准。所以能拿出来做整体横向评测度量的数据真的不多。
2.流程工具偏多
接收测试任务和记录缺陷,是测试人员每天工作都要接触的,现在测试中心还是沿用各部以前的做法,比如有用TS+QC的,也有用小球+JIRA的,还有一部分用TS+JIRA。
流程工具多,可能可以说有一部分历史原因。但是随着部门的整合,流程工具没有合并调整,给后面的数据收集、分析、统计带来了很多困难。
3.流程差异
如何让得到的数据反映真实的情况,是每个管理者思考的问题。对于测试管理来说也是一样的。流程差异也是造成横向比较的困难的主要原因。流程的差异在加上工具的不一致,更加放大了数据收集、汇总、分析的困难。
除了上述的几个问题,统计过程的每个环节,数据收集、整理、分析或多或少都有问题。特别是统计分析时数据理解这个概念,假如我们数据收集已经能够做到很完备了,我们是不是能真正理解自己掌握的数据呢?
大数据的启示
说到对数据的理解,对数据的挖掘,大家都能想到几位互联网巨头。它们在这个领域无疑领导着时代潮流。我记得有句广告词是这么写的“只要你的电脑连接着网络,你每敲击一下键盘都会成为互联网数据的一部分。”,这词写的很传神,互联网的海量数据就是这么来的。拥有海量数据的几位巨头给我们展示统计、挖掘、技术分析和解释数据的科学与艺术!
详情请移步:http://www.51testing.com/index.php?uid-15056896-action-viewspace-itemid-881185
页: [1]
查看完整版本: 大数据背景下的小数据统计分析