ziyou111829 2008-1-24 17:22
谁知道搜索引型的测试方案怎么写
谁知道搜索引型的测试方案怎么写?
yours-123 2008-1-25 17:48
是不是搜索引擎?:lol
archonwang 2008-1-30 12:00
关注下。这部分的测试没有做过。
billrub 2008-1-30 15:36
曾经有相关的企业搜索类产品项目经历,但并没有摸索出系统的测试方案来,测试也并不系统;但在摸索过程中还是积累了一定的该类技术测试常识,并有零星的运用,抛一砖以引玉:
搜索测试常识:
1、搜索特性:
1)网页位置精确性
2)业务语义精确性(搜索条件)
3)全面性(索引量,抓取量)
4)智能性(中文分割)
5)搜索时效性(性能)
2、搜索关键:
1)关键词提取
2)相似度处理:镜象网页;转载网页(“近似镜象网页”)
3)链接分析
4)网页重要程度的计算:被引用的多便是重要的(GOOGLE)
5)查询索引表和倒排表驻留内存
切词 + 回溯
倒排序:网页——>特征
特征——>网页
6)性能:搜索服务器的余留资源必须在 cpu<50%,磁盘<80% 之上
3、搜索测试:
1)链接死循环的爬行器陷死
2)网页重要程度的判断:引用次数;主页
3)Spider爬行器对一个网站访问的频率和集中度:导致网站将对spider作一定处罚
4)是否有搜索pdf、doc、txt之类的文件需求
5)是否有DNS解析缓存(拒绝服务攻击的副作用)
6)是否支持持续连接(不主动关闭socket通道)
7)地址不同,网页内容一样是否重复搜索
8)可扩展搜索:是否能跟上网页更新的速度
当然企业搜索和互联网搜索还是有较大差异的,另对这一块并不深、技术掌握也非常有限,就只谈认识和积累不妄加评论了。
非常欢迎该领域行家多多教诲
[[i] 本帖最后由 billrub 于 2008-1-30 15:43 编辑 [/i]]
wangpl4092 2008-9-3 21:41
学习ing