【文星索引】搜索引擎项目测试报告

目录

    • 一、项目背景
    • 二、 项目功能
        • 2.1 数据收集与索引
        • 2.2 API搜索功能
        • 2.3 用户体验与界面设计
        • 2.4 性能优化与维护
    • 三、测试报告
        • 3.1 功能测试
        • 3.2 界面测试
        • 3.3 性能测试
        • 3.4 兼容性测试
        • 3.5 自动化测试
    • 四、测试总结
        • 4.1 功能测试方面
        • 4.2 性能测试方面
        • 4.3 用户界面测试方面

在这里插入图片描述

一、项目背景

搜索引擎的项目背景有以下几个方面:

  1. 随着互联网的发展,网页、文档等各种信息呈指数级增长。在海量的信息中,用户难以快速准确地找到自己需要的相关代码函数内容。例如,每天有大量的技术文章等发布到网上,人们如果没有有效的搜索工具,就会在信息海洋中迷失。

  2. 无论是个人用户查找Java中的信息资讯,还是用户寻找代码信息,都迫切需要一种能够高效筛选和定位信息的工具。

  3. 对于互联网公司来说,搜索引擎是一个重要的流量入口。通过提供高质量的搜索服务,吸引大量用户访问,例如,百度的搜索页面上会展示各种与用户搜索关键词相关的技术文章,根据点击量或展示量呈现给搜索引擎公司。

二、 项目功能

搜索引擎的项目功能可以从多个方面进行分析,以下是一些常见的功能:

2.1 数据收集与索引

数据收集:搜索引擎需要从各种数据源收集数据,如网页、文档、图片、视频等。这些数据可以通过爬虫程序自动抓取,也可以通过手动提交或其他方式获取。

  • 数据清洗与预处理:在索引之前,需要对收集到的数据进行清洗和预处理,如去除噪声、标签、格式化等,以便提高搜索的准确性和效率。
  • 索引构建:搜索引擎使用索引技术将数据进行结构化处理,以便快速检索。常见的索引结构包括倒排索引、正排索引等。
2.2 API搜索功能

关键词搜索:用户输入关键词后,搜索引擎能够快速返回与关键词相关的搜索结果。搜索结果通常包括网页标题、摘要、链接等信息。

  • 模糊搜索与纠错:搜索引擎能够处理用户输入的模糊关键词,并提供纠错建议,以提高搜索的准确性和用户体验。
2.3 用户体验与界面设计

简洁的搜索界面:搜索界面设计简洁明了,方便用户输入关键词和查看搜索结果。搜索框通常放置在页面的显眼位置,并提供输入提示和自动补全功能。

  • 搜索结果展示:搜索结果以清晰、易读的方式展示给用户,通常包括标题、摘要、链接等信息。搜索结果可以按照相关性、时间、热度等进行排序。
2.4 性能优化与维护

性能优化:搜索引擎需要不断优化其性能,以提高搜索速度和响应时间。这可以通过优化索引结构、查询算法等方式实现。

三、测试报告

3.1 功能测试

在这里插入图片描述

输入测试
因为该项目不支持模糊匹配,查找结果是根据查询词是否包含在文档内容中来筛选的,因此等价类的划分如下:

有效等价类无效等价类
英文字符中文字符
数字字符停用词字符
英文和数字混杂字符其他特殊字符

测试输入数据:

测试用例期望结果
String(有效)能被查找到并正确显示
ArrayList(有效)能被查找到并正确显示
12(有效)能被查找到并正确显示
a123b(有效)能被查找到并正确显示
数组(无效)查找不到结果
,X,S,z(无效)查找不到结果
1=1,&&&%$23(无效)查找不到结果
空格(无效)查找不到结果

附上部分测试截图:

有效等价类:

  • 输入字母
    在这里插入图片描述

预期结果:搜索成功,显示与字母相关的结果.

实际结果:搜索成功,显示带有字母的结果.

  • 输入数字

在这里插入图片描述

预期结果:搜索成功,显示与数字相关的结果.

实际结果:搜索成功,显示带有数字的结果.

无效等价类:

  • 输入汉字
    在这里插入图片描述

预期结果:搜索失败,查找不到结果

实际结果:搜索失败,查找不到结果

  • 输入空格
    在这里插入图片描述

预期结果:搜索失败,查找不到结果

实际结果:搜索失败,查找不到结果

3.2 界面测试

在这里插入图片描述

显示搜索结果总数是否和实际展示保持一致

这里搜索一个条目比较少的方便展示:如图可以看到确实保持一致

在这里插入图片描述

数量大之后就需要定位页面元素编写代码来统计具体实际展示出的结果总数,这里贴上部分代码:

private String parseHtmlContentByRegex(File file ){String content=readFile(file);//通过正则表达式去掉正文中的<script>标签content=content.replaceAll("<script.*?>(.*?)</script>"," ");//通过正则表达式去掉正文中的其它标签content=content.replaceAll("<.*?>"," ");通过正则表达式合并多个空格content = content.replaceAll("\\s+", " ");content.replaceAll("  "," ");content.replaceAll("   "," ");return  content;}

标题、描述、URL是否正确显示

如图,可以看到三者正确显示:

在这里插入图片描述

3.3 性能测试

在这里插入图片描述

单线程构建正排和倒排索引

代码如下:

public void run(){List<File> fileList=new ArrayList<>();//枚举所有以.html结尾的文件enumFile(INPUT_FILE,fileList);long start=System.currentTimeMillis();//解析每一个html文件for(File file:fileList){//解析每一个html文件parseHtml(file);System.out.println(file.getName());if(file.getName().equals("ArrayList")){System.out.println("===============================================================");}}index.save();long end=System.currentTimeMillis();log.info("单线程所消耗的时间:"+(end-start)+"ms");}

单线程消耗时间如下图所示:

在这里插入图片描述

多线程构建正排和倒排索引

代码如下:

public void runByThread() throws InterruptedException {List<File> fileList=new ArrayList<>();//枚举所有以.html结尾的文件enumFile(INPUT_FILE,fileList);long start=System.currentTimeMillis();//创建一个包含10个线程的线程池ExecutorService executorService= Executors.newFixedThreadPool(10);//创建一个计数器来表示文件的数量CountDownLatch countDownLatch=new CountDownLatch(fileList.size());for(File file:fileList){executorService.submit(new Runnable() {@Overridepublic void run() {parseHtml(file);log.info("文件名:"+file.getName()+"文件路径:"+file.getAbsolutePath());countDownLatch.countDown();}});}countDownLatch.await();executorService.shutdown();index.save();long end=System.currentTimeMillis();log.info("多线程所消耗的时间:"+(end-start)+"ms");}

多线程消耗时间如下图所示:

在这里插入图片描述

这里可以看到多线程的处理速度比单线程快了许多,时间也大概快了一倍

下面是10个线程的处理性能:

在这里插入图片描述

在这里插入图片描述

10个线程短时间内的吞吐量:

在这里插入图片描述

多线程下单短时间响应时间折线图:
在这里插入图片描述

在这里插入图片描述

下图是界面的响应速度:

在这里插入图片描述

3.4 兼容性测试

在这里插入图片描述

![在Windows11环境下:
联想浏览器:正常运行]

在这里插入图片描述
![在Windows11环境下:
谷歌浏览器:正常运行、

在这里插入图片描述

![在Windows11环境下:
Edge浏览器:正常运行]

在这里插入图片描述

小米手机环境:
手机QQ浏览器:正常运行

在这里插入图片描述

3.5 自动化测试

自动化测试代码如下:

 void searchResult() throws InterruptedException {//找到搜索框,输入查询词driver.findElement(By.cssSelector("body > div > div.header > input[type=text]")).sendKeys("static");//点击搜索按钮driver.findElement(By.cssSelector("#search-btn")).click();Thread.sleep(3000);//找到搜索结果的标题并进行点击driver.findElement(By.cssSelector("body > div > div.result > div:nth-child(2) > a")).click();//获取当前页面的句柄String curHandle=driver.getWindowHandle();Set<String> handles=driver.getWindowHandles();for (String handle:handles){if (handle!=curHandle){driver.switchTo().window(handle);}}Thread.sleep(3000);//查找在线文档页面的元素验证跳转成功driver.findElement(By.cssSelector("#allclasses_navbar_top > li > a"));}

如下效果图展示:

自动化视频 2025-01-26 145252

四、测试总结

以下是搜索引擎测试总结的结构化内容:

4.1 功能测试方面
  1. 搜索准确性
    • 测试了不同类型的关键词,包括常见词汇、专业术语、模糊表述等。发现大部分常见词汇能准确找到相关结果,但对于一些非常模糊或者具有多义性的表述,搜索引擎的结果准确性会有所下降。例如,搜索“苹果”,除了水果类结果,还会出现苹果公司相关结果,在某些特定需求下可能不够精准。
  2. 搜索结果多样性
    • 检查搜索结果是否涵盖了多种来源,如网页、新闻、学术论文、图片、视频等。总体上,现代搜索引擎在这方面表现较好,能提供较为丰富的结果类型。但在一些特定领域,如小众的学术研究方向,结果多样性可能会受到数据源数量的限制。
  3. 搜索排序合理性
    • 评估搜索结果的排序是否符合相关性原则。一般来说,搜索引擎会根据关键词匹配度、网页权重等因素进行排序。然而,有时会发现商业推广内容的排序可能会影响到自然搜索结果的展示顺序,对用户体验有一定的干扰。
4.2 性能测试方面
  1. 响应速度
    • 在不同网络环境下(如高速宽带、移动网络)测试搜索请求的响应时间。在良好网络环境下,响应速度较快,能在1 - 2秒内给出结果。但在网络信号较差的移动网络环境中,响应时间可能会延长到5 - 10秒甚至更久。
  2. 资源占用
    • 监控搜索引擎在运行过程中对设备资源(如CPU、内存)的占用情况。在长时间使用或者进行大量搜索时,搜索引擎的客户端可能会占用较多内存,导致设备运行速度变慢,尤其是在配置较低的设备上。
4.3 用户界面测试方面
  1. 界面布局
    • 检查搜索引擎界面的布局是否简洁、直观。良好的界面布局应该能够让用户快速找到搜索框、筛选工具等重要元素。部分搜索引擎在界面上存在广告位过多,影响用户对搜索结果的查看体验的问题。
  2. 易用性
    • 测试用户操作的便捷性,如输入关键词、选择搜索结果、使用高级搜索功能等。一些搜索引擎的高级搜索功能隐藏较深,普通用户很难发现和使用,降低了搜索的精准性和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/68378.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DBO-高斯回归预测matlab

蜣螂优化算法(Dung Beetle Optimizer, DBO)是一种新型的群智能优化算法&#xff0c;在2022年底提出&#xff0c;主要是受蜣螂的的滚球、跳舞、觅食、偷窃和繁殖行为的启发。 本次研究使用的是 Excel 格式的股票预测数据。数据集按照 8&#xff1a;1&#xff1a;1 的比例&#x…

MySQL篇之对MySQL进行参数优化,提高MySQL性能

1. MySQL参数优化说明 MySQL 参数调优是提高数据库性能的重要手段之一。通过调整 MySQL 的配置参数&#xff0c;可以优化查询速度、提升并发处理能力、减少资源消耗等。 MySQL 的性能优化涉及到多个方面&#xff0c;包括内存管理、磁盘 I/O、查询优化、连接管理、复制配置等。…

8621 二分查找

SCAU数据结构OJ第五章 文章目录 8621 二分查找 8621 二分查找 Description 编写Search_Bin函数&#xff0c;实现在一个递增有序数组ST中采用折半查找法确定元素位置的算法. 输入格式 第一行: 元素个数n 第二行&#xff1a;依次输入n个元素的值&#xff08;有序&#xff09; 第…

差分等长的原理

差分等长是指在设计差分信号传输线路时&#xff0c;保证两条差分线的长度尽量一致&#xff0c;长度之差在一个合理的范围内。这是为了确保两个差分信号时刻保持相反极性&#xff0c;减少共模分量&#xff0c;从而提高信号传输的质量。 在差分信号传输中&#xff0c;两条差分线…

Autogen_core: Reflection

目录 代码代码逻辑解释&#xff1a;数据类定义&#xff1a;CoderAgent 类&#xff1a;ReviewerAgent 类&#xff1a;主程序&#xff1a; 完成的功能&#xff1a; 代码 from dataclasses import dataclassdataclass class CodeWritingTask:task: strdataclass class CodeWritin…

我们需要有哪些知识体系,知识体系里面要有什么哪些内容?

01、管理知识体系的学习知识体系 主要内容&#xff1a; 1、知识管理框架的外部借鉴、和自身知识体系的搭建&#xff1b; 2、学习能力、思维逻辑能力等的塑造&#xff1b; 3、知识管理工具的使用&#xff1b; 4、学习资料的导入和查找资料的渠道&#xff1b; 5、深层关键的…

java后端之事务管理

Transactional注解&#xff1a;作用于业务层的方法、类、接口上&#xff0c;将当前方法交给spring进行事务管理&#xff0c;执行前开启事务&#xff0c;成功执行则提交事务&#xff0c;执行异常回滚事务 spring事务管理日志&#xff1a; 默认情况下&#xff0c;只有出现Runti…

Sora学习

openai 12天的发布会 remix:对视频处理 可以改变视频的元素和内容&#xff0c;打开一扇门的例子&#xff08;打开门是太空&#xff0c;打开门是丛林&#xff09; recut:重新生成或者重新剪辑&#xff0c;给一个视频前后做扩展 storyboard:可以对每一帧进行剪辑和生成新的 …

Python 字典:快速掌握高效的数据存储方式

文章目录 一、什么是字典?字典的定义二、字典的基本操作1. 访问字典的值2. 修改字典中的值3. 添加新的键值对4. 删除键值对5. 获取字典长度三、字典的遍历1. 遍历键2. 遍历值3. 遍历键值对四、字典的常用方法1. `keys()`:获取所有键2. `values()`:获取所有值3. `items()`:获…

【嵌入式】总结——Linux驱动开发(三)

鸽了半年&#xff0c;几乎全忘了&#xff0c;幸亏前面还有两篇总结。出于快速体验嵌入式linux的目的&#xff0c;本篇与前两篇一样&#xff0c;重点在于使用、快速体验&#xff0c;uboot、linux、根文件系统不作深入理解&#xff0c;能用就行。 重新梳理一下脉络&#xff0c;本…

RabbitMQ 多种安装模式

文章目录 前言一、Windows 安装 RabbitMq1、版本关系2、Erlang2.1、下载安装 Erlang 23.12.2、配置 Erlang 环境变量 3、RabbitMQ3.1、下载安装 RabbitMQ 3.8.93.2、环境变量3.3、启动RabbitMQ 管理插件3.3、RabbitMQ3.4、注意事项 二、安装docker1、更新系统包&#xff1a;2、…

使用python-docx包进行多文件word文字、字符批量替换

1、首先下载pycharm。 2、改为中文。 3、安装python-docx包。 搜索包名字&#xff0c;安装。 4、新建py文件&#xff0c;写程序。 from docx import Documentdef replace1(array1):# 替换词典&#xff08;标签值按实际情况修改&#xff09;dic {替换词1: array1[0], 替换…

Android中Service在新进程中的启动流程

目录 1、Service与AMS交互框架介绍 1.1、认识AMS代表IActivityManager 1.2、认识客户端代表IApplicationThread 2、Service启动流程概览 我们知道Android有四大组件&#xff0c;Activity、Service、ContentProvider、Broadcast&#xff0c;每个组件在系统运行中或者我们编写…

【信息系统项目管理师-选择真题】2011下半年综合知识答案和详解

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7题】【第8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】…

read+write实现:链表放到文件+文件数据放到链表 的功能

思路 一、 定义链表&#xff1a; 1 节点结构&#xff08;数据int型&#xff09; 2 链表操作&#xff08;创建节点、插入节点、释放链表、打印链表&#xff09;。 二、链表保存到文件 1打开文件 2遍历链表、写文件&#xff1a; 遍历链表,write()将节点数据写入文件。…

【景区导游——LCA】

题目 代码 #include <bits/stdc.h> using namespace std; using ll long long; const int N 1e5 10; const int M 2 * N; int p[N][18], d[N], a[N]; ll dis[N][18]; //注意这里要开long long int h[N], e[M], ne[M], idx, w[M]; int n, k; void add(int a, int b, …

Vue 3 30天精进之旅:Day 06 - 表单输入绑定

引言 在前几天的学习中&#xff0c;我们探讨了事件处理的基本概念及其在Vue中的应用。今天&#xff0c;我们将进一步了解Vue的表单输入绑定。这是构建用户交互式应用的核心部分&#xff0c;使得我们能够方便地处理用户输入并实时更新数据。本文将介绍如何在Vue中实现单向和双向…

二进制安卓清单 binary AndroidManifest - XCTF apk 逆向-2

XCTF 的 apk 逆向-2 题目 wp&#xff0c;这是一道反编译对抗题。 题目背景 AndroidManifest.xml 在开发时是文本 xml&#xff0c;在编译时会被 aapt 编译打包成为 binary xml。具体的格式可以参考稀土掘金 MindMac 做的类图&#xff08;2014&#xff09;&#xff0c;下面的博…

反向代理模块。。

1 概念 1.1 反向代理概念 反向代理是指以代理服务器来接收客户端的请求&#xff0c;然后将请求转发给内部网络上的服务器&#xff0c;将从服务器上得到的结果返回给客户端&#xff0c;此时代理服务器对外表现为一个反向代理服务器。 对于客户端来说&#xff0c;反向代理就相当于…

AI常见的算法

人工智能&#xff08;AI&#xff09;中常见的算法分为多个领域&#xff0c;如机器学习、深度学习、强化学习、自然语言处理和计算机视觉等。以下是一些常见的算法及其用途&#xff1a; 1. 机器学习 (Machine Learning) 监督学习 (Supervised Learning) 线性回归 (Linear Regr…