团队作业3-需求改进系统设计

news/2025/11/22 18:10:06/文章来源:https://www.cnblogs.com/JianjiaGuan/p/19258278

团队作业3-综合报告(Alpha阶段)

项目 详情
这个作业属于哪个课程 计科23级12班
这个作业要求在哪里 作业要求链接
这个作业的目标 对现有项目进行设计和需求&原型改进,进行 Alpha 阶段任务分配

队名与队员:

MCoder,Manage Code & Organize Development EffoRt

王宥程-3123004714

关健佳-3121004072

高泽彤-3123004304

黎火坤-3123004310

翁广驰-3123004409

王怡欧-3223004344

1. 需求与原型改进

原型:

图片1

  • 针对课堂讨论提出的问题与建议进行修改

    • 问题1:知识需要手动导入,无自动解析分块的方式

      • 修改1:增加 pdf 解析,按规则分块的能力,提供修改分块后导入功能
    • 问题2:无图片理解能力,只能给予文本问答,缺少对图片的理解。

      • 修改2:增加多模态处理能力
  • 加分:面向目标用户的原型展示与访谈摘要

    • 目标用户:政策解读人员、企业法务/运营、普通公众、知识维护者。
    • 主要痛点:
      • 找条文慢、语义难、上下文碎片,难以形成可引用的解释。
      • 大量PDF杂质文本,导入后检索不准;问答难追溯。
      • 不同问答平台行为不一致,缺少统一记录与反馈机制。
    • 场景(产品前/后):
      • 使用前:手工搜PDF,复制粘贴,问答毫无记忆,无法复盘。
      • 使用后:将法规导入为结构化段落,RAG检索提取上下文,形成可追溯回答并留存记录,支持反馈与人工修订。
    • User Story:
      • 作为“政策解读人员”,我希望上传一份最新版补偿政策PDF,系统自动切分为条款段落,我在导入页微调后提交;当我询问“住宅类补偿标准”,系统返回带出处的回答,并显示Top-5相关条款与相似度。我可以对回答点赞并记录修订意见,后续同类问题自动引用已修订版本。
  • 上周《需求规格说明书》的不足与改进要点(摘要)

    • 不足:Prompt 设计功能缺失

    • 改进:

      • 增加Prompt设置接口与会话管理改进;
  • 功能定位与优先级(四象限)

    • 高价值/低成本:Prompt设置、会话选择与清理、反馈点赞/点踩、非流式回答详情。
    • 高价值/高成本:Milvus集成与调优、RBAC与审计、知识版本管理、多模态问答增强。
    • 低价值/低成本:UI细节美化、系统信息页文案优化、导入页提示。
    • 低价值/高成本:多人实时协作编辑、跨库全文检索聚合(暂缓)。
  • WBS与进度计划(根据修改后的需求)

    • WBS(交付件树):
      • 前端UI:问答页(流式/非流式/检索展示)、知识库管理(CRUD/导入/解析)、系统信息(会话/Prompt/健康状态)、图片问答页。
      • 后端API:/knowledge系列、/qa/ask/qa/ask-stream/qa/ask-image/qa/feedback/sessions/settings/prompt/qa/{id}/human-review
      • 服务层:KnowledgeServiceQAServiceEmbeddingServiceVectorStoreSettingsServiceMemoryService
      • 数据层:SQLite模型与会话存储、Milvus集合与索引、初始化脚本。
      • 运维与配置:run.py双端启动、config.py环境变量、日志与健康检查。
    • 进度计划(Alpha迭代,7天):
      • D1-D2:会话/Prompt与人工介入接口;解析页多策略;系统信息页健康状态。
      • D3-D4:Milvus检索调优与降级;知识版本/来源字段;图片问答增强。
      • D5:前端联调与可用性迭代;反馈闭环。
      • D6:端到端回归与性能基线;问题单收敛。
      • D7:文档完善与演示准备。

3. 系统设计

  • 架构设计(分层与职责)

    • 前端(Streamlit):三页签UI,问答流式渲染、检索知识展示、PDF解析与人工编辑、系统信息及Prompt设置(frontend.py)。
    • API层(FastAPI):路由与依赖注入,统一模型序列化(main.py)。
    • 服务层:
      • 问答编排与日志记录(qa_service.py):检索→上下文→LLM→写 QARecord→返回含检索相似度。
      • 知识管理与导入解析(knowledge_service.py):CRUD、PDF分段与导入、Milvus索引维护。
      • 向量检索封装(vector_store.py):集合创建、索引、Top-K检索、维度校验。
      • Embedding生成(embedding_service.py):OpenAI兼容/Ollama两种调用路径。
      • 会话记忆(memory_service.py):基于 SQLChatMessageHistorysession_id管理历史。
      • Prompt设置(settings_service.py):系统与答案模板持久化。
    • 数据层:SQLite(ORM模型、会话历史)、Milvus(向量集合与索引)。
    • 外部接口:OpenAI兼容模型(文本/图像)、Ollama嵌入端点。
  • 关键流程(文本问答)

    • 用户提问→生成查询向量→Milvus检索Top-K→构建上下文→LLM生成→写入 QARecord→返回答案+检索条目。

4. Alpha任务分配计划

  • Product Backlog(按优先级与依赖)

    • P0:文本问答链路稳定(检索/上下文/流式)、PDF解析与人工编辑导入、反馈机制闭环。
    • P1:会话管理改进与Prompt设置、Milvus健康状态展示与降级路径。
    • P2:人工介入端到端、知识版本/来源字段、多模态图片问答增强。
  • Sprint Backlog(已有功能清单)

    • 后端:

      • 知识库管理 CRUD:POST/GET/PUT/DELETE
      • PDF解析与导入
      • 文本问答(非流式与流式)。
      • 图片理解问答,多模态处理实现。
      • 反馈机制
      • 会话管理
      • Prompt设置
      • 向量检索与索引
    • 前端:

      • 问答页:问题输入、流式回答渲染、非流式详情、Top-5检索条目及相似度展示、反馈按钮、过程日志查看与保存
      • 图片问答:图片上传与问题输入,非流式展示答案。
      • 知识库管理:新增知识、列表展示、删除、快速导入PDF、解析-人工编辑-选段导入
      • 系统信息与配置:Prompt设置编辑与保存,会话列表加载、创建、清空
  • 甘特图:
    图片2

5. 测试计划

  • 测试范围与目标

    • 覆盖产品主要能力:知识库CRUD、文本问答(非流式/流式)、图片问答、PDF解析与导入、会话与Prompt设置、反馈机制。
    • 目标:正确性、稳定性、可追溯、性能(响应时间、流式首字节)与降级有效性。
  • 测试类型

    • 单元测试:KnowledgeService.parse_pdf切分准确性;EmbeddingService两种端点的异常/超时;VectorStore.ensure_collection维度校验;SettingsServiceCRUD。
    • API集成测试:/knowledge系列、/qa/ask/qa/ask-stream/qa/ask-image/qa/feedback/sessions/settings/prompt
    • 端到端(E2E):前端流式渲染、检索展示、解析导入与问答闭环;会话选择与清理。
    • 性能与健壮性:Top-K检索耗时、首字节时间、并发下流式稳定;Milvus不可用时的降级行为。
    • 回归测试:对核心链路建立用例集,每次改动后回归。
  • 时间安排与角色

    • 与开发同步开展:后端完成一个接口即加入集成用例;前端完成功能即执行E2E。
    • 角色分工:
      • 后端同学主导单元测试与API集成;
      • 前端同学主导E2E与可用性;
      • PM收敛问题单与性能基线记录。
  • 资源与工具

    • 测试数据:政策PDF样本(章节/条款结构多样),标准问题集与期望回答模板。
    • 工具:requests/httpx集成测试脚本、uvicorn本地后端、streamlit前端、Milvus本地/容器化部署。
  • 入口/退出准则

    • 入口:所有P0功能接口可用,基本页面可访问。
    • 退出:P0链路回归通过,流式与非流式稳定,关键错误率<1%,性能指标达标。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/973311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整教程:Opencv(一): 用Opencv了解图像

完整教程:Opencv(一): 用Opencv了解图像pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "M…

docker compose插件安装

参考链接 在 Ubuntu 22.04 中,我们需要从官方 Docker 仓库安装 Docker Compose 插件。首先,让我们确保我们具备必要的先决条件: sudo apt-get install -y ca-certificates curl gnupg现在,添加 Docker 的官方 GPG …

完整教程:树与二叉树的奥秘全解析

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

C#扩展成员全面解析:从方法到属性的演进

本文详细介绍了C#中扩展成员的发展历程,从传统的扩展方法到C# 14中的扩展属性和索引器,通过具体代码示例展示如何更优雅地扩展现有类型功能。C#扩展成员:你需要知道的一切 扩展方法在C#中已经存在很长时间。它们允许…

多机elasticsearch集群部署,超详细教程

假设我们有三台机器,172.24.52.209,172.24.52.210,172.24.52.211。 用户名xjw 三台机器都创建文件夹/home/xjw/docker/learning/elasticsearch,和/home/xjw/docker/learning/kibana,learning为项目名 mkdir -p /h…

DeepSeek 提取 交易所网站核心500词汇(名词与术语)

DeepSeek 提取 交易所网站核心500词汇(名词与术语)交易所网站核心词汇扩充(名词与术语) 1. 市场结构与微观结构 英文术语中文翻译Auction 竞价Opening Auction 开市竞价Volatility Control Mechanism 市场波动调节…

[251122 678mAh] 模拟赛没破防有感 3.0

/hanx我写完 T4 了。 编译运行。 好的,卡住了。 应该是 RE 了。 ?为什么是在输出完答案之后卡住。 (想起了不好的回忆) 诶,别! 别别别别别! 就剩一个小时了别给我干死机了,这次可不是在线提交啊机子还原一下整…

白银市一对一培训机构推荐,2026年最新课外辅导全面测评口碑排名榜

在白银这座教育资源蓬勃发展的城市,从白银区繁华的北京路商圈到平川区快速崛起的会展中心周边,从靖远县文教氛围浓厚的学府街区到会宁县底蕴深厚的教育板块,从景泰县充满活力的新城商圈到皋兰县快速成长的教育园区,…

天水市一对一培训机构推荐,2026最新课外辅导机构口碑深度测评排名榜

在天水市,无论是秦州、麦积两区的繁华都市圈,还是秦安、甘谷、武山、清水、张家川回族自治县等地的莘莘学子,家长们都怀揣着同样的期望:让孩子在接受优质校内教育的同时,能通过课外辅导弥补短板、拔高优势,在求学…

CSAPP bomblab

规则:对于每个\(phase\),你都需要输入一个字符串,使得\(explode\_bomb\)函数不被运行 在bomb目录下使用objdump -d bomb > bomb.s得到反汇编文件\(bomb.s\) \(shell\) 中使用 gdb bomb进入\(gdb\)调试phase_1000…

history of linux

Linux 是一个开源的、跨平台的操作系统,其历史可以追溯到 1991 年。以下是 Linux 的主要发展历史阶段:1. 前身:Minix(1987)开发者:Andrew S. Tanenbaum特点:一个小型、可移植的操作系统内核,主要用于教学。与 …

history linux

当你在 Linux 系统中运行 history 命令时,它会显示你之前执行过的命令历史记录。这个命令是 Shell(如 Bash)内置的,用于跟踪用户在终端中执行过的命令。1. 基本用法history功能:显示当前终端中执行过的命令历史记…

Spring BeanFactoryPostProcessor 接口

[[Spring IOC 源码学习总笔记]] BeanFactoryPostProcessor是 Spring 框架提供的一个扩展点接口,它允许开发者在 Spring 在BeanFactory 加载了所有bean定义,但尚未实例化任何bean 之后,对底层的 BeanDefinition 和 B…

嘉峪关市一对一培训机构推荐,2026年最新课外补习辅导口碑排名

在雄伟的嘉峪关脚下,教育的热潮正席卷这座城市的每个角落。从雄关区的人民商城周边,到长城区的富强路商圈,再到镜铁区的润泽园社区,随处可见家长们为子女教育奔波的身影。小学生的数学思维拓展与语文阅读能力提升,…

2025 AI 教育培训权威推荐榜深度评测排名

2025 AI 教育培训权威推荐榜深度评测排名 痛点深度剖析 我们团队在实践中发现,当前 AI 教育培训领域存在着诸多核心技术挑战。在教学内容方面,AI 技术发展迅猛,知识更新换代极快,很多培训机构的课程内容难以跟上技…

详细介绍:第七篇:匹配篇 | 怎么像做产品一样,为每个岗位“定制”你的简历?

详细介绍:第七篇:匹配篇 | 怎么像做产品一样,为每个岗位“定制”你的简历?2025-11-22 17:40 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow…

2025年布袋除尘器供应商权威推荐榜单:塑烧板除尘器/耐高温除尘器/防爆除尘器源头厂家精选

在环保要求日益严格的工业制造领域,布袋除尘器作为工业粉尘治理的核心设备,其过滤效率与运行稳定性直接关系到企业的环保合规与生产成本。 工业布袋除尘器通过滤袋过滤、脉冲清灰等技术,能有效捕集工业生产中产生的…

hbuilder是否支持云端部署

HBuilder确实支持云端部署。它提供了云端打包功能,允许开发者将项目上传到云端服务器进行打包,生成Android和iOS平台的安装包。以下是HBuilder云端部署的相关信息: HBuilder云端部署支持云端打包功能:HBuilder支持…

创建矩形并让矩形移动

RGB是颜色值 使⽤⼀个元组 (R, G, B) 表示,每个值范围 0-255 。 ⿊⾊: (0, 0, 0) ⽩⾊: (255, 255, 255) 绿⾊: (0, 255, 0) pygame 坐标系 原点 (0, 0):窗⼝的左上⻆。 X 轴:向右增加 Y 轴:向下增加 按下的按键类…

2025年稳定土搅拌站供应商权威推荐榜单:搅拌站回收/二手稳定土搅拌站/二手混凝土土搅拌站源头厂家精选

在基础设施建设持续发展的背景下,稳定土搅拌站作为道路工程、机场跑道等项目的关键设备,其生产效率、混合均匀性与运行稳定性直接关系到工程质量和施工进度。 稳定土搅拌站通过精确的配料系统与高效的搅拌工艺,将水…