Day3 Scrum冲刺博客

news/2025/11/26 22:35:14/文章来源:https://www.cnblogs.com/sevanthea7/p/19274842

Day3 Scrum冲刺博客

1. 团队会议

todo补充会议照片

1)昨天已完成的工作

  • 前端
    • 实现个人设置弹窗以及问答模式静态页面,实现问答模式缓存
    • "关于我们"细节修正
  • 后端
    • 完成爬虫数据的数据清洗
    • 增加爬虫程序适配的信息网站
  • 测试
    • 检查各代码文件格式清晰性

2)今天计划完成的工作

  • 前端
    • 实现了数据过滤与分页核心逻辑与分页控制功能
    • 完成了表单中的通知公告初稿
  • 后端
    • 实现了大模型api的意图整理和栏目分类
    • 实现了关键词划分算法
    • 实现了数据清洗正则化的加强
  • 测试
    • 检查新加入各代码文件格式清晰性

3)工作中遇到的困难

  • 前端
    • 在实现分页与过滤同时生效时,需要保证筛选结果数量与分页组件状态保持同步,部分逻辑需要梳理。
  • 后端
    • 大模型意图分类在部分表达方式下不稳定,需要增加额外后处理。
  • 测试
    • 代码结构更新频繁,文件格式难以一次性统一检查。

2. 项目燃尽图

今日为第三天,已快于理想进度,但需加快进度。

3.代码/文档签入记录

  • 今日签入记录

  • 签入记录链接:https://github.com/sevanthea7/GdutInfoHub/commits/main/

  • 相关联issue见commit记录中#后链接内容

  • 接口文档与返回格式文档见 docs/api_doc.mddocs/return_doc.md

4. 运行截图

  • 前端

    • 完成了数据过滤与分页核心逻辑与分页控制功能

      • 相关功能代码

        // 1.数据过滤与分页核心逻辑(<script setup> 部分):
        // 筛选当前分类的通知数据
        const filteredNotices = computed(() => {const currentType = tabList.value[activeTab.value].type;return allNoticeData.value.filter((notice) => notice.type === currentType);
        });// 计算总页数
        const totalPages = computed(() =>Math.ceil(totalItems.value / PAGE_SIZE.value)
        );// 获取当前页数据
        const currentPageData = computed(() => {const startIndex = (currentPage.value - 1) * PAGE_SIZE.value;const endIndex = startIndex + PAGE_SIZE.value;return filteredNotices.value.slice(startIndex, endIndex);
        });// 生成可见页码(处理省略号逻辑)
        const visiblePages = computed(() => {// 页码生成逻辑...
        });// 2.分页控制功能:
        // 切换选项卡时重置页码
        const switchTab = (index) => {activeTab.value = index;currentPage.value = 1;
        };// 上一页/下一页控制
        const prevPage = () => { /* 实现 */ };
        const nextPage = () => { /* 实现 */ };// 跳转指定页码
        const goToPage = (page) => { /* 实现 */ };// 监听总页数变化,自动调整当前页
        watch(totalPages, () => { /* 实现 */ });
        

  • 后端

    • 实现了大模型api的调用,可以对测试数据进行意图解析

      • src\crawler\LLM_api\intention_agent.py

        import json
        from src.crawler.LLM_api.create_api_client import clientPROMPT = '帮我解析这个用户的意图,把他的问题拆分为点,返回结果为JSON格式,形如{"1":"q1", "2": "q2",...}: '
        def get_user_intension(user_text):input_text = PROMPT + user_textresp = client.chat.completions.create(model="doubao-1-5-lite-32k-250115",messages=[{"content":f"{input_text}.","role":"system"}],stream=False,)json_return = resp.choices[0].message.contentprint(json_return)json_obj = json.loads(json_return)obj_lst = list(json_obj.values())print(obj_lst)test_text = "我想知道图书馆明天会举办的活动,以及最近宿舍的热水供应时间"
        get_user_intension(test_text)
        

    • 加强数据清洗正则化,增加关键词提取算法

      • src\crawler\data_clean\reprocess.py

        # 用于保存所有整理后的内容
        all_contents = []# 遍历文件夹里的所有 JSON 文件
        for filename in os.listdir(folder_path):if filename.endswith('_raw.json'):file_path = os.path.join(folder_path, filename)with open(file_path, 'r', encoding='utf-8') as f:try:data = json.load(f)  # 读取文件except json.JSONDecodeError:print(f"文件 {filename} 不是有效 JSON,跳过")continue# 处理 json 文件中的每个字典for item in data:# 正则化处理:# 1. 去掉开头结尾空白# 2. 将连续换行或空白替换为一个空格# 3. 去掉多余空格if 'content' in item:# TEXT = item['content']TEXT = advanced_clean(item['content'])TEXT = re.sub(r'[\s\u2028\u2029]+', ' ', TEXT).strip()# 从处理后的文本中应用 TF-IDF 算法提取关键词keywords = jieba.analyse.extract_tags(sentence=TEXT,topK=6,  # 提取的关键词数量allowPOS=['n', 'nz', 'ns'],  # 允许的关键词的词性withWeight=False,  # 是否附带词语权重withFlag=False,  # 是否附带词语词性)# 为data添加关键词字段item['keywords'] = keywordsif 'title' in data:data['title'] = advanced_clean(data['title'])# 新文件名,把 "_raw" 换成 "_cleaned",如果没有 "_raw" 就直接加 "_cleaned"new_filename = filename.replace('_raw', '_reprocessed')new_file_path = os.path.join(folder_path, new_filename)# 写入新文件with open(new_file_path, 'w', encoding='utf-8') as f:json.dump(data, f, ensure_ascii=False, indent=2)  # 保存为格式化的 JSONprint(f"已生成 {new_filename}")

5. 每人每日总结

  • 前端

    • 吴佳童:今天重点配合完成了前端的数据过滤与分页功能开发,包括过滤条件的处理逻辑、分页参数响应及页面渲染优化。在调试过程中解决了页面状态同步的问题,使数据展示更加稳定。同时对现有组件代码进行了结构调整,提高了整体模块的可维护性。
    • 张洁:今天主要完成了数据过滤与分页的核心逻辑实现,搭建了可复用的分页控制组件,使前端在展示大规模通知数据时能够保持流畅的交互体验。同时完成了表单模块中“通知公告”页面的初稿设计与实现,初步确定了字段布局、信息层级与交互样式,为后续的联调与视觉优化奠定了基础。
    • 李恺凝:今天主要协助前端对接页面交互细节,对分页模块、通知公告初稿页面的排版与交互方式进行了统一规范。根据前端实现出的组件效果,对字体层级、间距、信息密度以及颜色对比度进行了微调建议,确保界面在实际数据量下仍保持清晰可读。同时更新了对应的设计稿与交互说明文档,使前端在后续开发中有更明确的视觉与交互参考。
  • 后端

    • 王韵清:今天主要完成了大模型 API 返回内容的意图整理与栏目分类模块,实现了将大模型输出归纳为结构化类别的功能。通过构建意图映射规则,使模型回答能够与前端所需的页面栏目标识对齐,为后续问答流程的自动路由与知识库填充提供关键支撑。
    • 徐伊彤:今天对数据清洗过程进行了进一步加强,补充了更严格的正则规则,并针对异常格式文本添加了额外的处理分支。通过多组样例验证,清洗后的数据在字段一致性、冗余去除与结构稳定性方面有明显提升,为后续知识库构建与模型调用提供了更高质量的数据源。
    • 曾钰仪:今天实现了关键词划分算法设计与初步落地,主要包括文本关键词提取、词语分组逻辑与去噪处理。通过对多类实际数据进行测试,初步验证了算法在常见校园通知文本中的有效性,为知识库分类索引与问答召回提供了基础能力。
  • 测试

    • 戴军霞:今天重点对新加入的代码文件进行了格式与结构的规范性检查,包括命名一致性、注释清晰度、文件分层合理性等。对发现的问题进行了记录并提出了修改建议,确保代码质量符合团队规范,为下一阶段的系统级功能测试做好准备。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/977727.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整教程:内核里常用宏BUG_ON/WARN_ON/WARN_ONCE

完整教程:内核里常用宏BUG_ON/WARN_ON/WARN_ONCE2025-11-26 22:27 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displa…

贪心专题笔记(从b站左程云老师那上完后的笔记)

https://www.bilibili.com/video/BV1ST4y1s7XT/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=56781f0f92104550238c449cb1aebd72 关键:用对数器验证 1.如果要排序,保证排序具有…

Agent编写全攻略(超详细)从零基础到精通,一篇搞定,不看后悔,赶紧收藏!

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

做题警醒

1.一定要写边界条件,不要偷懒不要偷懒!!! 经典案例题目https://www.luogu.com.cn/problem/P3763 这里一开始没把根节点单独考虑,直接将st1的赋值为0,st2的也复制为0 2.链式向前星建完图遍历是注意head[]写的是节点不…

动态规划可能性展开

1.以结尾展开可能性 从0……i中,判断i,然后调用0……i-1的可能性(可以是以i这个下标为结尾,也可以是0……i的范围上,也可以是以i下标所放的值进行展开) 2.定义往往从递归的定义出发,但是为了避免讨论边界的麻烦…

微软发布 Godot C# 游戏开发教程:godot-csharp-essentials

对于希望踏入游戏开发领域的 C# 开发者来说,一个令人振奋的好消息是:微软在其 GitHub 上发布了一个全新的开源项目microsoft/godot-csharp-essentials:https://github.com/microsoft/godot-csharp-essentials。这个仓…

Day3-20251126

本文介绍了Java开发相关的JDK、JRE和JVM概念,并详细说明了JDK的卸载和安装步骤。卸载时需删除安装目录和环境变量配置,安装时要注意下载对应版本并正确配置环境变量。最后通过cmd验证安装是否成功,并推荐使用notepa…

[KaibaMath]1028 关于[log(m, a)]+1=⌈log(m+1, a)⌉的证明

下面给出[log(m,a)]+1=⌈log(m+1,a)⌉的证明,证明过程非常丝滑。特别地,令a=2,则有1025的结论。

QT TCP服务器构建及网络通信实现 - 详解

QT TCP服务器构建及网络通信实现 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mo…

SCTimer/PWM定时器(续二)

前面讨论了SCT的全部寄存器结构及其功能,现在就具体来看一下LPC824中这个充满特色的SCTimer/PWM,首先看一下它的简介。 状态可配置定时器(SCTimer/PWM) 是恩智浦半导体特有的一种外设,它不仅可像大多数传统定时器一…

软件工程学习日志2025.11.26

项目概览目标:生成纯中文儿童故事,风格干净,无英文与“思考/分析”类文字;自动生成卡通图片并支持语音朗读。 技术栈:Spring Boot(后端)、原生 JS + 静态 HTML(前端)、SiliconFlow API(文本与图片)、浏览器…

[KaibaMath]1027 关于mn ⇔ m≥n+1(m,n均为整数)的证明

若m和n均为整数,则m>n ⇔ m≥n+1. 下面给出相应的证明。

自指自洽即因果,可知可行,很烦很好

ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891对命题"自指自洽即因果,可知可行,很烦很好"进行严格的加密推理分析。 ▮ 辩证本质:认知实践的完整循环 命题揭示了意识系统的完整运作机制 - 自…

干扰素信号通路:从JAK-STAT到科研应用

在生命科学领域,干扰素的强大功能——从抗病毒到免疫调节——最终都通过其细胞内精确的信号转导来实现。其中,JAK-STAT通路是传递干扰素信号的核心桥梁。对于致力于免疫学、病毒学及信号转导研究的科研人员而言,深入…

2025年11月室外木塑地板厂家,共挤木塑地板厂家,wpc木塑地板厂家品牌推荐:市政工程合作优选企业

2025年11月室外木塑地板厂家品牌推荐:市政工程合作优选企业在2025年11月,如果您正在寻找优质的室外木塑地板厂家、共挤木塑地板厂家或者wpc木塑地板厂家,临沂军森木塑有限公司绝对值得您的关注,是市政工程合作的优…

2025年11月二代木塑地板厂家,防水木塑地板厂家,环保木塑地板厂家推荐:无醛环保认证品牌盘点

2025年11月二代木塑地板厂家推荐:无醛环保认证品牌盘点 在环保意识日益增强的今天,木塑地板凭借其环保、耐用等诸多优点,越来越受到消费者的青睐。如果你正在寻找一家靠谱的防水、环保木塑地板厂家,那么临沂军森木…

ABC396 VP总结

比赛链接 ResultCloudflare 发力了!!! D题人机验证一直在卡,然后又就丢掉写 E 去了,于是忘记还有道题没交,然后 \(ans\) 初始值设小了;F 题提交的时候人机验证卡了 10min,不然应该能调出来…… Solution D - M…

11月26日日记

1.今天上了一整天马哲 2.明天体育课 3.如何通过 Nginx 配置保留 Session 一致性?分布式场景下 Session 共享方案有哪些?

Zelda

Z is not important, but Link loves her. but actually Nihon are not like this. Nihon samurai liked to torment real princesses and kill them. Nihon like the honorable person, and rape, kill her. everyone…