记录 | 关于陪伴型交互AI的一些探讨

news/2025/9/27 20:11:23/文章来源:https://www.cnblogs.com/safjh/p/19115593

关于陪伴型交互AI的一些探讨

怎么说呢主要是发布下关于自己关于AI VTuber的开发进展

前言

目前的化对整体内容进行了局部的优化和更新,并更新到了v0.5.0版本!【好累啊,都没什么热情了】
整体架构已经初步具备了稳定性以及整体工作流的实现

Github项目链接: Interactive-LLM-VTuber (v0.5.0)

同时决定不在继续在v0.5.0的版本上继续更新,并完全开源代码贡献社区发展【详细请看项目开发文档】
该项目从去年十一月开始,耗时10个月,独立开发

虽然但是,实际上只用了1的月半的时间就已经将主要功能开发完成了,但因为js我并不熟悉的问题排查了很长时间才更新到v0.4.2,这个月在AI的帮助下才总算是完成了整个项目的开发。。。。【我要死了,真的】
我只能说,这个项目耗费了我大量的心血,但在前端的问题上也给力我很大的压力【虽然最后找到问题是因为经典的前端和服务器无法主动发起相应的问题,只能等到用户有交互操作才能触发下一步【全部卡在前端的语音交互的模块构建了】】,中间的构建过程中也学到了不少内容,但我总觉得,如果我有能力就能学会更多的东西才对。。。

总之,不搞前端的交互了,就算搞也是去搞搞后端+Unity的功能型实现吧。。。
多余的我也不想多说了,感兴趣可以去项目页看看。
我累了,我得歇会【哈基米燃尽了】
等后面再发发其他项目的构想【除此以为的好像也做了不少好玩的代码全部放在WorkBench了】
后面还得准备比赛和四级
以及 深度学习【理论+实践】+强化学习+脑神经学+分子生物学+病毒+神经网络模拟+生成式认知主体+天才的诞生 的研究和发表【躺】【初步仓库先在Github建好了】
就算累了还得整理资料。。。

啊啊啊啊
睡觉去了

v0.5.0 更新(2025-09-26)
针对稳定性、用户体验和可扩展性的前端和后端优化:

前端
新布局:顶部栏(左侧版本,右侧设置 + MCP 按钮)、左侧聊天记录、底部居中的 GPT 风格输入(圆角文本区域 + 麦克风 + 发送)。
音频自动播放解锁:一个用户手势即可解锁整个会话的音频。
语音流程重做:语音输入现在仅执行 ASR。停止时,前端会轮询/latest_asr、自动填充并发送文本,统一文本→LLM→TTS→播放→历史记录的流程(防止音频播放过时)。
历史 + 流媒体:左侧历史显示“你/AI”;AI 回复以打字机流媒体呈现;在本地保留最后 200 条消息。
思考指示:底部芯片“思考中……”+发送按钮加载状态。
背景设置:设置页面添加背景(颜色/图像)。保存后会触发热重载并立即应用,无需刷新。
MCP 按钮:显示状态(运行/停止)并切换mcp_tool.py进程。
后端
API/路径强化:绝对音频 URL、TTS 后的文件存在检查、固定/audio/目录、TTS 空文本保护。
语音输入重做:录音线程仅写入最后的 ASR 文本;添加GET /latest_asr到前端。
热加载设置:POST /settings自动加载;POST /reload_settings手动加载。传播至 TTS/LLM/系统提示/音频文件夹。
MCP 集成:GET /mcp/status、POST /mcp/start、POST /mcp/stop来控制mcp_tool.py。
如何使用(重点)
开始:python server.py然后访问http://127.0.0.1:5000/。
文本:输入并按发送/回车键。
语音:单击麦克风开始,再次单击停止;识别的文本自动发送。
设置:调整 TTS/LLM/背景并保存 - 无需重启即可热加载。
MCP:通过右上角的按钮切换。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/919880.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

dw中网站统计总访问量怎么做西安小型网络公司

1:调用函数 eg:调用内置函数 abs() 求绝对值 2:定义函数 1:定义一个函数要使用 def 语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用ret…

陈村网站设计福州专业网站建设

广州大学学生实验报告 开课实验室:计算机科学与工程实验(电子楼418A) 2019年4月19日 学院 计算机科学与教育软件学院 年级、专业、班 计算机科学与技术 姓名 学号 实验课程名称 数据结构实验 成绩 实验项目名称 实验三…

百度推广做网站什么价位网吧网络维护公司

Java Collections框架 Java Collections框架中包含了大量的集合接口以及这些接口的实现类和操作它们的方法,具体包含了Set(集合)、List(列表)、Map(键值对)、Queue(队列)、Stack(栈)等,其中List、Set、Queue、Stack都继承了Collection接口。…

luogu P1719 最大加权矩形

题目大意 需要支持在一个序列中插入等差数列 需要插入\(O(1)\) 最终统计答案\(O(n)\) \(1\leq n\leq 1e7\) Sol 对于一个序列如下:0 0 4 6 8 10 12 0 0我们将其进行一次差分,可以得到:0 0 4 2 2 2 2 -12 0可以发现中间…

CF2065D Skibidus and Sigma

参考代码:#include<bits/stdc++.h> #define ll long long using namespace std; const int N = 2e5 + 10,inf = 0x3f3f3f3f; struct node{ll sum,id; }; node t[N]; vector<ll> a[N]; ll n,m; bool cmp(n…

做网站优化需要做什么vi设计要素

B. I Hate 1111&#xff1a;题目 这题目太搞了呀&#xff0c;和dp感觉关系不大&#xff0c;数学题啊首先要知道&#xff0c;11和111能构成后面所有的棍子数。 n a*111b*11;最快做法 //算是规律&#xff1f; #include <bits/stdc.h> using namespace std; int main() {…

建网站哪便宜网上商城网站建设规划

整理了基于BP神经网络的时间序列预测模型matlab代码&#xff0c;包含数据集。采用了四个评价指标R2、MAE、MBE、MAPE对模型的进行评价。BP模型在数据集上表现优异。 代码获取链接&#xff1a;基于BP神经网络的时间序列预测模型matlab代码 训练效果&#xff1a; 训练集数据的R…

微信二次开发个人号api

微信二次开发个人号api 个人微信机器人开发api接口,微信个人号开发API在线接待更高效在线沟通更快速、更有趣 语音回复 通过电脑端语音回复客户,提高效率 文件传输 支持文字、图片、视频等文件上传 快捷回复 公共快捷…

深入解析:神经网络二分类任务详解:前向传播与反向传播的数学计算

深入解析:神经网络二分类任务详解:前向传播与反向传播的数学计算pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "…

课后作业2(动手动脑,课后实验性问题)

1.仔细阅读示例: EnumTest.java,运行它,分析运行结果? 你能得到什么结论?你掌握了枚举类型的基本用法了吗? 枚举是类型安全的常量集合,比 static final int 更安全。 可以使用 switch 语句处理枚举值。 每个枚举…

从零开始构建图注意力网络:GAT算法原理与数值实现详解

图数据在机器学习中的地位越来越重要。社交网络的用户关系、论文引用网络、分子结构,这些都不是传统的表格或序列数据能很好处理的。现实世界中实体之间的连接往往承载着关键信息。 图神经网络(GNN)的出现解决了这个问…

网站开发技术可以做什么工作视频解析网站怎么做的

2022 开放原子全球开源峰会 OpenAnolis 分论坛上&#xff0c;阿里云智能基础软件产品经理张鹏程做了《面向云时代的龙蜥操作系统&#xff0c;应对 CentOS 停服的最佳选择》的主题分享&#xff0c;介绍了操作系统产业迎来新发展格局&#xff0c;龙蜥致力于成为 CentOS 迁移的最佳…

备案ip 查询网站查询网站查询系统上饶做网站最好的公司

基于神经网络的农业病虫害损失预测 【摘 要】鉴于农业病虫害经济损失的预测具有较强的复杂性和非线性特性&#xff0c;设计了一种新型的GRNN预测模型&#xff0c;对农业病虫害经济损失进行预测。该模型基于人工神经网络捕捉非线性变化独特的优越性&#xff0c;在神经网络技术和…

分解原则编写

import java.util.ArrayList; import java.util.List; import java.util.Scanner; import java.time.LocalDate; import java.time.format.DateTimeFormatter; // ManuscriptInformation类 class ManuscriptInformatio…

关于Leetcode 812题的简单思考

关于812题的 \(O(n)\) 算法的简单思考 因为今天的题目很有意思所以特别想跟大家分享一下。 812. 最大三角形面积 一开始我想到了凸包,然后想到凸包后可以采用 \(O(n^2)\) 的渐进算法算出最大面积。但是灵神的回答中提…

招聘网站开发的要求整站seo排名公司

1.下列数据结构中&#xff0c;属于非线性结构的是()。A.循环队列B.带链队列C.二叉树D.带链栈2.下列数据结构中&#xff0c;能够按照“先进后出”原则存取数据的是()。A.循环队列B.栈C.队列D.二叉树3.对于循环队列&#xff0c;下列叙述中正确的是()。A.队头指针是固定不变的B.队…

Laravel5.8 利用 snappyPDF 生成PDF文件

Laravel5.8 利用 snappyPDF 生成PDF文件pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mo…

幼儿做爰网站什么是网站推广优化

原标题&#xff1a;2019届呼和浩特市高三段考成绩排名分析不忘初心 天道酬勤╳✎校对&#xff1a;刘姝坤✎文稿&#xff1a;王涛老师✎声明&#xff1a;如有转载请联系并注明出处好乐(巨人)教育2019高三普文理集训段考班火热招生中全呼市唯一一家吃住学一体封闭式管理的学校唯一…

西城网站建设浩森宇特沈阳单页网站制作

Powered by:NEFU AB-IN 文章目录 Go 语言的实战案例 SOCKS5 代理 | 青训营 引入TCP echo serverauth 认证请求阶段relay阶段 Go 语言的实战案例 SOCKS5 代理 | 青训营 GO语言工程实践课后作业&#xff1a;实现思路、代码以及路径记录 引入 代理是指在计算机网络中&#xff…

数据结构——链表 - 详解

数据结构——链表 - 详解2025-09-27 19:42 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; fo…