【最后203篇系列】014 AI机器人-1

说明

终于开张了,我觉得AI机器人是一件真正正确,具有商业价值的事。

把AI机器人当成一笔生意,我如何做好这笔生意?一端是业务价值,另一端是技术支撑。如何构造高质量的内容和服务,如何确保技术的广度和深度?

正好在做这件事,所以我想不太多谈技术,把核心的理念和故事串一串。为技术而技术是没有价值的,为商业价值而产品又是没有生命力的,怎么让商业背后自然衔接到技术,而技术又如何自然衍生出商业价值,这是最为关键的。

内容

1 Manus

最近这个话题很火,就不多说了。有一点是,大家都模模糊糊的有了大致的方向,而且其实很多都是殊途同归的。不管怎么样,manus炒作了一把,我觉得也算是一个poc,大家可以有一些共识。

2 AI机器人

我现在的应用,是在现在的产品中嵌入一个机器人,精确基于产品的数据,而非大模型的通用能力回答问题。

时间非常紧张,大约在2周时间,完成了从poc,到上线的过程。整体上还是属于达到且稍微超过预期的一个状态,还有不少缺点,但能够用了。

还是挺感谢老板理解的,因为时间这么短,里面有很多东西是非常粗糙的,但正如马斯克说的:东西先做出来最重要,慢慢会改好的。

然后在这段时间内发现按常规方法是行不通的:anythingllm, dify, langchain, 这些成熟的套件工具没有那么熟,其实尝试过,发现在很多地方“不听话”,很难控制好。另外,关于数据应该怎么整合,如何描述给大模型完成对接,也没法按教科书那样去做。

整个过程我就奔着一个上线目标,想想第一性原理,然后迅速推进。然后我觉得有很多东西 (还有待验证)可能也如马斯克说的:世界就是一群草台班子构成的。

我用自己零散的工具和知识,也完成类似RAG和Agent Flow这样的效果,而且,似乎这个是可以不断叠加,最后由强化学习去自我优化的。我想用那些成熟工具也许是更浪费时间,而且可能是没法达到我的目标的。

自己用零件进行开发和拼装,争取在半年左右把AI机器人作出高度

这又回到我的二八理论,最终要登顶还是要靠自己。

3 结构

还是会稍微提到一点技术

  • 1 向量化。为了 更好的进行语义相似性匹配,还是需要把用户的问题转为向量。
  • 2 向量数据库。用于存储和检索近似的问题。
  • 3 FastAPI。构造流式响应服务。
  • 4 Redis。存储各种缓存,包括当前的知识数据。
  • 5 Kafka。保存会话数据。
  • 6 大模型接口。完成逻辑判断,数据整合分析。

其实可以看到,这个结构是非常简陋的,但是可以行得通。

4 问题

  • 1 服务的并发性。这个算是部分解决了,但还不够彻底。向量化的服务本来是处理批量数据的,但是在问答情况下只能一次一条,影响并发。
  • 2 当前的会话,前端没有带历史消息,回答有时看起来就会很傻。
  • 3 要问的很具体才有效。由于数据是简单糅合的,如果用户的问题偏了,机器人不会拉回来对齐,然后回答的质量就很低。
  • 4 很慢。简单问题1-3秒开始输出,中等问题大约要5-10秒才会看到回复,复杂问题可能会30秒, 这个从体验上很糟糕。
  • 5 没有过程输出。除了一个思考中的提示,没有给到中间过程。

5 第一期的改进

  • 1 让前端带2轮历史会话。
  • 2 用session_id的方式,让前端可以轮询到整个任务框架和任务完成情况
  • 3 确保能够统计到用户访问和使用的各种情况。

小步快跑,后面我再持续更新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/71983.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大模型统一集成项目】如何封装多个大模型 API 调用

🌟 在这系列文章中,我们将一起探索如何搭建一个支持大模型集成项目 NexLM 的开发过程,从 架构设计 到 代码实战,逐步搭建一个支持 多种大模型(GPT-4、DeepSeek 等) 的 一站式大模型集成与管理平台&#xff…

AI4CODE】3 Trae 锤一个贪吃蛇的小游戏

【AI4CODE】目录 【AI4CODE】1 Trae CN 锥安装配置与迁移 【AI4CODE】2 Trae 锤一个 To-Do-List 这次还是采用 HTML/CSS/JAVASCRIPT 技术栈 Trae 锤一个贪吃蛇的小游戏。 1 环境准备 创建一个 Snake 的子文件夹,清除以前的会话记录。 2 开始构建 2.1 输入会…

【简答题002】Java变量简答题

博主会经常补充完善这里面问题的答案。希望可以得到大家的一键三连支持,你的鼓励是我坚持下去的最大动力!谢谢! 001 什么是Java变量? Java变量是用来存储数据并在程序中引用的命名空间。 002 Java变量有哪些类型? J…

从零开发Chrome广告拦截插件:开发、打包到发布全攻略

从零开发Chrome广告拦截插件:开发、打包到发布全攻略 想打造一个属于自己的Chrome插件,既能拦截烦人的广告,又能优雅地发布到Chrome Web Store?别担心,这篇教程将带你从零开始,动手开发一个功能强大且美观…

基于腾讯云高性能HAI-CPU的跨境电商客服助手全链路解析

跨境电商的背景以及痛点 根据Statista数据,2025年全球跨境电商市场规模预计达6.57万亿美元,年增长率保持在12.5% 。随着平台规则趋严(如亚马逊封店潮),更多卖家选择自建独立站,2024年独立站占比已达35%。A…

maven的项目构建

常用构建命令 命令说明mvn clean清理编译结果(删掉target目录)mvn compile编译核心代码,生成target目录mvn test-compile编译测试代码,生成target目录mvn test执行测试方法mvn package打包,生成jar或war文件mvn insta…

定时任务和分布式任务框架

文章目录 一 Spring Task1.@Scheduled注解介绍2 基本用法(1)使用@EnableScheduling修饰启动类(2)创建定时任务的类(3)fixedDelay(4)fixedRate(5)cron3 执行多个任务4 设置异步执行5 @Async使用自定义线程池6 缺点二 xxl-job介绍架构图与其他任务调度平台的比较运行调…

git安装,配置SSH公钥(查看版本、安装路径,更新版本)git常用指令

目录 一、git下载安装 1、下载git 2、安装Git‌: 二、配置SSH公钥 三、查看安装路径、查看版本、更新版本 四、git常用指令 1、仓库初始化与管理 2、配置 3、工作区与暂存区管理 4、提交 5、分支管理 6、远程仓库管理 7、版本控制 8、其他高级操作 一…

[Web]ServletContext域(Application)

简介 Web应用的Application域的实现是通过ServletContext对象实现的。整个Web应用程序的所有资源共享这个域。生命周期与Web应用程序相同,即当前Web应用程序启动时(以服务器视角而非访客视角)出生,Web应用服务程序关闭时停止。 通…

qt c++ 进程和线程

在Qt C开发中,进程(Process)和线程(Thread)是两种不同的并发模型,各有适用场景和实现方式。以下是详细对比和实际开发中的用法总结: 一、进程(Process) 进程是操作系统资…

【鸿蒙开发】OpenHarmony调测工具hdc使用教程(设备开发者)

00. 目录 文章目录 00. 目录01. OpenHarmony概述02. hdc简介03. hdc获取04. option相关的命令05. 查询设备列表的命令06. 服务进程相关命令07. 网络相关的命令08. 文件相关的命令09. 应用相关的命令10. 调试相关的命令11. 常见问题12. 附录 01. OpenHarmony概述 OpenHarmony是…

手写简易Tomcat核心实现:深入理解Servlet容器原理

目录 一、Tomcat概况 1. tomcat全局图 2.项目结构概览 二、实现步骤详解 2.1 基础工具包(com.qcby.util) 2.1.1 ResponseUtil:HTTP响应生成工具 2.1.2 SearchClassUtil:类扫描工具 2.1.3 WebServlet:自定义注解…

【Java开发指南 | 第三十四篇】IDEA没有Java Enterprise——解决方法

读者可订阅专栏:Java开发指南 |【CSDN秋说】 文章目录 1、新建Java项目2、单击项目名,并连续按两次shift键3、在搜索栏搜索"添加框架支持"4、勾选Web应用程序5、最终界面6、添加Tomcat 1、新建Java项目 2、单击项目名,并连续按两次…

在MATLAB中实现PID控制仿真

在MATLAB中实现PID控制仿真可以通过代码编程或Simulink图形化建模两种方式完成。以下是两种方法的详细操作步骤和示例: 方法1:使用MATLAB脚本编程(基于控制系统工具箱) 步骤1:定义被控对象的数学模型 假设被控对象是…

Conda常用命令汇总

Conda 是一个流行的包管理器和环境管理工具,广泛应用于数据科学、机器学习等领域。它可以帮助我们管理 Python 包以及不同版本的环境,避免包冲突,提升项目的可复现性。以下是一些常用的 Conda 命令,涵盖环境创建、管理、包安装等常…

大数据实时分析:ClickHouse、Doris、TiDB 对比分析

1. 引言 在大数据分析领域,实时分析需求越来越重要。ClickHouse、Doris 和 TiDB 作为当前流行的实时分析数据库,各自针对不同的应用场景和数据特性进行了优化。本文将对比它们的核心架构、适用场景以及查询优化方法,帮助数据开发人员选择合适的工具。 2. 核心架构对比 2.…

蓝桥杯历年真题题解

1.轨道炮&#xff08;数学模拟&#xff09; #include <iostream> #include <map> using namespace std; const int N1010; int x[N],y[N],v[N]; char d[N]; int main() {int n;int ans-100;cin>>n;for(int i1;i<n;i)cin>>x[i]>>y[i]>>v…

Pytorch的一小步,昇腾芯片的一大步

Pytorch的一小步&#xff0c;昇腾芯片的一大步 相信在AI圈的人多多少少都看到了最近的信息&#xff1a;PyTorch最新2.1版本宣布支持华为昇腾芯片&#xff01; 1、 发生了什么事儿&#xff1f; 在2023年10月4日PyTorch 2.1版本的发布博客上&#xff0c;PyTorch介绍的beta版本…

嵌入式硬件篇---手柄控制控制麦克纳姆轮子

文章目录 前言1. 变量定义2. 摇杆死区设置3. 模式检查4. 摇杆数据处理4.1 右摇杆垂直值&#xff08;psx_buf[7]&#xff09;4.2 右摇杆水平值&#xff08;psx_buf[8]&#xff09;4.3 左摇杆水平值&#xff08;psx_buf[5]&#xff09;4.4 左摇杆垂直值&#xff08;psx_buf[6]&am…

阿里千问大模型(Qwen2.5-VL-7B-Instruct)部署

参考链接 知乎帖子 B站视频 huggingface 镜像网站&#xff08;不太全&#xff0c;比如 Qwen/Qwen2.5-VL-7B-Instruct就没有&#xff09; huggingface 5种下载方式汇总 通过huggingface-cli下载模型 不一样的部分是预训练权重的下载和demo 首先安装huggingface_hub pip insta…