成熟稳定、省钱好用的AI应用怎么开发?趣丸科技员工助手的技术实践

news/2025/10/22 18:18:27/文章来源:https://www.cnblogs.com/OBCE666/p/19158676

成熟稳定、省钱好用的AI应用怎么开发?趣丸科技员工助手的技术实践

作者:苏程辉,趣丸数据库负责人

如今,大模型推动各行各业加速智能化转型已广为人知。而在实际应用过程中,#大模型 对特定领域或私有数据的无知导致其难免存在“#幻觉” 问题,催生了企业对高效、精准的“记忆系统”的迫切需求。向量数据库作为连接大模型与海量非结构化数据的核心桥梁,以其强大的相似性检索能力,迅速成为构建新一代#AI应用(如智能问答、推荐系统、语义搜索等)的基础设施,直接决定了AI应用的智能高度与用户体验。本文分享趣丸科技定制化AI助手在选型底层数据库时,对比多款向量数据库后选择OceanBase的思路和经验。

业务需求:成熟稳定、省钱好用的AI应用

趣丸科技成立于2014年,是一家集兴趣社交、人工智能、电子竞技等技术于一体的创新型科技企业,1600+的员工中有50%为技术人员,软件著作权和专利近500项,成为了中国互联网综合实力百强企业、#广州互联网企业20强。

拥抱AI,降本增效

作为一家先进的科技企业,对新技术的态度是敞开怀抱。近两年,AI 技术的成熟和应用对趣丸内部各个部门产生了积极影响,趣丸希望借助 AI 提升效率,降低人力成本,尤其在数据库中间件的日常场景和运维监控场景。

日常场景对AI 的需求可归纳为四类:

  1. AI 慢日志优化。研发人员可直接与 AI 对话,由模型实时输出索引建议、重写方案及代价评估,无需再人工提单至 DBA 团队,SQL 优化效率大大提升。
  2. AI 数据库磁盘资源分析。系统需要每日采集库表级增量、TOP 排行及数据趋势,可直接借助 AI 完成,并结合业务特征预测容量峰值,提前触发归档或扩容建议,提升系统稳定性。
  3. AI 数据库连接分析。当连接数接近阈值时,AI 可以输出详细连接信息如业务来源,辅助快速定位异常业务。
  4. AI 数据库 CPU 告警分析。CPU 告警触发后,AI 可自动关联慢日志、执行计划及系统指标,生成根因分析报告,一线人员可根据报告直接执行优化或扩容,解决告警和资源问题。

在运维监控侧,计划将 AI 能力应用于以下两个方向:

  1. AI 数据库告警根因分析。一般情况下,告警会涉及多个场景,因此需要排查多个监控日志,借助 AI 可以快速定位问题,关联事务、I/O、慢查询等多维日志,输出根因结论,如大事务并发导致锁等待导致瞬时 I/O 飙升触发阻塞等,有效降低人工排障时长。
  2. AI OPS 告警治理。告警范围覆盖多种数据库,包括传统数据库 MySQL、PostgreSQL、PolarDB、GaussDB 等,消息中间件 Kafka、RocketMQ 等,告警量过多,纯人工无法闭环,通过引入 AI 进行智能化治理。

基于各部门的不同需求,公司面向员工推出统一的服务入口——员工助手。每位员工都需要拥有独立的私有助手,满足定制化需求。这对底层数据库又提出四项核心需求。

  1. 标量数据存储:需具备高性能、易扩展能力,以支撑高并发读写。
  2. 全文检索:支持全文检索。
  3. 向量存储与计算:支持向量数据的写入、索引及相似度查询。
  4. HTAP 能力:会话上下文数据永久保存,并可直接在库内进行实时分析,无需额外数据链路。

AI应用开发难点:无一理想数据库

在员工助手的开发过程中,数据库团队在调研 AI 应用的行业现状、开发难度和稳定性保障等,发现现实远比想象中更具挑战。

首先,目前行业内尚未出现一个成熟、开箱即用、可支撑 AI 应用快速开发的底层数据库。

其次,要满足多种需求,可能需要同时维护 MySQL(标量检索、支持 TP)、Elasticsearch(全文检索、向量检索)、VDB/Milvus(向量数据库),至少三套系统,大幅提升了引入成本和开发难度。

最后。每个组件的稳定性都需要单独保障,包括高可用、监控、备份及故障排查等,运维工作量大,定位链路长。

选型之路:对比三种向量数据库方案

基于业务快速落地与稳定性的双重要求,数据库团队优化了选型方案,核心诉求如下。

  • 标量数据:支持海量规模存储,并提供一致性与高可用保障。
  • 向量数据:具备高性能向量写入、索引构建与近似查询能力,满足毫秒级召回。
  • 开发接口:兼容标准 SQL,研发侧无需学习成本即可实现 AI 应用快速开发。
  • 总体成本:通过存储压缩、资源池化与统一运维,显著降低硬件与人力投入。

在该目标指引下,初步选定三套数据库方案,并进行对比。

方案一:MySQL + Elasticsearch+ Milvus/VDB

如上文所述,采用该方案需要维护三套独立系统,数据同步链路长,开发、测试与发布周期成倍增加。同时硬件投入与人力运维成本均高,不符合“低成本快速上线”目标。

方案二:TiDB+ ES

  • 需部署 PD、Server、KV 等多节点,部署成本较高;
  • 全文检索需额外引入 Elasticsearch,进一步推高成本;

此外,TiDB需手工或通过 TiUP 组件部署,自动化与平台化程度低于 OceanBase,运维便利性不足。

方案三:OceanBase

  • 具备原生 HTAP、高压缩、向量索引能力,单套集群即可同时满足标量、向量与全文检索需求;
  • 兼容 MySQL 协议,零学习成本;
  • 资源池化多租户,硬件利用率高,运维通过图形化平台完成,扩缩容全自动。

综合性能、兼容性、持久化、扩展性、成本、运维便利多个维度,最终选择 OceanBase 作为统一数据底座。主要出于五点原因:

  1. 高兼容性。高度兼容 MySQL 语法、SQL 原生支持向量查询,可帮助快速低成本实现业务的 AI 应用需求。
  2. 稳定可靠性。集群高可用能力强,可快速恢复,RTO<8s,系统稳定性得到保证。同时三副本架构下,每一个副本下都有一份完整的数据,数据无丢失风险。
  3. HTAP 能力。基于“同一份数据,同一个引擎”,同时支持在线实时交易及实时分析两种场景。
  4. 强扩展能力。节点扩容可以在分钟级别完成、容量扩容在秒级完成,具备丝滑高效的在线扩展能力。
  5. 文本的多路融合检索。OceanBase 的向量检索+全文检索的混合检索能力实现了对文本的多路融合检索,整个流程包括插入文本 (Chunk)、向量化(Embedding)、分词、向量检索、全文检索、重排序(Rerank)等步骤。

此外,在调研过程中,趣丸也发现 OceanBase 具备三个突出优势,也是其他方案不具备的能力。

一是OCP 运维平台提供图形化、自动化集群管理能力,显著降低日常运维复杂度,可实现一键扩缩容、监控告警、备份恢复、补丁升级及故障自愈等常用的运维操作。

二是副本级列存。在不增加额外组件的前提下,通过将其中一个副本以列式存储呈现,即可满足轻量级分析需求。

三是数据高压缩比。OceanBase 提供多级数据压缩能力,压缩率可达 3:1~5:1。虽然单 TB 磁盘单价较低,但当数据规模达到数十 TB 且用于长期归档时,高压缩特性可直接减少机器数量,形成可观的成本节约。

应用效果:三合一数据库底座满足多重需求

业务上线效果

目前基于 OceanBase 的员工助手已经上线,运行平稳,CPU使用率长期稳定在15%以下,抖动很小,整体平均响应时间满足业务的需求。

之所以该业务得以快速上线,关键在于开发效率提升、运维标准化、成本节省这三个方面。

提升开发效率: OceanBase 支持标量、向量、全文等混合检索,通过一条 SQL 即可解决复杂的多维查询需求,简化开发逻辑,降低编码复杂度。

运维标准化: OceanBase的迁移工具和运维平台方便易用,简化了部署与监控,可以快速上线,减少部署时间。

成本节省: 相较于三套数据库才能满足业务需求的方案,采用三合一的数据库底座,减少了资源的申请和审批流程,且大幅节省资源消耗。

OceanBase 测试注意事项

在上线OceanBase的过程中,运维团队遇到两个问题,可作为注意事项以提醒大家。

第一,OceanBase 的初始资源占用较高,在尝试验证生产环境所需的资源规格时,运维团队发现常规的资源配置如 8C16G,无法成功完成部署。尤其是在安装 OCP 等全套组件时,可能会存在资源不足的问题。因此,部署生产环境建议配置较高规格的资源如 8C32G。

第二,在性能测试中,运维团队在 OceanBase 中使用了业务中常用的租户配置,如 2C4G、4C8G,测试结果表明,在该配置下 OceanBase 的性能未能达到预期。建议使用较高规格的租户进行测试,避免产生性能不达标问题,同时也能对真实业务环境的性能表现有所把握。

对AI应用的底层数据库的期待

员工助手是趣丸内部面向员工使用的服务入口,后续将其接入其他 #AI产品 中。因此,对于AI应用的底层数据库 OceanBase,趣丸也有几点期待:

  1. 分布式迁移-自动分区。目前OceanBase 4.3.5版本已经支持自动分区能力,在测试环境迁移至生产环境过程中,针对大表,提供按规则自动分区功能,减少人工拆分与校验工作量。也希望在后续的业务场景尝试这种方式,减少开发、运维工作量。
  2. 共享存储。对于 I/O 敏感度较低的业务,希望引入共享存储方案,以提升存储资源利用率并简化扩容流程。
  3. 存储自动冷热分离。对于不常用的冷数据,希望存储到 OSS 等低成本介质中,并可以通过策略规则(如时间字段、访问频度)自动实现,降低存储成本。

最后为大家推荐这个 OceanBase 开源负责人老纪的公众号「老纪的技术唠嗑局」,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注!
「老纪的技术唠嗑局」不仅希望能持续给大家带来有价值的技术分享,也希望能和大家一起为开源社区贡献一份力量。如果你对 OceanBase 开源社区认可,点亮一颗小星星✨吧!你的每一个Star,都是我们努力的动力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/943628.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript 自定义元素类的作用域跨环境兼容管理

JavaScript 自定义元素类的作用域跨环境兼容管理 原创 夏群林 2025.10.22 自定义元素类,是为了后续复用,通常需要全局可见。 JavaScript 类名遵循标识符规范,可包含字母、数字、下划线(_)、美元符号($),且不能…

victoriamonitor监控gcp的cloudrun - Super

victoriamonitor监控gcp的cloudrun方案总览VictoriaMetrics 无法直接 scrape Cloud Run 的 /metrics,因为: Cloud Run 是动态实例,没有固定 IP; Cloud Run 实例按需启动/销毁; 没有暴露容器内部端口供 scraping。…

QT实现QTreeWidget项目拖拽移动功能

主要功能概述 允许用户在QTreeWidget内部拖拽项目 拖拽时显示确认对话框 程序环境Python 3.8.9 pyside6==6.1.3pip install pyside6==6.1.3实现效果demo代码获取 Gitee:treewidget-demo 百度网盘:https://pan.baidu.…

解决 Semi Design Upload 组件实现自定义压缩,上传文件后无法触发 onChange

背景 我们团队主要在做 C 端产品,对于 C 端应用,图片资源使用 CDN 十分重要,因此我们曾建立了一个文件上传平台:上传文件后,可以复制图片的 CDN URL 在前端项目中使用。 目前服务端不会对图片做压缩,使用前得先借…

实用指南:生活琐记(3)

实用指南:生活琐记(3)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", &q…

重构商业生态:全域分销商城小程序开发赋能商家高效增长 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

设计模式-建造者模式 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

自动化释放5G全部潜力:新西兰电信One NZ的实践之路

本文详细介绍了新西兰电信运营商One New Zealand如何通过自动化技术实现5G网络转型,包括容器化平台、GitOps自动化流程和AI驱动的运维框架,大幅提升部署效率和网络可靠性。电信行业正站在新时代的门槛上。随着5G网络…

实用指南:C++设计模式_创建型模式_原型模式Prototype

实用指南:C++设计模式_创建型模式_原型模式Prototype2025-10-22 18:06 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; di…

第二十一篇

今天是10月22号,上了离散和马原。

DEIMv2浅读

DEIMv2代表了实时目标检测领域的一次重大飞跃,它通过空间调谐适配器(STA)、双轨制骨干网络设计、高效解码器优化等创新技术,成功地将DINOv3强大的视觉表示能力引入到对计算资源敏感的实时检测任务中,在精度和效率的平…

阿里出手了:全免费!号称国内版ClaudeCode?

这两年编程的开发工具层出不穷,也是一片红海,前有 Claude、CodeX,后有 Code Buddy、Qwen、Qoder 等。那问题来了,有没有一款好用、且免费的编程工具呢? 那么今天给大家分享 3 款好用且免费的编程工具。 视频分享…

[MS-DOS]MS-DOS 6.22 with CD-ROM Driver.ver.6.22.English下载与安装

下载地址: https://archive.org/details/ms-dos-6.22-with-cd-rom-driver.ver.6.22.english MS-DOS 6.22 with CD-ROM Driver.ver.6.22.English安装视频: How to Install MS-DOS on VirtualBox https://www.youtube.…

2025 年国内品牌设计公司最新推荐排行榜:聚焦行业领军者优势,精选优质服务商深度解析

引言 在当前激烈的市场竞争中,品牌设计已成为企业塑造独特形象、提升核心竞争力的关键环节。然而,品牌设计行业乱象丛生,部分企业缺乏专业体系、过度追求短期利益,导致企业难以找到靠谱的合作伙伴。为帮助企业精准…

报考PostgreSQL中级认证证书多少钱?

近几年随着PostgreSQL数据库在国内的流行,考相关认证的人也多了起来,尤其是使用PostgreSQL数据库的企业,不少员工想了解一下关于PostgreSQL数据库认证的费用、时间、题型、难度等问题,这里做些收费方面的介绍。 首…

087_尚硅谷_switch使用细节(1)

087_尚硅谷_switch使用细节(1)1.swithc细节讨论 2.case和switch 后是一个表达式(即 常量值、变量、一个有返回值的函数等都可以) 3.1.case 后的各个表达式的值的数据类型, 必须和 switch 的表达式数据类型一致,否则程…

linux服务器操作系统字符集是GBK,tomcat和部署的程序是UTF-8,启动后应用界面乱码如何解决

当 Linux 系统编码为 GBK,而 Tomcat 使用 UTF-8 时,程序界面乱码的核心原因是编码 / 解码环节不统一(如 JVM 默认编码、请求响应编码、资源文件编码等不一致)。解决需从多个层面统一编码为 UTF-8,具体步骤如下: …

2025 年感温电缆厂家最新推荐权威榜单重磅发布,全方位解析头部品牌优势助力工业消防精准选型

在工业生产、城市基建等领域,火灾安全防护是保障生命财产安全的核心环节,而感温电缆作为火灾早期探测的关键设备,其品质与性能直接决定防护效果。当前感温电缆市场品牌繁杂,既有深耕多年的老牌企业,也有新兴入局者…

完整教程:2- 十大排序算法(希尔排序、计数排序、桶排序)

完整教程:2- 十大排序算法(希尔排序、计数排序、桶排序)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consol…

预测(笔记)

概念 利用历史数据,推断未来不确定因素的方法。这是基于:过去的规律,一定会在未来不断地发生。可以应用在销售数据、经济走势、产量范围、劳动力需求等。在项目PERT中,我们用均值、方差计算出某个时间完成的概率,…