Google 在 MySQL 中推进矢量搜索,在 LLM 支持方面超越 Oracle

谷歌已将向量搜索引入其 MySQL 数据库服务,这一步领先了 MySQL 的所属公司 Oracle,迄今为止,Oracle 尚未给 MySQL 添加任何大型语言模型(LLM)方面的功能。

谷歌云数据库副总裁安迪·古特曼斯 (Andi Gutmans) 表示,在过去 12 年里,谷歌在向量方面的创新速度相当快。目前,在多个 Google Cloud 数据库中提供向量搜索预览版,包括 Cloud SQL for MySQL、Memorystore for Redis 以及 Google 的分布式数据库管理和存储服务 Spanner。

向量是 LLM 的基本元素,自 2022 年 ChatGPT 推出以来,LLM 已成为大型科技公司、政府和媒体的关注焦点。LLM 依赖于单词或语言的其他组成部分,根据其与其他语言的统计相似性将其表示为向量嵌入。Google 支持 Word2Vec,这是一种 2013 年推出的自然语言处理技术,尽管它已被法学硕士采用的转换器架构所取代。

开源数据库服务公司 Percona 的技术传播者 Dave Stokes 表示,Oracle 工程部门近期没有计划向 MySQL 支持向量类的功能。

“可悲的是,Oracle 似乎将所有资源投入到 HeatWave 中,同时为社区版做了绝对最低限度的资源,”他说。“这将使得 MySQL 进一步落后于 PostgreSQL 和新的向量数据库等。社区版普遍缺乏新特性和功能,而将 JavaScript 和向量嵌入到商业版本中,这将使社区客户寻求其他替代方案,例如 Google 提供的产品”。

不过,谷歌并不是唯一一家将向量搜索添加到 MySQL 服务的供应商。PlanetScale 是基于 MySQL/Vitesse 的分布式事务系统,于去年 10 月宣布了这一新功能。

Redis 是一种流行的内存数据库,通常用作缓存和系统代理,也已经在发布的版本中支持向量搜索。

分布式文档数据库 Couchbase 在 DBaaS Capella 和 Couchbase Enterprise Edition 中引入了向量搜索作为新功能。Couchbase 产品管理和业务运营高级副总裁 Scott Anderson 表示,向平台添加向量搜索是“使我们的客户能够构建新一波自适应应用程序”的下一步。

去年,Oracle数据库、Cassandra、MongoDB、PostgreSQL 和 SingleStore 在其数据库系统中增加了对向量搜索的支持,而像 Pinecone 这样的专业向量数据库也如雨后春笋般涌现,以支持计算趋势。

Forrester Research 副总裁兼首席分析师 Noel Yuhanna 表示,向量搜索现在或多或少已经成为任何专业企业数据库的标准。

“那些没有它的企业可能会看到对其增长的影响。根据我们的研究,大约 35% 的企业正在考虑向量数据库,预计在未来 18 个月内将增长到 50%,”他说。

他表示,向量搜索对于生成式人工智能应用程序变得至关重要,可以帮助寻找类似的数据、图像和文档,以及客户智能、欺诈检测、聊天机器人和内容个性化等新兴应用程序。

Yuhanna 说,虽然专业向量数据库有其优势,但集成数据库为组织提供了更多背景和更丰富的数据体验。“没有哪家供应商能脱颖而出,因为向量功能仍在不断发展,而且许多供应商尚未展现出高端规模。”

然而,目前只有约 22% 的组织正在为其数据库考虑 LLM/GenAI 战略,尽管 Forrester 预计这一数字在未来两到三年内会翻一番。Yuhanna 表示:“我们看到的大部分需求是希望利用向量进行新部署的新 GenAI 应用程序;要使现有数据库转向向量,我们至少需要几年时间。”

谷歌还试图让自己的 GenAI 模型更接近其分析环境。谷歌表示,它正在通过 Vertex AI 为 BigQuery(其数据仓库系统)的用户提供 Gemini。与 AI 和 ML 平台的新集成旨在帮助数据工程师和分析师使用 Gemini 模型为其 BigQuery 数据提供多模式和高级推理功能。

Yuhanna 表示,将 Vertex AI、BigQuery 和 BigLake 更紧密地结合在一起不仅可以帮助组织避免数据移动,还可以帮助提供见解、改善数据治理和安全性、删除冗余数据,并通过最大限度地减少管理要求来降低成本。

他表示,企业将非结构化数据与结构化 BI 风格数据合并为所谓的 Lakehouse 概念是趋势的一部分,目前约有四分之一的企业采用这种概念,以降低成本并运行 BI、数据科学、AI/ML、运营单一平台上的见解和 SQL 分析。

更多技术文章,请访问:https://opensource.actionsky.com/

关于 SQLE

SQLE 是一款全方位的 SQL 质量管理平台,覆盖开发至生产环境的 SQL 审核和管理。支持主流的开源、商业、国产数据库,为开发和运维提供流程自动化能力,提升上线效率,提高数据质量。

SQLE 获取

类型地址
版本库https://github.com/actiontech/sqle
文档https://actiontech.github.io/sqle-docs/
发布信息https://github.com/actiontech/sqle/releases
数据审核插件开发文档https://actiontech.github.io/sqle-docs/docs/dev-manual/plugins/howtouse

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/739158.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

el-form表单中,对非表单内字段增加校验的方法

1、问题说明: 在开发表单的时候,可能会遇到el-form-item中绑定的值不在表单绑定的数据对象中。 此时用prop绑定该字段名是无效的,需要单独对这个字段进行校验。 在el-form-item中有一个属性 error 。用于表单域验证错误信息,设…

Java SE入门及基础(37)

Object 类常用方法 Object类中定义的方法大多数都是属于 native 方法, native 表示的是本地方法,实现方式是在 C 中。 1. getClass() public final Class getClass () //The getClass() method returns a Class object, which has methods you can…

【算法】KY67 整数奇偶排序

描述 输入10个整数,彼此以空格分隔。重新排序以后输出(也按空格分隔),要求: 1.先输出其中的奇数,并按从大到小排列; 2.然后输出其中的偶数,并按从小到大排列。 输入描述: 任意排序的10个整数(0~100&#x…

灰度发布难以追踪?你可能用错了工具

灰度发布进行可观测性的主要方式是通过收集和分析用户在使用新版本产品或服务时的数据,以此来评估新版本的性能、稳定性和用户满意度。这个过程通常包括以下几个步骤: 定义观测指标:首先,需要定义一套合适的观测指标(…

Java Day7 常用API

文章目录 1、Arrays1.1 简述1.2 如何比较对象数组1.2.1 方法1.1.2.2 方式2 2、Lambda3、方法引用3.1 静态方法的引用3.2 实例方法引用3.3 特定类型方法引用3.4 构造器引用 1、Arrays 1.1 简述 操作数组的一个工具类 常见方法 int[] arr{10,20,30,50,40};//将 数组的内容 组…

彩色gif闪图怎么做?分享gif动画的方法

在现在的媒体时代,动态图片已经成为了最流行的分享信息的方式。能够传达动态的视觉效果。那种带有动态效果的闪动文字图片要怎么制作呢?很简单,通过使用在线制作闪字图片工具,上传多张文字内容相同,颜色、位置不同的jp…

【网络原理】使用Java基于TCP搭建简单客户端与服务器通信

目录 🎄API介绍🌸ServerSocket API🌸Socket API 🍀TCP中的长短连接🌳建立TCP回显客户端与服务器🌸TCP搭建服务器🌸TCP搭建客户端 ⭕总结 TCP服务器与客户端的搭建需要借助以下API 🎄…

C语言函数—库函数

函数是什么? 数学中我们常见到函数的概念。但是你了解C语言中的函数吗? 维基百科中对函数的定义:子程序 在计算机科学中,子程序(英语:Subroutine, procedure, function, routine, method, subprogram, ca…

VSCode调试C++项目时无法显示长字符串的所有内容

记录一次失败的尝试,参考解决vs code 调试golang时字符串显示不全的问题。_golang gin buf数据不全-CSDN博客 但是笔者当前使用的VSCode版本不支持在launch.json中添加dlvLoadConfig选项 笔者的思路是如果VSCode不支持,那就下降到下一层,VSC…

c++初阶------类和对象(下)

作者前言 🎂 ✨✨✨✨✨✨🍧🍧🍧🍧🍧🍧🍧🎂 ​🎂 作者介绍: 🎂🎂 🎂 🎉🎉&#x1f389…

判断、v-if判断显示隐藏,功能区循环案例。

判断条件 1.第一种 如果身份是管理员 &#xff0c; 那么全部显示 如果身份是员工 &#xff0c;那么除了value等于1的全部都显示 v-if"( user.state.level admin) || ( user.state.level staff && item.value ! 1)"<view class"funcBox">&…

Solidity Uniswap V2 factory contract

factory contract 工厂合约是所有已部署pair合约的注册表。我们不希望出现相同的pair&#xff0c;这样流动性就不会被分割成多个。factory合约还简化了pair合约的部署&#xff1a;无需手动部署pair合约&#xff0c;只需调用factory合约中的方法即可。 https://github.com/XuHug…

马斯克将在本周,开源类ChatGPT产品Grok

3月11日晚&#xff0c;马斯克在社交平台宣布&#xff0c;将在本周开源生成式AI产品——Grok。 Grok是马斯克旗下公司xAI在去年11月发布的&#xff0c;一款类ChatGPT产品&#xff0c;可以提供生成文本、代码、邮件、信息检索等功能。其测试性能超过GPT-3.5、LLaMA 2 70B&#x…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的铁轨缺陷检测系统(Python+PySide6界面+训练代码)

摘要&#xff1a;开发铁轨缺陷检测系统对于物流行业、制造业具有重要作用。本篇博客详细介绍了如何运用深度学习构建一个铁轨缺陷检测系统&#xff0c;并提供了完整的实现代码。该系统基于强大的YOLOv8算法&#xff0c;并对比了YOLOv7、YOLOv6、YOLOv5&#xff0c;展示了不同模…

Linux运维:深入了解 Linux 目录结构

Linux运维&#xff1a;深入了解 Linux 目录结构 一、 Linux 目录结构与 Windows之间的主要区别二、Linux根目录结构三、常见目录及其作用 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 一、 Linux 目录结构与 Windows之间的主要区别 1、根…

2024年备考软考,别犯这些常见错误!

距离2024年上半年软考正式考试还剩不到八十天的时间&#xff0c;留给考生的备考时间越来越少&#xff0c;因此大家在学习时要避免犯一些常见错误&#xff0c;尽量不浪费宝贵的学习时间&#xff0c;科学备考。 误区一&#xff1a;不制定学习计划 不制定学习计划意味着缺乏系统…

Kafka常见使用问题

消息丢失 生产者方&#xff1a;设置ack为1或-1/all可以防止生产的消息丢失&#xff0c;如果要做到生产消息成功率提高到最高&#xff0c;ack设置成all&#xff0c;把min.insync.replicas配置成分区备份数&#xff0c;把ack设置成1或者-1/all&#xff0c;这样生产者生产的消息发…

vivado clock ip核的使用

clock 偶数倍分频就是进行计数器计数&#xff0c;奇数倍分频如果不要求占空比的话也是进行计数&#xff0c;如果要求0.5的占空比的话&#xff0c;则需要进行两个计数器&#xff0c; 对于实现占空比为50%的N倍奇数分频&#xff0c;我们可以分解为两个通道&#xff1a; 上升沿触…

数据拯救指南:解决文件或目录损坏且无法读取的终极策略

在日常的计算机使用中&#xff0c;我们经常会遇到文件或目录损坏且无法读取的困扰。当这类问题发生时&#xff0c;无论是重要的文档、照片还是视频文件&#xff0c;都可能会变得无法访问&#xff0c;给我们的工作和生活带来极大的不便。面对这种情况&#xff0c;我们首先需要了…

落地灯哪个牌子好?五款品质可靠的落地灯,各具亮点

近年来&#xff0c;落地灯作为最适合目前用眼人群使用的照明电器&#xff0c;以显著的照明效果获得了广泛认可&#xff0c;并成为众多学生党、上班族用眼时的必备工具。其受欢迎的程度不断攀升&#xff0c;促使越来越多的人都选择入手落地灯。然而&#xff0c;我发现市场上也有…