谷歌DeepMind发布BlockRank:一种可能重塑搜索的全新排名范式

在信息检索领域,一场旷日持久的“战争”始终存在于效率精准之间。

传统的关键词搜索速度飞快,但难以真正理解语言的细微差别。

而先进的语义搜索虽然能够深刻洞察用户的真实意图,但其巨大的计算成本,使其成为了少数科技巨头才能玩得转的昂贵功能。

现在,一篇来自谷歌DeepMind的最新研究论文,提出了一种名为BlockRank的全新AI搜索排名算法

它的出现,不仅有望打破这一僵局,研究人员甚至在结论中宣称,它能够将强大的信息发现工具,民主化地提供给更广泛的用户。

核心突破:上下文排名(ICR)

要理解BlockRank的革命性,我们必须首先理解“上下文排名”(ICR)这一革命性的概念。

传统的搜索引擎,无论是基于关键词还是语义,都是在一个“离线”的状态下,对海量的网页进行预处理和索引,然后再根据用户的查询,从这个索引中找出并排序结果。

而ICR则完全不同。它利用了大语言模型最擅长的能力来理解上下文。

ICR的工作方式,更像与AI进行实时对话。

它会向大语言模型提供一个包含了用户查询和一系列候选网页的提示词,随后其会根据大语言模型的实时对话中,对这些网页进行实时的评估和排序。

这种方法,使得排名决策不再仅仅依赖于预先计算好的相关性分数,而是能够动态地、在丰富的上下文中,理解每个网页的真正价值和细微差别。

BlockRank的诞生:源于对AI“注意力”的洞察

研究人员并非凭空创造了BlockRank。

它的诞生,源于对LLM在执行上下文检索任务时,其内部的“注意力机制”是如何运作的。

其中,有两种关键的行为模式:

1、文档间块的稀疏性

当LLM在处理多个文档时,它并不会对所有文档都给予同等的关注。

相反,它的注意力会高度集中在少数几个(通常是一到两个)最相关的文档上。

2、查询-文档块相关性

在审视单个文档时,LLM的注意力同样不是均匀分布的。

它会精准地聚焦于文档内部那些与用户查询最直接相关的“块”或段落上。

基于这两个关键发现,研究人员意识到,他们可以设计一个更高效的系统,这个系统不再需要让LLM去处理整个冗长的文档,而只需要让它专注于那些最关键的内容块之上即可。

这就是BlockRank的核心思想。

性能验证:在三大基准测试中表现卓越

为了验证BlockRank的真实能力,研究人员在三个主流的、用于衡量搜索和排名算法性能的基准测试集上,对其进行了严格的测试。

这三个文档排名效果的测试基准分别是:

  • BEIR

  • MS MARCO

  • Natural Questions (NQ)

谷歌将BlockRank与其他强大的排名模型进行了比较,包括 FIRST、RankZephyr、RankVicuna。

BlockRank在这三个基准测试上的表现与这些系统一样好甚至更优秀。

更重要的是,它在保持高精准度的同时,显著提升了效率。

谷歌是否会采用BlockRank?

尽管BlockRank是在谷歌DeepMind内部开发的,但这并不意味着它会被直接、完整地整合进谷歌的主搜索引擎中。

谷歌的搜索引擎是一个极其庞大和复杂的系统,任何改动都需要经过漫长而谨慎的测试。

更有可能发生的是,BlockRank背后的核心理念和技术组件,可能会被逐步地、模块化地融入到谷歌现有的排名系统中。

例如,其高效的“块”分析能力,就可能被用来改进谷歌现有的各种排名摘要系统。

BlockRank的真正价值,或许不在于它是否会成为谷歌的下一个“官方排名算法”。

而在于它为整个信息检索领域,指明了一条全新的、更高效,也更民主式的发展道路。

*本文观点源于SEJ,仅提供内容分享与参考作用

https://www.searchenginejournal.com/google-blockrank/559074/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1121168.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ACME协议自动化证书管理:从手动配置到智能续期的技术演进

ACME协议自动化证书管理:从手动配置到智能续期的技术演进 【免费下载链接】acme-tiny A tiny script to issue and renew TLS certs from Lets Encrypt 项目地址: https://gitcode.com/gh_mirrors/ac/acme-tiny 在当今互联网安全日益重要的背景下&#xff0c…

Obsidian网页剪藏:构建个人知识管理系统的核心技术

Obsidian网页剪藏:构建个人知识管理系统的核心技术 【免费下载链接】obsidian-clipper Highlight and capture the web in your favorite browser. The official Web Clipper extension for Obsidian. 项目地址: https://gitcode.com/gh_mirrors/obsidia/obsidian…

3分钟快速搭建免费AI数据分析Web应用:告别Excel公式烦恼!

3分钟快速搭建免费AI数据分析Web应用:告别Excel公式烦恼! 【免费下载链接】pandas-ai 该项目扩展了Pandas库的功能,添加了一些面向机器学习和人工智能的数据处理方法,方便AI工程师利用Pandas进行更高效的数据准备和分析。 项目地…

开源项目合规风险实战手册:从案例剖析到安全架构设计

开源项目合规风险实战手册:从案例剖析到安全架构设计 【免费下载链接】chatlog 项目地址: https://gitcode.com/gh_mirrors/chat/chatlog 当chatlog项目因合规问题突然消失在开发者视野中,整个技术圈都在思考:下一个会是谁&#xff1…

LoRA训练终极指南:从零基础到高效部署的完整攻略

LoRA训练终极指南:从零基础到高效部署的完整攻略 【免费下载链接】LoRA_Easy_Training_Scripts A UI made in Pyside6 to make training LoRA/LoCon and other LoRA type models in sd-scripts easy 项目地址: https://gitcode.com/gh_mirrors/lo/LoRA_Easy_Train…

Whisper-CTranslate2完整指南:4倍速语音转文字技术详解

Whisper-CTranslate2完整指南:4倍速语音转文字技术详解 【免费下载链接】whisper-ctranslate2 Whisper command line client compatible with original OpenAI client based on CTranslate2. 项目地址: https://gitcode.com/gh_mirrors/wh/whisper-ctranslate2 …

paopao-ce插件化架构终极指南:配置驱动开发实战解析

paopao-ce插件化架构终极指南:配置驱动开发实战解析 【免费下载链接】paopao-ce rocboss/paopao-ce 是一个基于 Go 语言的轻量级博客系统。适合在 Go 语言开发的 Web 应用中使用,创建个人博客和简单的内容管理系统。特点是提供了简洁的界面、易于使用的 …

Google VR SDK终极指南:从零开始构建Android虚拟现实应用

Google VR SDK终极指南:从零开始构建Android虚拟现实应用 【免费下载链接】gvr-android-sdk 项目地址: https://gitcode.com/gh_mirrors/gv/gvr-android-sdk Google VR SDK是Google为Android平台提供的专业级虚拟现实开发工具包,支持Cardboard和…

Unity Script Collection完整指南:免费脚本资源库实用解析

Unity Script Collection完整指南:免费脚本资源库实用解析 【免费下载链接】Unity-Script-Collection A maintained collection of useful & free unity scripts / librarys / plugins and extensions 项目地址: https://gitcode.com/gh_mirrors/un/Unity-Scr…

XHook终极指南:轻松掌控AJAX请求与响应的拦截修改

XHook终极指南:轻松掌控AJAX请求与响应的拦截修改 【免费下载链接】xhook Easily intercept and modify XHR request and response 项目地址: https://gitcode.com/gh_mirrors/xho/xhook 你是否曾经遇到过这样的困境:想要在AJAX请求中添加认证头信…

CD音乐数字化终极指南:从光盘提取到智能管理完整教程

CD音乐数字化终极指南:从光盘提取到智能管理完整教程 【免费下载链接】foobox-cn DUI 配置 for foobar2000 项目地址: https://gitcode.com/GitHub_Trending/fo/foobox-cn 您是否还在为堆积如山的CD光盘而烦恼?那些承载着青春回忆的音乐光盘&…

长文本训练不再难:Flash-Attention 3 + Ulysses序列并行技术实测

长文本训练不再难:Flash-Attention 3 Ulysses序列并行技术实测 在大模型时代,谁能处理更长的上下文,谁就更接近“真正理解”文本。从 Qwen3 到 Llama4,再到 InternLM3,主流模型纷纷将最大上下文长度推至 32K、64K 甚至…

AI如何让虚拟人动作更自然?腾讯MimicMotion给出答案

AI如何让虚拟人动作更自然?腾讯MimicMotion给出答案 【免费下载链接】MimicMotion MimicMotion是腾讯开源的高质量人体动作视频生成模型,基于Stable Video Diffusion优化,通过置信度感知姿态引导技术,精准还原自然流畅的人体动态&…

艾尔登法环存档修改器:3分钟学会游戏角色完美定制

艾尔登法环存档修改器:3分钟学会游戏角色完美定制 【免费下载链接】ER-Save-Editor Elden Ring Save Editor. Compatible with PC and Playstation saves. 项目地址: https://gitcode.com/GitHub_Trending/er/ER-Save-Editor 艾尔登法环存档编辑器是一款专为…

探索现实世界中的OCaml:从入门到精通的完整指南

探索现实世界中的OCaml:从入门到精通的完整指南 【免费下载链接】book V2 of Real World OCaml 项目地址: https://gitcode.com/gh_mirrors/book9/book 想要掌握功能强大的OCaml编程语言吗?《Real World OCaml》第二版为你提供了从零基础到高级应…

graphql-go自定义标量类型完整开发指南

graphql-go自定义标量类型完整开发指南 【免费下载链接】graphql-go GraphQL server with a focus on ease of use 项目地址: https://gitcode.com/gh_mirrors/gr/graphql-go GraphQL作为现代API开发的主流选择,其强大的类型系统为数据交互提供了灵活性和类型…

终极SASM指南:简单快速的跨平台汇编语言IDE

终极SASM指南:简单快速的跨平台汇编语言IDE 【免费下载链接】SASM SASM - simple crossplatform IDE for NASM, MASM, GAS and FASM assembly languages 项目地址: https://gitcode.com/gh_mirrors/sa/SASM 在当今编程教育和技术开发领域,SASM作为…

OpenCode:重新定义终端AI编程体验的完整指南

OpenCode:重新定义终端AI编程体验的完整指南 【免费下载链接】opencode 一个专为终端打造的开源AI编程助手,模型灵活可选,可远程驱动。 项目地址: https://gitcode.com/GitHub_Trending/openc/opencode 在当今快速发展的AI编程领域&am…

5分钟搭建百度指数监控系统!这款Python神器让关键词分析效率提升300%

5分钟搭建百度指数监控系统!这款Python神器让关键词分析效率提升300% 【免费下载链接】spider-BaiduIndex data sdk for baidu Index 项目地址: https://gitcode.com/gh_mirrors/sp/spider-BaiduIndex 还在为获取百度指数数据而烦恼吗?每天手动查…

船舶轨迹预测终极指南:基于Transformer的高效方案解析

船舶轨迹预测终极指南:基于Transformer的高效方案解析 【免费下载链接】TrAISformer Pytorch implementation of TrAISformer---A generative transformer for AIS trajectory prediction (https://arxiv.org/abs/2109.03958). 项目地址: https://gitcode.com/gh_…