深圳网站建设排行电子网站模板

pingmian/2026/1/26 3:48:28/文章来源:
深圳网站建设排行,电子网站模板,wordpress适应手机,php一般网站空间多大现在是北京时间2023年11月18日。聊一聊搜索。 说到搜索#xff0c;大家首先想到的肯定是谷歌#xff0c;百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了#xff0c;大家都认为Ai搜索是下一代的搜索。但是AI搜索#xff0c;需要的是很大算力大家首先想到的肯定是谷歌百度。我把这些定义成上一个时代的搜索引擎。ChatGPT已经火热了有一年的时间了大家都认为Ai搜索是下一代的搜索。但是AI搜索需要的是很大算力需要很大存储空间。至今为止又有多少个公司能够真的去做AI搜索呢普通的公司又能够做什么呢 ChatGPT是大模型它的数据总是停留在历史的某个时间点上目前来看它对新事物的了解还是很慢的并不能时时刻刻把新的内容加入到知识库中。未来在更强大的算力进步下或许会实现。但是我觉得下一代的搜索仍然需要和上一代的搜索结合。这会是一个漫长的过渡期。很显然大家也都是这么玩的。它叫做搜索增强。 上一代传统搜索 上一代的搜索引擎的关键是关键词匹配。这里还是以elasticsearch为例关键词匹配BM25相关性算法来决定数据的召回。这种基于关键词的匹配技术是存在很多弊端的它的召回能力效果也有限。大家更喜欢AI搜索这种模式通常AI搜索给的答案更接近问题本身。而在传统的搜索模式下通常就是问一个问题然后返回你几条数据然后再在这几条数据中人工获取答案。悲伤的是这几条数据里边未必有我们的结果。 传统搜索与大模型构造增强式搜索引擎 最简单的玩法就是把召回的结果给大模型然后由大模型总结整理一个答案。其实这个过程就是省去了使用者思考的过程。为使用者带来很大的便利性。这正是被更多人追捧的原因。最典型的就是bing的搜索。它就是这么玩的这样以来弥补了大模型的知识停留在历史的某个阶段的问题。 传统搜索的未来 除了上述的搜索增强我觉得下个时代的搜索还是会有很大变化空间的。有的公司在说神经搜索有的人在说语义检索还有人在说跨模态检索。总之大家都期望搜索能够有更强大的能力。推荐基于深度学习的神经语义搜索 - 智源社区 看看这篇文章详细了解神经搜索NLP模型 。 其实上述的搜索目标实现起来都是一种形式。大模型 向量通过大模型将各种模态的数据图片文本声音等等各种形式的内容映射成向量。但是下个时代的到来还有几个问题等待解决。第一个是算力问题把文本或者图片使用大模型转成向量需要算力这个过程是非常慢的。第二个是存储和检索问题这些转完的向量如何存储如何高效快速检索。因为通常文本内容例如一篇文章通常需要先进行分割按照行或者按照段落做切分然后再对切分后的内容使用模型转成向量。每个向量通常是一个512维度甚至更高维度的浮点型数组。这让原本的存储空间变得更大。所以存储是一个问题。除了存储的问题在向量中做检索通常是计算完成的。在海量数据中做检索已经很难了在限量中做计算需要的算力资源又是一个难题。我在一台128G内存96核心的服务器上使用elasticsearch做存储和检索亿级数据的检索性能已经是一个比较大的问题了。在千万级向量中检索是毫秒级别。 未来的搜索如何玩 想要做起来很容易。选取适合自己的模型可以在huggingFace上看一看。https://huggingface.co/models 首先先拿文本来说需要做文本嵌入寻找text-vex的模型这里推荐一个 可以看看。https://huggingface.co/moka-ai/m3e-base 假如想做多模态搜索又需要特定的模型。效果较好的例如Cliphttps://huggingface.co/openai/clip-vit-base-patch32  然后把转好的向量使用向量库存起来。这里我是用的elasticsearch 8.X版本。因为我本来就是做es搜索的对elasticsearch非常熟悉。其实也调研了非常多的向量数据库在大规模数据下es的读写性能都是非常出色的。至少单个节点去解决千万级别的向量数据的存储和检索还是很轻松的优化万了以后性能在毫秒级别。 跑起来总是很容易。想要有更好的效果却是不容易的。对于选模型来说是一个问题而且要经过大量的测试对比各个模型的效果才行。并且非常可能面临着模型不符合自己的使用场景的问题可能又要对模型进行微调。在huggingFace上模型非常多但是多数都是用英文语料训练的模型。往往不能够满足我们的需求。此外数据向量化的工程问题又要去写挺多的代码跑起来速度又不行又需要进行调优。关于数据转向量工程化的内容推荐一下Jina AI · GitHub。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/85644.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建设工程项目前期去哪个网站南昌哪里做网站

😀前言 本篇博文是关于Spring Boot(Vue3ElementPlusAxiosMyBatisPlusSpring Boot 前后端分离)【四】,希望你能够喜欢 🏠个人主页:晨犀主页 🧑个人简介:大家好,我是晨犀,希望我的文章…

浙江高端建设网站广州网站建设讯度

昨天才写了Rust的条件编译,没想到这个问题还没完。 昨天我还为它的强大而赞叹不已,自以为对它了解了八九成,然而今天我才猛然意识到,这个里面的深度远超我的想象。我估计,我现在只了解其中的冰山一角吧。 故事从客户端…

公司营销型网站开发服务号 wordpress

本小程序通过代码和注释,介绍了easyX窗口及控制台窗口的设置方法;还介绍了easyX中关于颜色、线型、画圆、画方、显示文字以及鼠标消息处理等函数的使用方法。为便于理解,本程序同时使用控制台和easyX窗口,由控制台控制程序运行、由…

南昌网站开发网页制作项目简介范文

Windows 恢复环境 (Windows RE) 是一个能修复无法启动操作系统的常见问题的恢复环境。Windows 预安装环境 (Windows PE) 是具有有限服务的最小 Win32 操作系统。Windows RE 建立在 Windows 预安装环境 (Windows PE) 的基础上,并且可以用附加的驱动程序、语言、Windo…

平面设计师常用的网站属于免费的网络营销方式

具有从属引用的 LDAP 分页查询未正确处理09/14/2020本文内容本文提供了一些方法来避免使用从属引用的 LDAP 分页查询未正确处理的问题。原始产品版本: Windows 8原始 KB 编号: 2561166症状你有一个应用程序,使用 ldap_search_ext 或 ldap…

吴桥做网站新版wordpress编辑器不好用

redis:一个key-value系统 Redis 与其他 key - value 缓存产品相比有以下三个特点: Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据,同时还提…

头像生成器在线制作软件关键词推广优化

从扑克牌中随机抽5张牌,判断是不是一个顺子,即这5张牌是不是连续的。2~10为数字本身,A为1,J为11,Q为12,K为13,而大、小王为 0 ,可以看成任意数字。A 不能视为 14。 示例 …

网站地图链接怎么做中国建设招标网?官方网站

聊城市2021年中考查分时间大约是6月27日。各普通高中要于7月10日前在校内张榜公布录取考生名单,并签发录取通知书。聊城中考录取时间各普通高中要于7月10日前在校内张榜公布录取考生名单,并签发录取通知书。所有学校均不得违规招收已被其他学校录取的考生…

有哪些做的比较精美的网站网站开发语言p

文章目录 模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八案例九案例十 下载地址 模型介绍 目前还没有一个好的皮克斯迪士尼风格的卡通模型,所以我决定自己制作一个。这是将皮克斯风格模型与我自己的Loras合并在一起,创建一个通用的…

永久免费做网站appwordpress万能主题

PS:在"[ ]"中的所有数据都是可修改的 添加表字段 ALTER TABLE [表名] add [添加的新字段名] [添加新的数据类型] COMMENT [昵称] alter:修改(后面一般加table表示修改表) add:添加一个字段 在这个里面c…

电子商务网站建设与维护期末答案专业做轮胎的网站

介绍 当我们使用虚拟网卡的时候,有时候需要为虚拟网卡配置随机的MAC地址。我们知道,网卡的MAC地址实际上是一个6字节的整型数,通常表现为用英文冒号(:)隔开的十六进制字符串(全部大写或者全部小写&#xf…

扶贫工作网站建设方案pageadmin模板

用户级别配置文件 ~/.vimrc 修改用户级别的配置文件只会影响当前用户, 不会影响其他的用户. 例如: 在用户的家目录下的.vimrc文件中添加 set tabstop4 ----设置缩进4个空格 set nu ----设置行号 set shiftwidth4 —设置ggG缩进4个空格, 默认是缩进8个空格 系统级别配置文件 /e…

深圳网站设计公司电wordpress拼团程序

二叉树进阶题目 606. 根据二叉树创建字符串解题思路及实现 102. 二叉树的层序遍历解题思路及实现 107. 二叉树的层序遍历 II解题思路及实现 606. 根据二叉树创建字符串 描述 给你二叉树的根节点 root ,请你采用前序遍历的方式,将二叉树转化为一个由括号…

邯郸网站建设设计可以做外国网站文章

雪花算法(Snowflake ID)是 Twitter 开源的一种分布式 ID 生成算法,其目的是生成全局唯一的 ID。该算法的核心思想是将一个 64 位的二进制数字分成几个部分,每个部分表示不同的信息,例如数据中心ID、机器ID、序列号等。…

做公司网站的理念wordpress爆破

前言 在eclipse中有Workspace(工作空间)和 Project(工程)的概念在 IDEA中只有 Project(工程)和 Module(模块)的概念。这个地方刚开始用的时候会很容易理不清它们之间的关系。在eclip…

功能型网站制作多少钱网站建设行业产业链分析

迄今为止,看到的函数中,卷积的操作发生在OpenCV函数的内部。理论上,图像卷积就是将内核与图像覆盖区域对应位置相乘之后求和。从调用函数上来看,它需要一个数组参数来描述内核。在实践层面,有一个重要的微妙因素会对结…

绍兴做微网站北京那家建网站好

好电脑、好主板、好网卡、好运营商、好套餐,是不是就意味着有了极好的网络体验呢?对,但也未必。因为还少算了最后一道关卡——网线。▌线材网线这个东西,看着还真都差不多,插上就能用这能有什么差别呢?首先…

中国互联网数据平台官网网站优化3个关键词和10个关键词的区别

文章目录 Java 企业级支柱Java 在企业级应用中的地位后端开发的支柱Java生态系统的强大 前端:蓬勃发展的创新引擎新技术的涌现用户体验的重要性 Java的演进与创新云原生时代的 Java开发效率和生态系统 前端技术的未来走向WebAssembly 的崛起可访问性和国际化的重要性…

营销网站建设哪家快做音乐网站要求

下面是我给大家整理的利用JS使用POST方式提交请求的方法,有兴趣的同学可以去看看。一般都是写上隐藏的form标签,用来调用js函数然后submit全部用js来写也行,以下是我在一个问答频道看见别人写的例子,放在这里function post(URL, P…

揭阳网站制作软件网络营销与策划ppt

1 处理过程可视化 原始数据 直通滤波过滤后 pcl::ProjectInliers结果 pcl::ExtractIndices结果 凹包结果 凸包结果 2 处理过程分析: 原始点云 ---> 直通滤波 --> pcl::SACSegmentation分割出平面 -->pcl::ProjectInliers投影 --> pcl::ConcaveHull凹包…