简述上课网站建设所用的技术架构app如何推广以及推广渠道

web/2025/10/5 7:18:11/文章来源:
简述上课网站建设所用的技术架构,app如何推广以及推广渠道,女程序员可以干到多少岁,如何开网店0基础教程在自然语言处理领域#xff0c;有一个常见且重要的任务就是文本相似度搜索。文本相似度搜索是指根据用户输入的一段文本#xff0c;从数据库中找出与之最相似或最相关的一段或多段文本。它可以应用在很多场景中#xff0c;例如问答系统、推荐系统、搜索引擎等。 比如#…在自然语言处理领域有一个常见且重要的任务就是文本相似度搜索。文本相似度搜索是指根据用户输入的一段文本从数据库中找出与之最相似或最相关的一段或多段文本。它可以应用在很多场景中例如问答系统、推荐系统、搜索引擎等。 比如当用户在知乎上提出一个问题时系统就可以从知乎上已有的回答中找出与该问题最匹配或最有价值的回答并展示给用户。 要实现类似高效的搜索我们需要使用一些特殊的数据结构和算法。其中向量相似度搜索是一种在大规模数据搜索中表现优秀的算法。而Redis作为一种高性能的键值数据库也可以帮助我们实现向量相似度搜索。 在开始学习如何使用Redis实现向量相似度搜索之前需要了解向量及向量相似度搜索的基本知识和原理以便更好地理解后面的内容。 什么是向量 向量是数学、物理学和工程科学等多个自然科学中的基本概念它是一个具有方向和长度的量用于描述问题如空间几何、力学、信号处理等。在计算机科学中向量被用于表示数据如文本、图像或音频。此外向量还代表AI模型对文本、图像、音频、视频等非结构化数据的印象。 向量相似度搜索的基本原理 向量相似度搜索的基本原理是通过将数据集中的每个元素映射为向量并使用特定相似度计算算法如基于余弦相似度的、基于欧氏相似度或基于Jaccard相似度等算法找到与查询向量最相似的向量。 Redis实现向量相似度搜索 了解原理后我们开始来实现如何使用Redis实现向量相似度搜索。Redis允许我们在FT.SEARCH命令中使用向量相似度查询。使我们可以加载、索引和查询作为Redis哈希或JSON文档中字段存储的向量。 //相关文档地址 Vector similarity | Redis 1、Redis Search安装 关于Redis Search的安装和使用此处不再赘述如果您对此不熟悉可以参考上一篇文章 C#Redis Search如何用Redis实现高性能全文搜索 2、创建向量索引库 这里我们使用NRedisStack和StackExchange.Redis两个库来与Redis进行交互操作。 //创建一个Redis连接 static ConnectionMultiplexer mux ConnectionMultiplexer.Connect(localhost); //获取一个Redis数据库 static IDatabase db mux.GetDatabase(); //创建一个RediSearch客户端 static SearchCommands ft new SearchCommands(db, null); 在进行向量搜索之前首先需要定义并创建索引并指定相似性算法。 public static async Task CreateIndexAsync() {await ft.CreateAsync(indexName,new FTCreateParams().On(IndexDataType.HASH).Prefix(prefix),new Schema().AddTagField(tag).AddTextField(content).AddVectorField(vector,VectorField.VectorAlgo.HNSW,new Dictionarystring, object(){[TYPE] FLOAT32,[DIM] 2,[DISTANCE_METRIC] COSINE})); } 这段代码的意思是 使用了一个异步方法 ft.CreateAsync 来创建索引。它接受三个参数索引名称 indexName一个 FTCreateParams 对象和一个 Schema 对象FTCreateParams 类提供了一些参数选项用于指定索引的参数。这里使用 .On(IndexDataType.HASH)  方法来指定索引数据类型为哈希并使用 .Prefix(prefix)  方法来指定索引数据的前缀Schema 类用于定义索引中的字段和字段类型。这里定义了一个标签字段tag field用于区分过虑数据。定义了一个文本字段text field用于存储原始数据以及一个向量字段vector field用于存储经原始数据转化后的向量数据使用了 VectorField.VectorAlgo.HNSW 来指定向量算法为 HNSWHierarchical Navigable Small World。还传递了一个字典对象用于设置向量字段的参数。其中键为字符串类型值为对象类型。 目前Redis支持两种相似度算法 HNSW分层导航小世界算法使用小世界网络构建索引具有快速查询速度和小内存占用时间复杂度为O(logn)适用于大规模索引。 FLAT暴力算法它对所有的键值对进行扫描然后根据键值对的距离计算出最短路径时间复杂度为O(n)其中n是键值对的数量。这种算法时间复杂度非常高只适用于小规模的索引。 3、添加向量到索引库 索引创建后我们将数据添加到索引中。 public async Task SetAsync(string docId, string prefix, string tag, string content, float[] vector) {await db.HashSetAsync(${prefix}{docId}, new HashEntry[] {new HashEntry (tag, tag),new HashEntry (content, content),new HashEntry (vector, vector.SelectMany(BitConverter.GetBytes).ToArray())}); } SetAsync方法用于将一个具有指定文档ID、前缀、标签、内容及内容的向量存储到索引库中。并使用SelectMany()方法和BitConverter.GetBytes()方法将向量转换为一个字节数组。 4、向量搜索 Redis 支持两种类型的向量查询KNN查询和Range查询也可以将两种查询混合使用。 KNN 查询 KNN 查询用于在给定查询向量的情况下查找前 N 个最相似的向量。 public async IAsyncEnumerable(string Content, double Score) SearchAsync(float[] vector, int limit) {var query new Query($*[KNN {limit} vector $vector AS score]).AddParam(vector, vector.SelectMany(BitConverter.GetBytes).ToArray()).SetSortBy(score).ReturnFields(content, score).Limit(0, limit).Dialect(2);var result await ft.SearchAsync(indexName, query).ConfigureAwait(false);foreach (var document in result.Documents){yield return (document[content],Convert.ToDouble(document[score]));} } 这段代码的意思是 创建一个查询对象 query并设置查询条件。查询条件包括 *[KNN {limit} vector $vector AS score]使用KNN算法进行向量相似度搜索限制结果数量为limit使用给定的向量vector作为查询向量将查询结果按照相似度得分进行排序AddParam(vector, vector.SelectMany(BitConverter.GetBytes).ToArray())将浮点数数组转换为字节数组并将其作为查询参数传递给查询SetSortBy(score)按照相似度得分对结果进行排序ReturnFields(content, score)将content和score两个字段从结果集中返回Limit(0, limit)限制结果集的起始位置为0结果数量为limitDialect(2)设置查询方言为2即Redis默认的查询语言Redis Protocol调用异步搜索方法 ft.SearchAsync(indexName, query)并等待搜索结果遍历搜索结果集 result.Documents将每个文档转换为 (string Content, double Score) 元组并通过 yield 语句进行迭代返回。 Range 查询 Range查询提供了一种根据 Redis 中的向量字段与基于某些预定义阈值半径的查询向量之间的距离来过滤结果的方法。类似于 NUMERIC 和 GEO 子句可以在查询中多次出现特别是可以和 KNN 进行混合搜索。 public static async IAsyncEnumerable(string Tag, string Content, double Score) SearchAsync(string tag, float[] vector, int limit) {var query new Query($(tag:{tag})[KNN {limit} vector $vector AS score]).AddParam(vector, vector.SelectMany(BitConverter.GetBytes).ToArray()).SetSortBy(score).ReturnFields(tag, content, score).Limit(0, limit).Dialect(2);var result await ft.SearchAsync(indexName, query).ConfigureAwait(false);foreach (var document in result.Documents){yield return (document[tag], document[content], Convert.ToDouble(document[score]));} } 这段代码使用了KNN和Range混合查询与上一段代码相比新增了tag参数将限制结果仅包含给定标签的内容。这样做可以增加查询的准确性提高查询效率。 5、从索引库中删除向量 public async Task DeleteAsync(string docId, string prefix) {await db.KeyDeleteAsync(${prefix}{docId}); } 这个方法通过删除与指定向量相关联的哈希缓存键来实现从索引库中删除指定向量数据。 6、删除向量索引库 public async Task DropIndexAsync() {await ft.DropIndexAsync(indexName, true); } 这个方法 await ft.DropIndexAsync接受两个参数 indexName 和 true 。indexName 表示索引库的名称 true 表示在删除索引时是否删除索引文件。 7、查询索引库信息 public async TaskInfoResult InfoAsync() {return await ft.InfoAsync(indexName); } 通过 await ft.InfoAsync(indexName) 方法我们可以获取到指定索引库的大小文档数量等相关索引库信息。 完整 Demo 如下 using NRedisStack; using NRedisStack.Search; using NRedisStack.Search.DataTypes; using NRedisStack.Search.Literals.Enums; using StackExchange.Redis; using static NRedisStack.Search.Schema;namespace RedisVectorExample {class Program{//创建一个Redis连接static ConnectionMultiplexer mux ConnectionMultiplexer.Connect(localhost);//获取一个Redis数据库static IDatabase db mux.GetDatabase();//创建一个RediSearch客户端static SearchCommands ft new SearchCommands(db, null);//索引名称static string indexName test:index;//索引前缀static string prefix test:data;static async Task Main(string[] args){ //创建一个向量的索引await CreateIndexAsync();//添加一些向量到索引中await SetAsync(1, A, 测试数据A1, new float[] { 0.1f, 0.2f });await SetAsync(2, A, 测试数据A2, new float[] { 0.3f, 0.4f });await SetAsync(3, B, 测试数据B1, new float[] { 0.5f, 0.6f });await SetAsync(4, C, 测试数据C1, new float[] { 0.7f, 0.8f });//删除一个向量await DeleteAsync(4);//KUN搜索 await foreach (var (Content, Score) in SearchAsync(new float[] { 0.1f, 0.2f }, 2)){Console.WriteLine($内容{Content}相似度得分{Score});}//混合await foreach (var (Tag, Content, Score) in SearchAsync(A, new float[] { 0.1f, 0.2f }, 2)){Console.WriteLine($标签{Tag}内容{Content}相似度得分{Score});}//检查索引是否存在var info await InfoAsync();if (info ! null)await DropIndexAsync(); //存在则删除索引}public static async Task CreateIndexAsync(){await ft.CreateAsync(indexName,new FTCreateParams().On(IndexDataType.HASH).Prefix(prefix),new Schema().AddTagField(tag).AddTextField(content).AddVectorField(vector,VectorField.VectorAlgo.HNSW,new Dictionarystring, object(){[TYPE] FLOAT32,[DIM] 2,[DISTANCE_METRIC] COSINE}));}public static async Task SetAsync(string docId, string tag, string content, float[] vector){await db.HashSetAsync(${prefix}{docId}, new HashEntry[] {new HashEntry (tag, tag),new HashEntry (content, content),new HashEntry (vector, vector.SelectMany(BitConverter.GetBytes).ToArray())});}public static async Task DeleteAsync(string docId){await db.KeyDeleteAsync(${prefix}{docId});}public static async Task DropIndexAsync(){await ft.DropIndexAsync(indexName, true);}public static async TaskInfoResult InfoAsync(){return await ft.InfoAsync(indexName);}public static async IAsyncEnumerable(string Content, double Score) SearchAsync(float[] vector, int limit){var query new Query($*[KNN {limit} vector $vector AS score]).AddParam(vector, vector.SelectMany(BitConverter.GetBytes).ToArray()).SetSortBy(score).ReturnFields(content, score).Limit(0, limit).Dialect(2);var result await ft.SearchAsync(indexName, query).ConfigureAwait(false);foreach (var document in result.Documents){yield return (document[content], Convert.ToDouble(document[score]));}}public static async IAsyncEnumerable(string Tag, string Content, double Score) SearchAsync(string tag, float[] vector, int limit){var query new Query($(tag:{tag})[KNN {limit} vector $vector AS score]).AddParam(vector, vector.SelectMany(BitConverter.GetBytes).ToArray()).SetSortBy(score).ReturnFields(tag, content, score).Limit(0, limit).Dialect(2);var result await ft.SearchAsync(indexName, query).ConfigureAwait(false);foreach (var document in result.Documents){yield return (document[tag], document[content], Convert.ToDouble(document[score]));}}} } 篇幅原因先到这里下一篇我们接着探讨如何利用ChatGPT Embeddings技术提取文本向量并基于Redis实现文本相似度匹配。相比传统方法这种方式能够更好地保留文本的语义和情感信息从而更准确地反映文本的实质性内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/87231.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

做宣传网站需要多少钱wordpress 文章付费查看

如果你知道如何使用 C/C Single File Execution 插件但仍然无法找到运行按钮 请直接看第五张图片 一、 这里我首先新建了一个项目,名为Demo 又在项目文件夹内新建了一个代码文件,名为TestCode 二、 然后在 File - Settings - Plugins 中搜索 C/C Single…

泰安集团网站建设报价文化馆门户网站建设的作用及意义

Vue 2和Vue 3是Vue.js框架的不同版本,在面试中经常涉及到它们之间的区别。以下是Vue 2和Vue 3的主要区别: 性能提升:Vue 3在性能方面进行了优化。Vue 3引入了更高效的Diff算法,提高了渲染性能。此外,Vue 3还进行了代码…

谷歌网站英文做家旅游的视频网站好

思路:先对数组排序,然后确定第一个数nums[i],再新建左右双指针; 寻找的3元组,a,b,c,即是 nums[i], nums[letf], nums[right] 数组1:-1,-1,-1,0,1,2; 前面3个-1,只有一个-1是有用的,需…

网站免费部署wordpress主题模板 国人

2024数字物流技术展 2024新能源商用车及物流车展 2024电商物流包装展 2024冷链物流展 2024年7月8-10日 | 杭州国际博览中心 参展企业介绍 深圳市欣瑞达信息技术有限公司(曾用名:深圳市欣瑞达液晶显示技术有限公司)成立于1997年,是…

网站建设公司宣传河南省建设监理协会官方网站

使用 Docker Registry 搭建自己的 Docker 镜像仓库 在使用 Docker 进行应用程序的开发和部署时,使用 Docker 镜像仓库是一个很好的实践。它允许集中存储和管理 Docker 镜像,方便团队协作和版本控制。在本文中,将介绍如何使用 Docker Registr…

域名注册网站大全手机做任务的网站有哪些

文章目录 需求问题解决方案示例代码 需求 项目中共用了一个redis,而项目中部分代码使用了JetCache的Cached注解。所以需要给Cached动态配置area属性值,用来区分dev和test环境。 问题 自定义注解的属性值需要常量值,即static final修饰&…

个人网站平台十大企业网站排行榜

本文主要向大家介绍了Python语言解析JSON详解,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。 JSON 函数使用 JSON 函数需要导入 json 库:import json。函数 描述json.dumps 将 Python 对象编码成 JSON 字符串json.loads 将已…

建站如何挣钱安阳信息港网站

java minor gc2013年,Oracle宣布了Java SE –更改版本编号方案 。 该公告指出,将使用特定的版本号方案发布受限更新版本(那些“包括新功能和非安全修复程序”)和关键补丁更新(CPU)“那些仅包含安全漏洞修复…

富阳房产网佛山seo按效果付费

1,生成改为Release版本 2,选中****.Android项目 3,点击生成,选择存档 4,点击分发 5,选择临时 6,添加签名标识 7,选择对应的签名标识,点击另存为

襄阳宜城网站建设中小企业网站建设问题

描述 C 库函数 clock_t clock(void) 返回程序执行起(一般为程序的开头),处理器时钟所使用的时间。为了获取 CPU 所使用的秒数,您需要除以 CLOCKS_PER_SEC。 在 32 位系统中,CLOCKS_PER_SEC 等于 1000000,…

低价网站建设费用多少企业网站会涉及到的版权问题

今天下载一个demo导入之后发现一个问题,提示导入的R包只有系统默认的 没有项目的,可以看下图 这种情况出现呢不多,但是出现了我就记录下,这个先看看R文件是不是还在 点击Gen包 查看 看看R文件是不是还在,打开一看果然不…

网站收录系统seo排名工具

免费赠与客户货物的销项税处理 如果免费赠与客户货物却要体现销项税,如何处理?在实际业务中因为免费货物是不免税的。所以大家总是以为使用0费用解决但是有一种情况是存在于视同销售。 即D:销售费用 C:销项税 SAP中的处理逻…

海报设计 网站自助个人网站

区块链 定 义:一种新的数据记录,存储,表达的方式。参加区块链的全体成员都有一份数据,以及每个人对数据进行的操作都会被区块链里的每个人得知。这样就可以避免都存储在一个地方导致数据丢失后造成的损失 发展历程: …

网店代运营代理博客可以做seo吗

文章目录 前言正文一、原理性文章1.1 OpenFeign篇 二、实战性文章1.1 注册中心、配置中心篇1.2 网关篇1.3 OpenFeign篇 前言 SpringCloud系列文章,有些文章上下文存在联系。 并且,它们数量巨多,有涉及原理的,有涉及实战的。 本文…

生产企业网站欣赏中国icp备案网站

使用readv和writev函数可以提高数据通信的效率,它们的功能可以概括为**“对数据进行整合传输及发送”**。 即使用writev函数可以将分散在多个缓冲中的数据一并发送,使用readv函数可以由多个缓冲分别接受,所以适当使用他们可以减少I/O函数的调…

网站建设 骏域网络建设专家广州关于我们做网站

1.先写测试 2.要使程序尽快的通过(及早交付) 3.优化程序结构,尽量使程序尽量快的运行 4.不要怕修改,单元测试会保证接口的正常运行 5.能通过测试后再去重构(消除冗余,优化程序设计) 6.用尽…

网站开发服务合同印花税澄迈住房和城乡建设局网站

当下是短视频的时代,随着5g进程的加速推动,短视频已经成为了很多自媒体人变现的主要途径B站,抖音,快手,西瓜视频等等各大平台都砸钱鼓励平台创作者创作视频,因为平台流量大,我们就可以通过一些技…

郑州网站优化公司排名建设网工程信息

为什么要制定网络安全政策? 通常,公司并不认为需要制定网络安全政策。现有的政策是为了保护公司的资产,而数据也是一项资产。 网络安全政策的真正必要性很简单:网络安全并不像锁门或不偷公司笔那么简单。在许多情况下&#xff0…

swiper手机网站案例网上商城开发设计

首先笔试 笔试超级难 jsp 数据库 java 很多要百度 记得多找几个小伙伴哦~ 面试 一面: 技术面 讲一下你的项目 根据你的项目提问 面试官: 有哪些排序算法 我:冒泡 面试官: 只有一个冒泡? 我: 还有选择吧(我怕手写 &am…

婚礼摄影网站源码wordpress优化版本

1. AJAX入门 1.1 AJAX概念和axios使用 1.1.1 什么是AJAX? 1.1.2 怎么用AJAX? 引入axios.js 获取省份列表数据 1.2 认识URL 1.3 URL查询参数 1.4 常用请求方和数据提交 1.5 HTTP协议-报文 1.5.1 HTTP响应状态码 1.5.1.1 状态码:1XX(信息&#xff09…