网站兼职做计划赚小钱域名网站建设方案书

news/2025/9/24 2:36:00/文章来源:
网站兼职做计划赚小钱,域名网站建设方案书,程序员怎么用wordpress,国内永久免费云服务器推荐通过共现矩阵和余弦相似度实现机器对单词的认知、python实现本文介绍的定义#xff1a;一、语料库预处理二、单词的分布式表示三、单词的相似度四、相似单词排序本文介绍的定义#xff1a; 语料库、计数方法的目的、语料库预处理、单词的分布式表示、分布式假设、上下文、窗… 通过共现矩阵和余弦相似度实现机器对单词的认知、python实现本文介绍的定义一、语料库预处理二、单词的分布式表示三、单词的相似度四、相似单词排序本文介绍的定义 语料库、计数方法的目的、语料库预处理、单词的分布式表示、分布式假设、上下文、窗口大小、基于计数的方法表示单词、用向量表示单词、共现矩阵、单词的相似度、余弦相似度、相似单词排序。 一、语料库预处理 语料库大量的文本数据。 计数方法的目的从语料库中提取语言的本质。 语料库预处理将文本分割为单词并将分割后的单词列表转化为单词ID列表。实现代码如下其中corpus 是单词ID列表word_to_id 是单词到单词ID的字典id_to_word是单词ID到单词的字典。 def preprocess(text):text text.lower()text text.replace(., .)words text.split( )word_to_id {}id_to_word {}for word in words:if word not in word_to_id:new_id len(word_to_id)word_to_id[word] new_idid_to_word[new_id] wordcorpus np.array([word_to_id[w] for w in words])return corpus, word_to_id, id_to_word举个例子 text You say goodbye and I say hello. corpus, word_to_id, id_to_word preprocess(text) print(corpus) print(word_to_id) print(id_to_word)输出 [0 1 2 3 4 1 5 6] {you: 0, say: 1, goodbye: 2, and: 3, i: 4, hello: 5, .: 6} {0: you, 1: say, 2: goodbye, 3: and, 4: i, 5: hello, 6: .}二、单词的分布式表示 单词的分布式表示颜色通过RGB三原色分别存在多少来表示RGB这样的向量表示可以更准确地指定颜色颜色之间的关联性是否是相似的颜色也更容易通过向量表示来判断和量化。类似于颜色的向量表示方法运用到单词上形成单词含义的向量表示在自然语言处理领域这称为分布式表示。 分布式假设某个单词的含义由它周围的单词形成。单词本身没有含义单词含义由它所在的上下文语境形成。 上下文上下文是指某个单词的周围词汇。 窗口大小将上下文的大小即周围的单词有多少个称为窗口大小。 基于计数的方法表示单词如何基于分布式假设使用向量表示单词可以在关注某个单词的情况下对它的周围出现了多少次什么单词进行计数然后再汇总称为“基于计数的方法”。 用向量表示单词向量表示的是每个单词的上下文(与窗口大小有关)所包含的单词的频数(出现次数)。 共现矩阵如下图所示汇总所有单词的向量表示的表格。 代码 def create_co_matrix(corpus, vocab_size, window_size1):生成共现矩阵:param corpus: 语料库单词ID列表:param vocab_size:词汇个数:param window_size:窗口大小当窗口大小为1时左右各1个单词为上下文:return: 共现矩阵corpus_size len(corpus)co_matrix np.zeros((vocab_size, vocab_size), dtypenp.int32)for idx, word_id in enumerate(corpus):for i in range(1, window_size 1):left_idx idx - iright_idx idx iif left_idx 0:left_word_id corpus[left_idx]co_matrix[word_id, left_word_id] 1if right_idx corpus_size:right_word_id corpus[right_idx]co_matrix[word_id, right_word_id] 1return co_matrixC create_co_matrix(corpus, vocab_size, window_size1) for i in range(7):print(C[i])输出 [0 1 0 0 0 0 0] [1 0 1 0 1 1 0] [0 1 0 1 0 0 0] [0 0 1 0 1 0 0] [0 1 0 1 0 0 0] [0 1 0 0 0 0 1] [0 0 0 0 0 1 0]三、单词的相似度 单词的相似度两个单词含义相近的程度。 前面通过共现矩阵将单词表示为了向量如何测量向量间的相似度有代表性的方法有向量内积、欧式距离、余弦相似度等。 余弦相似度设有x、y两个向量他们的余弦相似度公式如下。余弦相似度直观表示了两个向量在多大程度上指向同一方向两个向量完全指向相同的方向时余弦相似度为 1完全指向相反的方向时余弦相似度为 -1。 实现余弦相似度需要解决除数为0问题可以在执行除法时加上一个微小值。 实现代码 def cos_similarity(x, y, eps1e-8):计算余弦相似度:param x: 向量:param y: 向量:param eps: 用于防止“除数为0”的微小值:return:nx x / (np.sqrt(np.sum(x ** 2)) eps)ny y / (np.sqrt(np.sum(y ** 2)) eps)return np.dot(nx, ny)例子求you和i的相似度 。 text You say goodbye and I say hello. corpus, word_to_id, id_to_word preprocess(text) vocab_size len(word_to_id) C create_co_matrix(corpus, vocab_size)c0 C[word_to_id[you]] #you的单词向量 c1 C[word_to_id[i]] #i的单词向量 print(cos_similarity(c0, c1))输出 0.7071067691154799四、相似单词排序 相似单词排序当某个单词被作为查询词时将与这个查询词相似的单词按降序显示出来。 实现步骤 1.取出查询词的单词向量 query_id word_to_id[query] query_vec word_matrix[query_id]2.求查询词的单词向量和其他所有单词向量的余弦相似度。 vocab_size len(id_to_word) similarity np.zeros(vocab_size) for i in range(vocab_size):similarity[i] cos_similarity(word_matrix[i], query_vec)3.基于余弦相似度的结果按降序显示它们的值。argsort()方法可以按升序对 NumPy 数组的元素进行排序返回值是数组的索引。将 NumPy 数组的各个元素乘以 -1 后再使用 argsort() 方法可以按降序输出单词相似度。 count 0for i in (-1 * similarity).argsort():if id_to_word[i] query:continueprint( %s: %s % (id_to_word[i], similarity[i]))count 1if count top:return 完整代码 def most_similar(query, word_to_id, id_to_word, word_matrix, top5):相似单词的查找:param query: 查询词:param word_to_id: 从单词到单词ID的字典:param id_to_word: 从单词ID到单词的字典:param word_matrix: 汇总了单词向量的矩阵假定保存了与各行对应的单词向量:param top: 显示到前几位if query not in word_to_id:print(%s is not found % query)returnprint(\n[query] query)query_id word_to_id[query]query_vec word_matrix[query_id]vocab_size len(id_to_word)similarity np.zeros(vocab_size)for i in range(vocab_size):similarity[i] cos_similarity(word_matrix[i], query_vec)count 0for i in (-1 * similarity).argsort():if id_to_word[i] query:continueprint( %s: %s % (id_to_word[i], similarity[i]))count 1if count top:return 例子按降序显示与you最相似的前五个单词。 text You say goodbye and I say hello. corpus, word_to_id, id_to_word preprocess(text) vocab_size len(word_to_id) C create_co_matrix(corpus, vocab_size)most_similar(you, word_to_id, id_to_word, C, top5)输出结果和我们的感觉存在很大的差异。一个可能的原因是这里的语料库太小了。 [query] yougoodbye: 0.7071067691154799i: 0.7071067691154799hello: 0.7071067691154799say: 0.0and: 0.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/914615.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚂蜂窝网站分析二级域名网站免费申请

目录 1 TVS管外观结构 2 TVS管常见品牌 ​编辑3 TVS管命名规则 4 TVS管工作原理 5 TVS基本特点 6 TVS典型应用 7 TVS管电气参数说明 7.1 VRWM 截止电压,IR 漏电流 7.2 VBR 击穿电压 7.3 IPP 峰值脉冲电流,VC 钳位电压 8 TVS选型注意事项 8.1…

建设网站外国人可搜到wordpress 导出md

文章目录 一、C语言传统的处理错误的方式二、C异常三、异常的使用3.1 异常的抛出和捕获3.1.1 异常的抛出和匹配原则3.1.2 在函数调用链中异常栈展开匹配原则 3.2 异常的重新抛出3.3 异常安全3.4 异常规范 四、自定义异常体系五、C标准库的异常体系六、异常的优缺点6.1 优点6.2 …

安阳网站建设_电网商城

前言: 📕作者简介:热爱编程的小七,致力于C、Java、Python等多编程语言,热爱编程和长板的运动少年! 📘相关专栏Java基础语法,JavaEE初阶,数据库,数据结构和算法系列等,大家有兴趣的可以看一看。 😇😇😇有兴趣的话关注博主一起学习,一起进步吧! 一、MySQL存…

百度收录网站与手机版超链接到网站怎么做视频文件下载

🚩🚩🚩Hugging Face 实战系列 总目录 有任何问题欢迎在下面留言 本篇文章的代码运行界面均在PyCharm中进行 本篇文章配套的代码资源已经上传 从零构建属于自己的GPT系列1:数据预处理 从零构建属于自己的GPT系列2:模型训…

英语网站都可以做哪些内容网络技术人员

这两天猫在家里搞一个多线程的断点续传得C#程序,发现同时只能开2个线程下载,其他的线程一律要等待,这样就导致下载大文件时其他线程经常超时,郁闷好久。今天回公司无意中发现了一个帖子,终于真相大白了, …

求十大猎头公司排名深圳网站优化搜索

请求方式,分为GET与POST:GET最为常见的HTTP请求,普通上网浏览页面就是GET。GET方式的参数请求直接跟在URL后,以问号开始。(JS中用window.location.search获得)。参数可以用encodeURIComponent进行编码&…

网站营销的重点网站会员推广邀请系统

涨点效果 参考模型 参考的Block,如下图: 我对Block做了修改,修改后的结构图如下: 代码详解 from timm.models.layers import DropPathfrom torch import Tensor def channel_shuffle(x: Tensor, groups:

青岛模板网站建设价格海外酒店网站建设

1.通过文件路径的onnx模型加载方式: 在onnxruntime下面的主要函数:session Ort::Session(env, w_modelPath.c_str(), sessionOptions); 这里的文件路径是宽字节的,通过onnx文件路径直接加载模型。 在opencv下使用dnn加载onnx模型的主要函数: std::string model…

网站产品详情用哪个软件做的网站建设项目策划书模板范文

开发STM32F103很好的参考例程,轻松实现各类外围器件的开发。持续更新中,欢迎关注及收藏。 0001基于STM32F103单片机GPIO实现控制LED灯闪烁的程序代码.zip 0002基于STM32F103单片机GPIO实现按键KEY的检测程序代码.zip 0003基于STM32F103单片机GPIO实现外部…

好的网站首页建设公司十大免费行情软件推荐

idea2017对mybatis plugin支持不是很好 标准的meaven项目用谁都一样 archetype是官网提供的模板项目 .gitignore文件非常的重要配置 Meven的pom文件 项目的包结构 Mybatis三剑客

网站正在建设中_敬请期待在哪个网站可以自助建站

人生万里路,走好每一步,身体是本钱,平安是财富,开心就是护身符,健康才是摇钱树。新的一天,事事顺意! 晨起福门开,快乐安康在,愉悦心态好,生活充满爱&#xf…

网络建站 响应式网站国内做化妆刷的比较好的网站

本文章是对官方题解的补充说明 原题链接:2288. 价格减免 思路 由题目中的“单词之间用单个空格分隔”和 “如果单词的形式为美元符号后跟着一个非负实数,那么这个单词就表示一个 价格 。” 可知: 首先要通过 ‘space’把原字符串进行切分&…

百度站内搜索提升关键词排名什么是网站建设与维护

在网络情况不好的情况下,优酷androidclient下载视频会终止,用户放弃下载点击 删除该任务以后,切换到网络好的情况下进行下载,会显示该视频已在下载队列里,然后clientUI界面却什么都看不到。导致用户根本无法下载。 事实…

快手流量推广免费网站wordpress 中文企业

C语言从入门到精通(吐血分享)4成功!结构体、链表、文件数组、字符串函数、指针三种结构化程序设计三种数据类型、六大表达式一、简单的程序#include 数学函数 命令行main() /*主函数*/{ /*左花括号,函数体的开始 */int a,b,c; /*定义语句*/a 3; /*执行语…

经典模板网站建设公司建网站 内部邮箱

提示:文章有错误的地方,还望诸位大神指出。 文章目录 前言一、光源种类1.Directional Light(方向光,平行光)2.Point Light(点光源)3.Spotlight(聚光灯)4.Area Light(区域光&#xff…

微信支付网站开发无锡平台公司

现代几何学与计算机科学-中国计算机学会CNCC 2017 特邀报告 第 13 卷  第12 期  2017 年 12月现代几何学与计算机科学丘成桐 (Shing-Tung Yau)关键词 :现代几何 共形映射 计算机图形学 计算机视觉 人工智能 哈佛大学我很荣幸受邀来到中国计算机大会上演…

怎么搭建网站 优帮云dede双语网站

看过《水浒传》的朋友都知道,梁山的一百单八将因为各种理由加入了水寨,走上了劫富济贫、替天行道的路。我2006年从南京大学本科毕业以后,耳闻目睹了数百位计算机专业的博士(生),他们选择读博士的理由可以说…

学院网站建设方案视频推广

一、标书整体实施方案概述 标书整体实施方案是一种全面、系统的方法,旨在确保标书的顺利完成和成功实施。它涵盖了从项目背景到招标文件分析,再到投标文件编制和投标的全过程。实施方案不仅提供了明确的工作流程和分工,还为整个标书制作团队…

网站的外部链接建设品牌宣传片策划公司

目录 什么是useRef? 使用 ref 访问 DOM 元素 Ref和useRef之间的区别 Ref和useRef的使用案例 善用工具 结论 在各种 JavaScript 库和框架中,React 因其开发人员友好性和支持性而得到认可。 大多数开发人员发现 React 非常舒适且可扩展,…

怎么做网站海报企业网站建设的提案

8,路由反射器 Router Reflector --- 路由反射器 --- RR ---- 我们可以通过配置,将某些设备在一定的条件下设置称为路由反射器,之后,该设备将可以反射所学习到的IBGP路由信息。 我们在指定一台路由器称为路由反射器(RR&…