网站兼职做计划赚小钱视频音乐网站怎样建设

news/2025/9/23 20:08:18/文章来源:
网站兼职做计划赚小钱,视频音乐网站怎样建设,wordpress iframe广告,电子商务网站开发的总结使用PPMI改进共现矩阵 共现矩阵的元素表示两个单词同时出现的次数#xff0c;这里的次数并不具备好的性质#xff0c;举个例子#xff0c;有短语叫the car#xff0c;因为the是个常用词#xff0c;如果以两个单词同时出现的次数为衡量相关性的标准#xff0c;与drive 相…使用PPMI改进共现矩阵 共现矩阵的元素表示两个单词同时出现的次数这里的次数并不具备好的性质举个例子有短语叫the car因为the是个常用词如果以两个单词同时出现的次数为衡量相关性的标准与drive 相比the和car的相关性更强这是不对的。 点互信息(Pointwise Mutual Information,PMI)表达式如下P(x)表示x发生的概率P(y)表示y发生的概率P(x,y)表示x和y同时发生的概率。PMI的值越高表明x与y相关性越强。 用共现矩阵重写PMI表达式将共现矩阵表示为C将单词X和Y的共现次数表示为C(x,y)将单词x和y的出现次数分别表示为C(x)、C(y)将语料库的单词数量记为N。表达式如下。 正的点互信息Positive PMIPPMI当两个单词的共现次数为0时 log0-∞。为解决这个问题实践上会使用下述正的点互信息。可以将单词间的相关性表示为大于等于0的实数。 共现矩阵转化为PPMI矩阵的函数实现代码中防止 np.log2(0)-inf 而使 用了微小值 eps。 分析一下源码函数里加一个print M np.zeros_like(C, dtypenp.float32)N np.sum(C)S np.sum(C, axis0)total C.shape[0] * C.shape[1]print(C)print(M)print(N)print(S)print(total)输出如下可见N是把共现矩阵C中所有数相加M是维度和C相同的全为0的数组用来存PPMI矩阵S是记录每个词和别的词共现的次数total是等于7*7这个是输出进展情况时候用的用来判断当前进度。 [[0 1 0 0 0 0 0][1 0 1 0 1 1 0][0 1 0 1 0 0 0][0 0 1 0 1 0 0][0 1 0 1 0 0 0][0 1 0 0 0 0 1][0 0 0 0 0 1 0]][[0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.][0. 0. 0. 0. 0. 0. 0.]]14[1 4 2 2 2 2 1]49下面这句代码S[j]和S[i]指的是i和j和别的词共现的次数这里就知道了代码的实现和PMI表达式定义其实还是有差别的代码是在共现范围内判断两个词的相关性。举个例子a和b共现了x次b和其他人现了y次a和其他人现了j次群体中人的个数是n那在这个群体里b和a现的程度就是(x * n)/(y * j) 。(‘现’理解成XO)。 pmi np.log2(C[i, j] * N / (S[j]*S[i]) eps)完整代码 def ppmi(C, verboseFalse, eps 1e-8):生成PPMI正的点互信息:param C: 共现矩阵:param verbose: 是否输出进展情况:return:M np.zeros_like(C, dtypenp.float32)N np.sum(C)S np.sum(C, axis0)total C.shape[0] * C.shape[1]cnt 0for i in range(C.shape[0]):for j in range(C.shape[1]):pmi np.log2(C[i, j] * N / (S[j]*S[i]) eps)M[i, j] max(0, pmi)if verbose:cnt 1if cnt % (total//100 1) 0:print(%.1f%% done % (100*cnt/total))return M例子 text You say goodbye and I say hello. corpus, word_to_id, id_to_word preprocess(text) vocab_size len(word_to_id) C create_co_matrix(corpus, vocab_size) W ppmi(C)np.set_printoptions(precision3) # 有效位数为3位 print(covariance matrix) print(C) print(-*50) print(PPMI) print(W)输出PPMI矩阵各个元素均为大于等于0的实数。 covariance matrix [[0 1 0 0 0 0 0][1 0 1 0 1 1 0][0 1 0 1 0 0 0][0 0 1 0 1 0 0][0 1 0 1 0 0 0][0 1 0 0 0 0 1][0 0 0 0 0 1 0]] -------------------------------------------------- PPMI [[0. 1.807 0. 0. 0. 0. 0. ][1.807 0. 0.807 0. 0.807 0.807 0. ][0. 0.807 0. 1.807 0. 0. 0. ][0. 0. 1.807 0. 1.807 0. 0. ][0. 0.807 0. 1.807 0. 0. 0. ][0. 0.807 0. 0. 0. 0. 2.807][0. 0. 0. 0. 0. 2.807 0. ]] 随着语料库词汇量增加各个单词向量的维数也会增加这个矩阵很多元素都是0表明向量中的绝大多数元素并不重要对于这些问题一个常见的方法是向量降维。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day002

今日完成:斗地主牌组,牌类. 明日完成:斗地主游戏程序 遇到问题:无.

蚂蜂窝网站分析网站域名asia是

目录 1 TVS管外观结构 2 TVS管常见品牌 ​编辑3 TVS管命名规则 4 TVS管工作原理 5 TVS基本特点 6 TVS典型应用 7 TVS管电气参数说明 7.1 VRWM 截止电压,IR 漏电流 7.2 VBR 击穿电压 7.3 IPP 峰值脉冲电流,VC 钳位电压 8 TVS选型注意事项 8.1…

PyTorch图神经网络(四)

PyTorch图神经网络(四) 1.GraphSAGE ​ 从这里开始的第三篇,开始将更加偏向实际使用的图神经网络了。GraphSAGE是一种图神经网络架构,旨在处理大型图。 邻居采样: ​ 这里引入了一个基本概念:小批量。在大型图中…

【51单片机】【protues仿真】基于51单片机密码锁系统 - 详解

【51单片机】【protues仿真】基于51单片机密码锁系统 - 详解2025-09-23 20:07 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !importa…

网站设计案例方案广告网页

centos7 mysql 基本测试(7)主从并行简单测试 重启MySQL服务使配置生效。 注意:并行复制需要slave的硬件资源充足,并且确保网络通信和IO性能不是瓶颈。不是所有的应用场景都适合并行复制,比如写密集型应用或者slave负…

网站配色金华网站建设建设设计网站

function _reverse(number) { // 补全代码 return (number ).split().reverse().join(); } number :首先,将数字 number 转换为字符串。在 JavaScript 中,当你将一个数字与一个字符串相加时,JavaScript 会自动将数字转换为字符串…

竹子建站加盟咨询wex5可以做网站吗

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目录名:os.listdir() 函数用来删除一个文件:os.remove() 删除多个目…

建分类网站得花多少钱阿里建站系统

一、21根火柴棍问题(21 Matchticks Problem) 21根火柴棍问题是西方经典游戏之一。 给定21根火柴,2个人A和B(比如:分别是计算机和用户)。 每个人一次可以挑选 1-- 4 根火柴。 被迫挑最后一根火柴的人输了…

济南自助建站系统导航网站开发

复制模式和扩展模式扩展器模式在最近几年变得很流行,甚至已经在OSGi标准(例如,蓝图服务和Web应用程序规范)中使用。 在处女座,我们从一开始就与扩展程序一起工作,但是尽管它们具有优势,但它们仍…

滨州五学一做考试网站网站制作介绍

组网需求 如图1所示,SwitchA、SwitchB和SwitchC之间运行OSPF,SwitchA和SwitchB之间的交换机仅作透传功能。现在需要SwitchA和SwitchB能快速感应它们之间的链路状态,当链路SwitchA-SwitchB发生故障时,业务能快速切换到备份链路Swi…

最好的免费logo设计网站亚马逊aws在线观看

Lab 1: 应用程序建模 实验目标 这个实验的目的是展示如何在Visual Studio 2010旗舰版中进行应用程序建模。团队中的架构师会通过建模确定应用程序是否满足客户的需求。 你可以创建不同级别的详细模型,并将它们彼此结合、测试然后发布到你的开发计划里。 在这个实验中…

告别材料乱堆、用电违规!AI 施工监测系统覆盖重点施工场景隐患

在建筑施工的复杂环境中,各类安全隐患犹如潜藏的暗礁,时刻威胁着项目的顺利推进。施工现场材料堆放杂乱无章,重物滚落、易燃物混放;安全通道被随意占用;施工用电违规现象,私拉乱接电线、设备未接地等;大型设备若…

Computer Architecture

System Evaluation Metrics Cost Metrics The cost of a chip includes:Design cost: non-recurring engineering (NRE), can be amortized well if there is high volume; Manufacturing cost: depends on area;Manuf…

cv-css 快捷方式,将指定节点的计算样式获取下拉 获取tailwind网页样式成原生样式

cv-css 快捷方式,将指定节点的计算样式获取下拉 获取tailwind网页样式成原生样式 使用方法先选择节点 点击cv-css 复制函数 控制台粘贴函数回车javascript:(function(){ const code = `(() => { const el = wi…

可以看国外网站的浏览app软考

函数 devm_kzalloc() 和kzalloc()一样都是内核内存分配函数,但是devm_kzalloc()是跟设备(device)有关的,当设备(device)被detached或者驱动(driver)卸载(unloaded)时,内存会被自动释放。另外,当内存不在使用时,可以使用…

温州哪里有网站建设百度广告电话号码

题干 有一个自行车手打算进行一场公路骑行&#xff0c;这条路线总共由 n 1 个不同海拔的点组成。自行车手从海拔为 0 的点 0 开始骑行。 给你一个长度为 n 的整数数组 gain &#xff0c;其中 gain[i] 是点 i 和点 i 1 的 净海拔高度差&#xff08;0 < i < n&#xff…

沧县住房和城乡建设局网站1000元做网站

目录 基本分类 C风格输出 C风格 可以抑制输出 方法一 方法二 在Qt中进行log输出, 一般不使用c中的printf, 也不是使用C中的cout, Qt框架提供了专门用于日志输出的类, 头文件名为 QDebug。 基本分类 qDebug&#xff1a;调试信息提示 qInfo &#xff1a;输出信息 qWarnin…

福田区网站建网页设计基础课件

题目 213. 打家劫舍 II 198. 打家劫舍 你是一个专业的小偷&#xff0c;计划偷窃沿街的房屋&#xff0c;每间房内都藏有一定的现金。这个地方所有的房屋都围成一圈&#xff0c;这意味着第一个房屋和最后一个房屋是紧挨着的。同时&#xff0c;相邻的房屋装有相互连通的防盗系统&…

网站备案帐号找回邢台移动网站建设公司

可以使用array()类java.nio.ByteBuffer中的方法获得缓冲区的字节数组。如果返回的数组被修改&#xff0c;则缓冲区的内容也会被类似地修改&#xff0c;反之亦然。如果缓冲区是只读的&#xff0c;则抛出ReadOnlyBufferException。演示此的程序如下所示-示例import java.nio.*;im…

桂城网站设计seow

给定一个二叉树&#xff0c;确定它是否是一个完全二叉树。 百度百科中对完全二叉树的定义如下&#xff1a; 若设二叉树的深度为 h&#xff0c;除第 h 层外&#xff0c;其它各层 (1&#xff5e;h-1) 的结点数都达到最大个数&#xff0c;第 h 层所有的结点都连续集中在最左边&a…