网站制作建站婚纱摄影网站源码asp

web/2025/9/29 23:06:19/文章来源:
网站制作建站,婚纱摄影网站源码asp,wordpress常用库,西安seo外包优化自然语言处理-数学基础概述1.信息论基础1.1熵1.2 联合熵和条件熵1.3 相对熵和交叉熵1.4 互信息和双字耦合度1.5 噪声信道模型概述 本系列文章计划总结整理中国科学院大学宗成庆老师《自然语言处理》课程相关知识#xff0c;参考数目《统计自然语言处理》-第二版#xff0c;宗… 自然语言处理-数学基础概述1.信息论基础1.1熵1.2 联合熵和条件熵1.3 相对熵和交叉熵1.4 互信息和双字耦合度1.5 噪声信道模型概述 本系列文章计划总结整理中国科学院大学宗成庆老师《自然语言处理》课程相关知识参考数目《统计自然语言处理》-第二版宗成庆。 1.信息论基础 1.1熵 熵是信息论中的基本概念 又称为自信息self-information。表示信号源X每发送一个符号不论发什么符号所提供的平均信息量。熵经常被用来描述一个随机变量的不确定性一个随机变量的熵越大这个随机变量的不确定性越大那么正确估计其随机变量值的可能性就越小。 如果X是一个离散型的随机变量其概率分布p(x)P(Xx),x∈Xp(x)P(Xx),x\in Xp(x)P(Xx),x∈X。X的熵H(X)为 H(X)−∑x∈Xp(x)log⁡2p(x)H(X)-\sum_{x\in X}p(x)\log_{2}p(x) H(X)−x∈X∑​p(x)log2​p(x) 约定0log2000log_2000log2​00。对数以2为底时熵的单位为比特bit。 定性理解熵越大不确定性越大。 随机实验1掷一枚均匀的硬币结果等可能的出现正反两面即P(X正面)0.5P(X反面)0.5P(X正面)0.5P(X反面)0.5P(X正面)0.5P(X反面)0.5则 H(X)−(0.5log⁡20.50.5log20.5)1H(X)-(0.5\log_20.50.5log_20.5)1H(X)−(0.5log2​0.50.5log2​0.5)1 随机实验2掷一枚不均匀的硬币一面镀铅结果不等可能的出现正反两面其中P(X正面)0.3P(X反面)0.7P(X正面)0.3P(X反面)0.7P(X正面)0.3P(X反面)0.7则 H(X)−(0.3log⁡20.30.7log20.7)0.88H(X)-(0.3\log_20.30.7log_20.7)0.88H(X)−(0.3log2​0.30.7log2​0.7)0.88 实验1等可能的出现正反面不难理解出现其正面的不确定性比实验2中出现正面的不确定性大通过计算实验1结果的熵确实比实验二结果的熵大。 1.2 联合熵和条件熵 联合熵 描述一对随机变量所需要的平均信息量。一对离散型随机变量X,Y的联合概率概率分布为p(x,y)p(x,y)p(x,y),X,Y的联合熵为 H(X,Y)−∑x∈X∑y∈Yp(x,y)log2p(x,y)H(X,Y)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2p(x,y)H(X,Y)−x∈X∑​y∈Y∑​p(x,y)log2​p(x,y) 条件熵 给定随机变量X的条件下随机变量Y的熵 H(Y∣X)∑x∈Xp(x)H(Y∣Xx)∑x∈Xp(x)[−∑y∈Yp(y∣x)log2p(y∣x)]−∑x∈X∑y∈Yp(x)p(y∣x)log2p(y∣x)H(Y|X)\sum_{x\in X}p(x)H(Y|Xx)\sum_{x\in X}p(x)[-\sum_{y\in Y}p(y|x)log_2p(y|x)]-\sum_{x\in X}\sum_{y\in Y}p(x)p(y|x)log_2p(y|x)H(Y∣X)x∈X∑​p(x)H(Y∣Xx)x∈X∑​p(x)[−y∈Y∑​p(y∣x)log2​p(y∣x)]−x∈X∑​y∈Y∑​p(x)p(y∣x)log2​p(y∣x) 连锁规则 联合熵可以表示为条件熵与熵的和通过数学变换 H(X,Y)−∑x∈X∑y∈Yp(x,y)log2p(x,y)−∑x∈X∑y∈Yp(x,y)log2[p(y∣x)p(x)]H(X,Y)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2p(x,y)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2[p(y|x)p(x)]H(X,Y)−x∈X∑​y∈Y∑​p(x,y)log2​p(x,y)−x∈X∑​y∈Y∑​p(x,y)log2​[p(y∣x)p(x)] −∑x∈X∑y∈Yp(x,y)[log2p(y∣x)log2p(x)]-\sum_{x\in X}\sum_{y\in Y}p(x,y)[log_2p(y|x)log_2p(x)]−x∈X∑​y∈Y∑​p(x,y)[log2​p(y∣x)log2​p(x)] −∑x∈X∑y∈Yp(x,y)log2p(y∣x)−∑x∈X∑y∈Yp(x,y)log2p(x)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2p(y|x)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2p(x)−x∈X∑​y∈Y∑​p(x,y)log2​p(y∣x)−x∈X∑​y∈Y∑​p(x,y)log2​p(x) −∑x∈X∑y∈Yp(x)p(y∣x)log2p(y∣x)−∑x∈X∑y∈Yp(x,y)log2p(x)-\sum_{x\in X}\sum_{y\in Y}p(x)p(y|x)log_2p(y|x)-\sum_{x\in X}\sum_{y\in Y}p(x,y)log_2p(x)−x∈X∑​y∈Y∑​p(x)p(y∣x)log2​p(y∣x)−x∈X∑​y∈Y∑​p(x,y)log2​p(x) H(Y∣X)H(X)H(Y|X)H(X)H(Y∣X)H(X) 同理可以推导 H(X,Y)H(Y)H(X∣Y)H(X,Y)H(Y)H(X|Y)H(X,Y)H(Y)H(X∣Y) 1.3 相对熵和交叉熵 之后公式中底数2将被省略 相对熵 又称为KL散度用于衡量两个随机分布的差距。当两个随机分布相同时其相对熵为0.当两个随机分布的差别增加时其相对熵也增加 。两个概率分布p(x),q(x)p(x),q(x)p(x),q(x)d的相对熵为 D(p∣∣q)∑x∈Xp(x)logp(x)q(x)D(p||q)\sum_{x\in X}p(x)log \frac{p(x)}{q(x)}D(p∣∣q)x∈X∑​p(x)logq(x)p(x)​ KL散度不对称与不满足三角不等式例子博客https://blog.csdn.net/qq_44702847/article/details/95190388 交叉熵 用于衡量估计模型与真实概率分布之间的差异随机变量X~p(x),q(x)为p(x)的近似概率分布则随机变量X与模型q之间的交叉熵为 H(X,q)−∑xp(x)logq(x)H(X,q)-\sum_xp(x)logq(x)H(X,q)−x∑​p(x)logq(x) 通过数学推导可得,交叉熵随机变量的熵真实分布与模型分布的差距 H(X,q)H(X)D(p∣∣q)H(X,q)H(X)D(p||q)H(X,q)H(X)D(p∣∣q) 分析因为在同一随机变量的前提下真实分布与模型分布的差距即相对熵越小越好所以真实分布与模型分布之间的交叉熵越小估计模型越逼近真实概率分布。 困惑度 在实际应用中经常用困惑度来代替交叉熵衡量语言模型的好坏交叉熵计算的时候会过小溢出给定语言L的样本l1nl1...lnl_1^nl_1...l_nl1n​l1​...ln​L的困惑度PPqPP_qPPq​为 PPq2H(L,q)≈2−1nlogq(l1n)[q(l1n)]−1nPP_q2^{H(L,q)}\approx 2^{-\frac{1}{n}logq(l_1^n)[q(l_1^n)]^{-\frac{1}{n}}}PPq​2H(L,q)≈2−n1​logq(l1n​)[q(l1n​)]−n1​ 小结语言模型设计任务就是寻求与真实概率分布差距较小的模型也就是要寻找交叉熵较小的模型也就是要寻找困惑度较小的模型。 1.4 互信息和双字耦合度 互信息 定义 I(X;Y)H(X)−H(X∣Y)I(X;Y)H(X)-H(X|Y)I(X;Y)H(X)−H(X∣Y) I(x;y)I(x;y)I(x;y)表示在知道了Y的值之后X不确定量的减少程度。 经过推导 I(X;Y)∑x∈X∑y∈Yp(x,y)log⁡p(x,y)p(x)p(y)I(X;Y)\sum_{x\in X}\sum_{y\in Y}p(x,y)\log \frac{p(x,y)}{p(x)p(y)}I(X;Y)x∈X∑​y∈Y∑​p(x,y)logp(x)p(y)p(x,y)​ 例子汉语分词问题利用互信息估计两个汉字结合强度互信息越大表示两个汉字之间的结合越紧密越有可能成词。反之断开的可能性较大。 当两个汉字x和y 的关联度较强时其互信息的值I(x,y)0I(x,y)0I(x,y)0;关系较弱时I(x,y)≈0I(x,y)\approx 0I(x,y)≈0.。当I(x,y)0I(x,y)0I(x,y)0时x与y称为互补分布。 互信息统计的是两个汉字连续出现在一个词中的概率有些汉字单个使用时跟频繁连续与其他字在一起成词的情况较少但是一旦连续在一起出现很有可能会成词。这中情况下两个汉字之间的互信息很小。用互信息来判断该字对应该分开。 因为互信息在上述情况下并不能很好工作。所以就有学者提出双字耦合度的概念。 双字耦合度 Couple(ci,ci1N(cici1)N(cici1)N(C(...ci∣ci1...)))Couple(c_i,c_{i1}\frac{N(c_ic_{i1})}{N(c_ic_{i1})N(C(...c_i|c_{i1}...))}) Couple(ci​,ci1​N(ci​ci1​)N(C(...ci​∣ci1​...))N(ci​ci1​)​) 其中ci,cI1c_i,c_{I1}ci​,cI1​是有序字对。N(cici1)N(c_ic_{i1})N(ci​ci1​)表示字符串ci,cI1c_i,c_{I1}ci​,cI1​成词的次数N(C(...ci∣ci1...))N(C(...c_i|c_{i1}...))N(C(...ci​∣ci1​...))表示字符串ci,cI1c_i,c_{I1}ci​,cI1​不成词(cic_ici​为上一个词的词尾 ci1c_{i1}ci1​为下一个词的词头)的次数。双字偶尔度考虑的是两个字连续出现的情况下两者成词的概率有效规避互信息将二者不连续出现的次数也考虑在计算式中所造成的麻烦。 1.5 噪声信道模型 在信号传输的过程中要进行双重性处理一方面尽量消除冗余另一方面增加冗余利于恢复信号。噪声信道模型的目标就是优化噪声信道中信号的吞吐量和准确率其基本假设是一个信道的输出以一定的概率依赖于输入。 信道容量 Cmax⁡p(x)I(X;Y)C\max_{p(x)}I(X;Y)Cp(x)max​I(X;Y) 依据上式定义我们能够设计一个输入编码器X其概率分布为p(x),其使得输入与输出之间的互信息达到最大值。那么我们的设计就达到了信道的最大传输容量。在语言处理中我们不需要进行编码只需进行解码使得系统的输出更加接近与输入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/84128.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建设网站平台哪里最好微信公众号怎么开通免费

基本类型:基本类型自然不用说了,它的值就是一个数字,一个字符或一个布尔值。引用类型:是一个对象类型,值是什么呢?它的值是指向内存空间的引用,就是地址,所指向的内存中保存着变量所…

北京顺义有网站建设公司吗免费制作网页

题干: 描述 2001年9月11日,一场突发的灾难将纽约世界贸易中心大厦夷为平地,Mr. F曾亲眼目睹了这次灾难。为了纪念“9?11”事件,Mr. F决定自己用水晶来搭建一座双塔。 Mr. F有N块水晶,每块水晶有一个高度&#xff0…

中国手机网站网站ui用什么做

一、https/tls原理 HTTPS访问的三个阶段 第一阶段 认证站点 客户端向站点发起HTTPS请求,站点返回数字证书。客户端通过数字证书验证所访问的站点是真实的目标站点。 第二阶段 协商密钥 客户端与站点服务器协商此次会话的对称加密密钥,用于下一阶段的加…

外贸自助建站哪个好wordpress 页面宽度

用来用去还是觉得SDCMS好用 现在可以算是精通了。呵呵,欢迎交流转载于:https://www.cnblogs.com/qiao198/p/4930575.html

网站整体设计流程房屋装修免费设计出图

2019独角兽企业重金招聘Python工程师标准>>> 偶然想起Java中对象和引用的基本概念,为了加深下对此的理解和认识,特地整理一下相关的知识点,通过具体实例从两者的概念和区别两方面去更形象的认识理解,再去记忆。12一、对…

做一直播网站要多少钱整站优seo排名点击

在Node.js中,主要有三种socket:TCP,UDP和Unix域套接字。以下分别介绍这TCP/UDP的使用方法和示例: TCP socket TCP socket提供了可靠的、面向连接的通信流,适用于需要可靠传输的应用,例如Web浏览器的HTTP请…

贵阳两学一做网站学编程选什么专业

pake协议传输文件magic-wormhole 1 magic-wormhole简介其他介绍 2 安装magic-wormhole3 使用示范发送文件指定虫洞码长度 接收文件 1 magic-wormhole简介 16.7k star 强推,丝滑、简洁、安全的开源工具——magic-wormhole 项目地址:https://github.com/…

红黑网站模板asp网站开发实例pdf

一直以来,用Java管理操作系统进程都是一项艰巨的任务。 这样做的原因是可用的工具和API较差。 老实说,这并非没有道理:Java并非出于此目的。 如果要管理OS进程,则可以使用所需的Shell,Perl脚本。 对于面临更复杂任务的…

媒体电商概念教程推广优化网站排名

最近在做Linux 环境下的一个运行管理通用脚本,用来管理我的Java 小程序启动、停止等操作。虽说这些可以用手敲命令的方式实现,也不复杂,但程序员么,不就喜欢封装点代码,减少操作啥的。先讲下脚本的主要逻辑&#xff0c…

电子商务网站流程设计石家庄建网站

System.out.printf() 是在JDK1.5版开始引入的方法,即在JDK1.5以后的版本才可以使用此函数,printf 方法有 printf(String format, Object ... args) 和 printf(Locale l, String format, Object ... args) 两种重载方式。其实学过C语言的小伙伴应该会觉得…

宁波英文网站建设wordpress 推荐 主题

一、计算机网络体系 (1)OSI分层 (7层) 物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。 (2)TCP/IP分层(4层) 网络接口层、 网际层、运输层、 应用层。 &#xff0…

网站域名什么意思法治建设的网站

MantisBT 是一款基于 Web 的开源缺陷跟踪系统,以下是在 Windows 10 上安装部署 MantisBT 的详细步骤: 1. 安装必要的环境 MantisBT 是一个基于 PHP 的 Web 应用程序,因此需要安装 Web 服务器(如 Apache)、PHP 和数据…

建设银行官方网站下载低代码app开发平台

目录 一、为什么需要带有 subscribe 的 group.id二、我们需要使用commitSync手动提交偏移量吗?三、如果我想手动提交偏移量,该怎么做? 一、为什么需要带有 subscribe 的 group.id 消费概念: Kafka 使用消费者组的概念来实现主题的…

网站商城建设合同免费下载莱芜最好的网站建设公司

网络基础知识 桥接网络 桥接网络是一种网络设计技术,其目的是将两个或多个网络段连接在一起,使它们在逻辑上表现为单个网络。这通过使用网络桥来实现,网络桥工作在数据链路层(第2层),只关心MAC地址&#…

网站搭建准备王野天演员

目录 云原生-Docker安全-容器逃逸&系统内核漏洞 云原生-Docker安全-容器逃逸&docker版本漏洞 CVE-2019-5736 runC容器逃逸(需要管理员配合触发) CVE-2020-15257 containerd逃逸(启动容器时有前提参数) 云原生-Docker安全-容器逃逸&CDK自动化 知识点&#xff1…

查企企官网seo 优化教程

MediaStream方法 MediaStream.addTrack( ) 功能:向流媒体中加入不同的轨 MediaStream.removeTrack( ) 功能:从流媒体中移除不同的轨 MediaStream.getVideoTracks( ) 功能:从流媒体中取出所有的视频轨 MediaStream.getAudioTracks( …

在百度怎么免费制作网站wordpress区别

链表有环的情况一般是链表的尾指向前面的节点而不是null,如head->node1->node2->node3->node4->tail->node2,该链表存在环。判断环是否存在可以借助两个指针,一个指针每次迭代只移动一步,第二个指针每次迭代移动…

wordpress站点信息修改版权html大学设计论文

Vim 是一个上古神器,本篇文章主要持续总结使用 Vim 的过程中不得不了解的一些指令和注意事项,以及持续分享一个开发者不得不安装的一些插件,而关于 Vim 的简介,主题的选择,以及为何使用 vim-plug 来管理插件等内容&…

建设官方网站企业网站宜昌市水利建设工程协会网站

一、nova介绍: Nova 是 OpenStack 最核心的服务,负责维护和管理云环境的计算资源。OpenStack 作为 IaaS 的云操作系统,虚拟机生命周期管理也就是通过 Nova 来实现的。用途与功能 :1) 实例生命周期管理2) 管理计算资源3) 网络和认证管理4)REST…

计划书网站推广的目录怎么做深圳大鹏新区葵涌街道

✍面向读者:所有人 ✍所属专栏:零基础入门VUE专栏https://blog.csdn.net/arthas777/category_12537076.html 目录 v-modelVue 中的 指令 Vue 中的组件 没有构建步骤 随着构建步骤 注册 VUE 组件 Vue 道具 VUE 中的道具声明 在 VUE 中传递 PROP…