国家网站icp备案查询前端做的比较好的网站

bicheng/2026/1/22 23:01:27/文章来源:
国家网站icp备案查询,前端做的比较好的网站,专业网站建设设计,产品页面设计模板python-pytorch使用日志 1. optimizer.zero_grad()和model.zero_grad()的区别2. cbow和skip-gram的训练数据格式3. 获取cbow和skip-gram训练后的中文词向量4. 获取到词向量后可以做什么5. 余弦相似度结果的解释 1. optimizer.zero_grad()和model.zero_grad()的区别 都是清空模… python-pytorch使用日志 1. optimizer.zero_grad()和model.zero_grad()的区别2. cbow和skip-gram的训练数据格式3. 获取cbow和skip-gram训练后的中文词向量4. 获取到词向量后可以做什么5. 余弦相似度结果的解释 1. optimizer.zero_grad()和model.zero_grad()的区别 都是清空模型的梯度参数如果模型中有多个model训练时建议使用model.zero_grad()如果只有一个模型训练optimizer.zero_grad()和model.zero_grad()意义都一样 2. cbow和skip-gram的训练数据格式 cbow格式 data1 [] for i in range(2, len(raw_text) - 2):context [raw_text[i - 2], raw_text[i - 1],raw_text[i 1], raw_text[i 2]]target raw_text[i]data1.append((context, target))cbow最终格式 [([‘从零开始’, ‘Zookeeper’, ‘高’, ‘可靠’], ‘开源’), ([‘Zookeeper’, ‘开源’, ‘可靠’, ‘分布式’], ‘高’), ([‘开源’, ‘高’, ‘分布式’, ‘一致性’], ‘可靠’), ([‘高’, ‘可靠’, ‘一致性’, ‘协调’], ‘分布式’), ([‘可靠’, ‘分布式’, ‘协调’, ‘服务’], ‘一致性’)] skip-gram格式 data3 [] window_size12 for i,word in enumerate(raw_text):target raw_text[i]contextsraw_text[max(i - window_size1, 0): min(i window_size1 1, len(raw_text))]for context in contexts:if target!context:data3.append((context,target)) data3,len(data3)或者类似于def create_skipgram_dataset(sentences, window_size4):data [] # 初始化数据for sentence in sentences: # 遍历句子sentence sentence.split() # 将句子分割成单词列表for idx, word in enumerate(sentence): # 遍历单词及其索引# 获取相邻的单词将当前单词前后各 N 个单词作为相邻单词for neighbor in sentence[max(idx - window_size, 0): min(idx window_size 1, len(sentence))]:if neighbor ! word: # 排除当前单词本身# 将相邻单词与当前单词作为一组训练数据data.append((neighbor, word))return dataskip-gram最终格式 ([(‘Zookeeper’, ‘从零开始’), (‘开源’, ‘从零开始’), (‘从零开始’, ‘Zookeeper’), (‘开源’, ‘Zookeeper’), (‘高’, ‘Zookeeper’), (‘从零开始’, ‘开源’), (‘Zookeeper’, ‘开源’), (‘高’, ‘开源’), (‘可靠’, ‘开源’), (‘Zookeeper’, ‘高’), (‘开源’, ‘高’), (‘可靠’, ‘高’), (‘分布式’, ‘高’), (‘开源’, ‘可靠’)] 3. 获取cbow和skip-gram训练后的中文词向量 前提是需要使用中文去训练搭建的模型可以参考 https://blog.csdn.net/Metal1/article/details/132886936 https://blog.csdn.net/L_goodboy/article/details/136347947 如果使用pytorch的Embeding的模型获取的就是embeding层 class SkipGramModel(nn.Module):def __init__(self, vocab_size, embedding_dim):super(SkipGramModel, self).__init__()self.embedding nn.Embedding(vocab_size, embedding_dim)self.linear nn.Linear(embedding_dim, vocab_size)def forward(self, center_word):embedded self.embedding(center_word)output self.linear(embedded)输出每个词的嵌入向量 for word, idx in word_to_idx.items(): print(f{word}: {model.embedding.weight[:,idx].detach().numpy()})如果使用原生的写的模型获取的就是第一层的线性层 import torch.nn as nn # 导入 neural network class SkipGram(nn.Module):def __init__(self, voc_size, embedding_size):super(SkipGram, self).__init__()# 从词汇表大小到嵌入层大小维度的线性层权重矩阵self.input_to_hidden nn.Linear(voc_size, embedding_size, biasFalse) # 从嵌入层大小维度到词汇表大小的线性层权重矩阵self.hidden_to_output nn.Linear(embedding_size, voc_size, biasFalse) def forward(self, X): # 前向传播的方式X 形状为 (batch_size, voc_size) # 通过隐藏层hidden 形状为 (batch_size, embedding_size)hidden self.input_to_hidden(X) # 通过输出层output_layer 形状为 (batch_size, voc_size)output self.hidden_to_output(hidden) return output 输出每个词的嵌入向量 for word, idx in word_to_idx.items(): print(f{word}: {model.input_to_hidden .weight[:,idx].detach().numpy()})4. 获取到词向量后可以做什么 “具有相同上下文的词语包含相似的语义”使得语义相近的词在映射到欧式空间后中具有较高的余弦相似度。 语义相似性度量词向量能够将语义上相近的词映射到向量空间中相近的位置。因此可以通过计算两个词向量的余弦相似度或欧氏距离来度量它们之间的语义相似性。这在诸如词义消歧、同义词替换等任务中非常有用。 文本分类与情感分析在文本分类任务如新闻分类、电影评论情感分析中词向量可以作为特征输入到分类器中。通过将文本中的每个词表示为向量并聚合这些向量例如通过取平均值或求和可以得到整个文本的向量表示进而用于分类或情感分析。 命名实体识别在命名实体识别NER任务中词向量可以帮助模型识别文本中的特定类型实体如人名、地名、组织机构名等。通过将词向量与序列标注模型如BiLSTM-CRF结合使用可以提高NER的性能。 问答系统在问答系统中词向量可以用于表示问题和答案的语义信息。通过计算问题和答案的词向量之间的相似度可以找出与问题最匹配的答案。 机器翻译在机器翻译任务中词向量可以用于捕捉源语言和目标语言之间的语义对应关系。通过训练跨语言的词向量表示如跨语言词嵌入可以实现更准确的翻译结果。 文本生成在文本生成任务如文本摘要、对话生成等中词向量可以作为生成模型的输入或隐层表示。通过利用词向量中的语义信息模型可以生成更自然、更相关的文本内容。 知识图谱与实体链接在知识图谱构建和实体链接任务中词向量可以用于表示实体和概念之间的语义关系。通过将实体和概念映射到向量空间可以方便地进行实体识别和关系推理。 5. 余弦相似度结果的解释 余弦相似度的结果范围通常在-1到1之间这个范围可以用来解释两个向量之间的相似程度 值为1当余弦相似度为1时表示两个向量完全重合即它们指向的方向完全相同这意味着两个向量代表的文本或概念在语义上几乎完全相同。 值为-1当余弦相似度为-1时表示两个向量完全相反即它们指向的方向完全相反。在文本相似度的上下文中这通常意味着两个文本在语义上非常对立或相反。 值为0当余弦相似度为0时表示两个向量正交即它们之间的夹角为90度。在文本相似度的语境中这通常意味着两个文本在语义上没有直接的联系或相似性。 值在0到1之间当余弦相似度在0和1之间时表示两个向量之间的夹角小于90度但不完全重合。数值越接近1表示两个向量在方向上的相似性越高即两个文本在语义上的相似性越高。 值在-1到0之间当余弦相似度在-1和0之间时表示两个向量之间的夹角大于90度但小于180度。数值越接近-1表示两个向量在方向上的对立性越高即两个文本在语义上的对立性越高 如 其中trained_vector_dic是通过模型获取的词向量字典 余弦相似度 trained_vector_dic{} for word, idx in word_to_idx.items(): # 输出每个词的嵌入向量trained_vector_dic[word]model.embedding.weight[idx]import torch import torch.nn.functional as F cosine_similarity1 F.cosine_similarity(torch.tensor(trained_vector_dic[保持数据].unsqueeze(0)), torch.tensor(trained_vector_dic[打印信息]).unsqueeze(0)) print(cosine_similarity1)结果如下表名不相似 tensor([-0.0029])点积相似度 dot_product torch.dot(torch.tensor(trained_vector_dic[保持数据]), torch.tensor(trained_vector_dic[打印信息])) x_length torch.norm(torch.tensor(trained_vector_dic[保持数据])) y_length torch.norm(torch.tensor(trained_vector_dic[打印信息])) similarity dot_product / (x_length * y_length) print(similarity)结果如下表名不相似与余弦结果一致 tensor([-0.0029])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/87708.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

济源网站建设电话jsp网站地图生成器

Redis的基本数据类型 redis的基本数据类型(value): string,普通字符串 hash(哈希),适合存储对象 list(列表),按照插入顺序排序,可以由重复的元素 set(无序集合),没有重复的元素 sorted set(有序集合)&…

企业网站策划怎么样部队网站建设建议

Android TV 上的谷歌语音助手是一个强大的工具,它允许用户通过语音命令来控制电视设备、搜索内容、管理智能家居设备等。下面是一些关于在 Android TV 上使用谷歌语音助手的实战建议: 启用和设置: 确保你的 Android TV 设备已经连接到了互联…

wordpress网站好用吗wordpress主题 红木

一题目描述: 给定一个数组,只有一个数字出现一次,其余都是两次,判断那个数字 思路: 不断取出数据进行异或,最后一个数字,因为相同的数字会抵消代码: public class Solution {public …

网站图片自动下载打开网站弹出广告js

3. 基本数据与运算 3.6 运算符 3.6.1 算术运算符 在 Java 中,算术运算符包含:、-、*、/、% public class ArithmeticOperator { public static void main(String[] args) { int a 10; // 定义了一个整型类型的变量 a,它的值是 10 int b …

建个公司网站一年多少钱彩票网站开发需求文档

论文笔记整理:周虹廷,浙江大学研究生。研究方向:知识图谱,图表示学习等。论文链接:https://arxiv.org/pdf/2001.06137.pdf本文是发表在ICLR2020上针对图数据做节点半监督分类任务的论文。现有的算法解决图上节点分类问…

长宁区网站设计建设基础建设股票

kafka可视化工具 随着科技发展,中间件也百花齐放。平时我们用的redis,我就会通过redisInsight-v2 来查询数据,mysql就会使用goland-ide插件来查询,都挺方便。但是kafka可视化工具就找了半天,最后还是觉得redpandadata…

联盟网站建设php网站开发模板

在C语言里printf是什么意思?怎么用??1,printf()函数是格式化输出函数, 一般用于向标准输出设备按规定格式输出信息。2,printf()函数的调用格式为: printf("", )。3,格式输出,它是c语言中产生格式化输出的函…

军事网站建设怎么打wordpress修改首页模板文件

CSS弹性盒模型 display:flex;常用参数flex-directionjustify-contentalign-itemsflex-wrapflex-flowalign-contentorderflex-growflex-shrinkflex-basis 常见的布局1. 水平居中2. 垂直居中3. 水平垂直居中4. 等分布局5. 响应式布局6. 网格布局 常见的布局封装 display:flex;常用…

贵阳公司网站建设网站推广软文案例

在今年 3 月,Ordinals 凭空问世,定义了一套在比特币网络运行的序数协议,使得 Token 和 NFT 能在比特币网络上实现并稳定运行,拉来了比特币铭文市场的新序幕。而在此后,在包括 BRC20 等在内的一系列应用的出现&#xff…

网站建设主题的确定如何做资源论坛网站

Migration和Navicat是两个不同类型的产品,各自在特定场景下有各自的优势。 Migration主要针对的是数据的迁移或复制,从一个数据库迁移到另一个数据库,或者从一个环境复制到另一个环境。它主要关注的是数据的迁移和复制过程,不提供…

广州响应式网站建设深圳商标设计公司vi设计

1. 介绍 中文分词是将连续的中文文本切分成一个个独立的词语的过程,是中文文本处理的基础。IK分词器是一个高效准确的中文分词工具,采用了"正向最大匹配"算法,并提供了丰富的功能和可定制选项。 2. IK分词器的特点 细粒度和颗粒…

中国站长之家网站百捷网站建设工资

1 毕业论文选题的原则 毕业论文选题一般要求满足以下原则: ①开拓性:前人没有专门研究过或虽已研究但尚无理想的结果,有待进一步的探讨和研究,或是学术界有分歧,有必要深入研究探讨的问题;…

广州网站制作公司电话wordpress公益

小哥哥小姐姐觉得有用点个赞呗! C#指定窗口显示位置的方法 1.使用StartPosition MainForm mainform; mainformnew MainForm (); dlgCtrl.StartPosition FormStartPosition.Manual;下面是FormStartPosition里边的定义与解释 // 指定窗体的初始位置。public …

网站建设公司推销免费不收费的app

逻辑回归的代价函数通常使用交叉熵损失来定义。这种损失函数非常适合于二元分类问题。 本篇来推导一下逻辑回归的代价函数。 首先,我们在之前了解了逻辑回归的定义:逻辑回归模型是一种用于二元分类的模型,其预测值是一个介于0和1之间的概率…

建立soho公司网站关于电子商务的知识

Hello everybody!今天给大家介绍一道我认为比较经典的编程练习题&#xff0c;之所以介绍它是因为这道题涉及到二维数组的构建&#xff0c;如果用C语言动态构建二维数组是比较麻烦的&#xff0c;而用C中STL的vector<vector<int>>,就可以立马构建出来&#xff0c;这也…

搜索引擎优化答案系统优化的意义

先说情况&#xff0c;大专毕业&#xff0c;18年通过校招进入湖南某软件公司&#xff0c;干了接近6年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&#xf…

自己没有货源怎么开网店苏州网站排名优化价格

一、前言 摄像机在虚幻中的应用是最常见的。如通常在游戏或应用中会常常出现需要切换不同视角的情况、摄像机拉近缩小等&#xff0c;这个在虚幻中是怎么实现的呢。 二、实现视点切换 2.1、提前设置场景的视点&#xff1a;如图2.1.1所示添加一个摄像机视点到关卡场景中&#x…

专业的企业网站建设公司推广网站注册赚佣金

算法沉淀——优先级队列 01.最后一块石头的重量02.数据流中的第 K 大元素03.前K个高频单词04.数据流的中位数 优先队列&#xff08;Priority Queue&#xff09;是一种抽象数据类型&#xff0c;它类似于队列&#xff08;Queue&#xff09;&#xff0c;但是每个元素都有一个关联的…

网站开发的主要特点网站维护与推广

在 Ubuntu 系统中&#xff0c;您可以通过几种方式来检查系统是否包含显卡&#xff0c;以及显卡的详细信息。以下是一些常用的方法&#xff1a; lspci 命令&#xff1a; 打开终端。输入 lspci | grep VGA 命令。这将显示系统中所有的 VGA 兼容设备&#xff0c;通常是您的显卡。 …