Task1 #NLP学习笔记#Datawhale AI训练营#讯飞AI开发者大赛

赛题初体验

十分详细的小白教程,30分钟速通baseline,带我们零基础体验提交作品的全过程!从零入门NLP竞赛 - 飞书云文档 (feishu.cn)

四类NLP任务

  • 序列标注:比如中文分词,词性标注,命名实体识别,语义角色标注等,其共同点是句子中每一个单词都要求模型根据上下文给出一个分类类别。

  • 分类任务:比如我们常见的文本分类、情感计算等,其特点是无论文章多长,总体给出一个分类即可。

  • 句子关系判断:比如问答推理、语义改写、自然语言推理等,特点是给定两个句子,模型判断出两个句子是否具备某种语义关系。

  • 生成式任务:比如机器翻译、文本摘要、写诗造句、看图说话等,特点是输入文本内容后,需要自主生成另外一段文字。

机器翻译

将一种语言的文本自动转换为另一种语言的文本

演变过程:基于规则的方法 ->统计方法 ->深度学习方法

基于规则的机器翻译(1950s-1980s)

  1. 原理:利用语言学家编写的语法规则词典进行翻译

  2. 缺点灵活性适应性较差,计算低效,最严重的缺陷在于其缺乏翻译过程中对上下文信息的建模鲁棒性(系统或算法对于随机噪声、异常情况和攻击等意外干扰的抗干扰能力)不佳

  3. 优点:理论清晰

基于统计的机器翻译(1990s-2000s)

  1. 原理数据驱动,通过分析大量双语文本,自动学习源语言和目标语言之间的对应关系,从而实现翻译

  2. 优点:处理多义词语言变异的效果好

  3. 缺点:依赖大量数据

  4. 主流方法:基于的统计机器翻译(Word-based MT),基于短语的统计机器翻译(Phrase-based SMT)

  5. 步骤:预处理、句子对齐、词对齐、短语抽取、短语特征准备、语言模型训练

基于神经网络的机器翻译(2010s-present)(Neural Machine Translation,简称NMT)

  1. 原理:使用深度神经网络模型(如长短期记忆网络(LSTM)和 Transformer),自动学习源语言和目标语言之间的复杂映射关系,无需人工设计特征或规则。

  2. 优点:在翻译质量速度适应性方面取得了显著进步

数据划分

数据集被划分为三个部分:

  1. 训练集(Training Set)

  2. 开发集(Development Set,也常被称为验证集,Validation Set)

  3. 测试集(Test Set)

训练集

  • 作用训练模型,使模型学习input与output之间的映射关系。模型会根据训练集中的样本调整其参数,以最小化预测误差。

  • 目标:让模型在训练数据上尽可能地拟合好。

开发集/验证集

  • 作用:在模型训练过程中调整超参数选择模型架构以及防止过拟合评估模型在未见过的数据上的表现
  • 目标:选择最佳的模型配置,避免过度拟合,确保泛化能力

测试集

  • 作用:最终评估模型的性能,衡量模型实际应用效果。最接近真实世界数据。

  • 目标:提供一个公正、无偏见的性能估计。

评估指标BLEU-4

BLEU,全称为 Bilingual Evaluation Understudy(双语评估替换),是一种对生成语句进行评估的指标,用于衡量计算机生成的翻译与一组参考译文之间的相似度。这个指标特别关注 n-grams(连续的n个词)的精确匹配,可以被认为是对翻译准确性和流利度的一种统计估计。最终的BLEU分数是一个介于0到1之间的数值。

BLEU-4 特指在计算时考虑四元组(即连续四个词)的匹配情况。

BLEU 评估指标的特点:

  • 优点:计算速度快、计算成本低、容易理解、与具体语言无关、和人类给的评估高度相关。

  • 缺点:不考虑语言表达(语法)上的准确性;测评精度会受常用词的干扰;短译句的测评精度有时会较高;没有考虑同义词或相似表达的情况,可能会导致合理翻译被否定。

baseline 提升与思考

  1. 由于对两个参数N(选择数据集的前N个样本进行训练)和N_EPOCHS(训练次数)进行了增大,使得训练的数据更多,所以翻译的效果提升了两倍。

  2. 这两个参数的调整是存在“界”的,超过这个“界”,效果反而会下降。根据先前学过的机器学习的些许相关知识,我的思考与想法是,模型的损失函数存在一个最小值,我们通过不断调整,来获得合适参数,来使得损失函数最小,所以,这两个参数调得越大不一定越好,要合适才好。当然,太小的话,也远远达不到好效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/47613.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL运维实战之Clone插件(10.1)使用Clone插件

作者:俊达 clone插件介绍 mysql 8.0.17版本引入了clone插件。使用clone插件可以对本地l或远程的mysql实例进行clone操作。clone插件会拷贝innodb存储引擎表,clone得到的是原数据库的一个一致性的快照,可以使用该快照数据来启动新的实例。cl…

高性能内存对象缓存Memcached原理与部署

Memcached 原理 Memcached 是一个高性能、分布式内存对象缓存系统,主要用于减轻数据库负载、提高Web应用的响应速度和性能。其核心思想是利用内存存储数据,并通过键值对的方式快速读取。以下是Memcached的主要原理: 数据存储 Memcached 使…

C++--copy

copy 拷贝,把源迭代器区间的值拷贝到目的迭代器。使用者保证目的空间足够。时间复杂度O(n)。 函数声明如下: template<class InputIterator, class OutputIterator> OutputIterator copy( InputIterator _First, //源开始迭代器 InputIterator _Last, //源结束迭代…

SpringMVC注解全解析:构建高效Web应用的终极指南 (下)

一. 引言 在上篇文章中&#xff0c;我们介绍了几个重要的SpringMVC注解&#xff1a; SpringBootApplication&#xff1a;Spring Boot项目的启动类注解。RequestMapping&#xff1a;用于映射URL到控制器类或方法&#xff0c;支持多种请求方式。RequestParam&#xff1a;用于绑…

UniVue@v1.5.0版本发布:里程碑版本

前言 以后使用UniVue都推荐使用1.5.0以后的版本&#xff0c;这个版本之后&#xff0c;更新的速度将会放缓。 希望这个框架能够切实的帮助大家更好的开发游戏&#xff0c;做出一款好游戏&#xff01;本开源项目采用的开源协议为MIT协议&#xff0c;完全开源化&#xff0c;以后也…

基于Python+Django+MySQL的心理咨询预约系统

心理咨询预约系统 DjangoMySQL 基于PythonDjangoMySQL的心理咨询预约系统 项目主要依赖Django3.2&#xff0c;MySQL 支持随机验证码生成与登录验证 简介 基于PythonDjangoMySQL的心理咨询预约系统通过连接数据库获取数据&#xff0c;登录新增随机数字验证码验证。具体可以看…

基于matlab的深度学习案例及基础知识专栏前言

专栏简介 内容涵盖深度学习基础知识、深度学习典型案例、深度学习工程文件、信号处理等相关内容&#xff0c;博客由基于matlab的深度学习案例、matlab基础知识、matlab图像基础知识和matlab信号处理基础知识四部分组成。 一、 基于matlab的深度学习案例 1.1、matlab:基于模…

量化机器人如何提升交易透明度?

量化机器人通过其高度的自动化和数据驱动的交易决策&#xff0c;为金融市场带来了前所未有的交易透明度。这些机器人使用先进的算法来分析市场数据&#xff0c;并根据这些数据作出交易决策&#xff0c;从而减少了人为偏见和操纵的可能性&#xff0c;提高了交易的公正性和透明度…

【机器学习】机器学习与图像分类的融合应用与性能优化新探索

文章目录 引言第一章&#xff1a;机器学习在图像分类中的应用1.1 数据预处理1.1.1 数据清洗1.1.2 数据归一化1.1.3 数据增强 1.2 模型选择1.2.1 卷积神经网络1.2.2 迁移学习1.2.3 混合模型 1.3 模型训练1.3.1 梯度下降1.3.2 随机梯度下降1.3.3 Adam优化器 1.4 模型评估与性能优…

精确控制依赖:使用Yarn安装特定commit的包

在软件开发过程中&#xff0c;依赖管理是一个关键环节。Yarn 是一个流行的 JavaScript 包管理工具&#xff0c;它不仅提供基本的包安装功能&#xff0c;还支持更高级的依赖管理技巧&#xff0c;比如安装特定目录下的特定 commit。本文将详细介绍如何使用 Yarn 安装一个包的特定…

Qt支持LG高级汽车内容平台

Qt Group与LG 电子&#xff08;简称LG&#xff09;正携手合作&#xff0c;将Qt软件框架嵌入其基于 webOS的ACPLG车载娱乐平台&#xff0c;用于应用程序开发。该合作旨在让原始设备制造商&#xff08;OEM&#xff09;的开发者和设计师能为汽车创建更具创新性的沉浸式汽车内容流媒…

【深度学习】inpaint图像中的alpha混合图的边缘处理

比如原图是&#xff1a; 红圈内就是文字水印&#xff0c;经过inpaint后得到图和原图混合&#xff0c;如何处理边界呢&#xff0c;这个代码可以干这事&#xff1a; 越是中心就直接用inpaint图&#xff0c;否则就用原图&#xff0c;这样进行alpha混合。 import numpy as np i…

uniapp:国家、省市区,4级联动

使用uview的Select 列选择器 选择器完成国家&#xff0c;省市区&#xff0c;4级联动 要求后台数据格式&#xff1a; list: [{label: 中国,value: 1,children: [{label: 河南省,value: 2,children: [{label: 郑州市,value: 3,children: [{label: 中原区,value: 4},{label: 郑东…

计算机网路入门 -- 网络性能指标

计算机网路入门 – 网络性能指标 1.性能指标 计算机网络将通过速率、带宽、吞吐量、时延、时延带宽积、往返时延RTT、以及信道利用率几个维度来描述其性能指标。 2.指指标介绍 2.1 速率 2.1.1 概念 速率即数据率或数据传输率。其描述了连接在网络上的主机在数字信道上传送…

Re:从零开始的C++世界——类和对象(下)

文章目录 前言1.再谈构造函数&#x1f34e;构造函数体赋值&#x1f34e;初始化列表&#x1f34e;特性&#x1f34c;特性一&#x1f34c;特性二&#x1f34c;特性三&#x1f34c;特性四&#x1f34c;特性五 &#x1f34e;explicit 关键字 2.static成员&#x1f34e;概念&#x1…

2.4G收发芯片XL2412P,集成单片机 ,通信距离可达110米

XL2412P芯片是一款高性能低功耗的SOC集成无线收发芯片&#xff0c;由RF芯片和32位M0核MCU集成&#xff0c;工作在2.400~2.483GHz世界通用ISM频段。XL2412P为SSOP16封装&#xff0c;正常工作电压范围&#xff1a;1.7~3.6V&#xff0c;正常工作温度范围-40~85℃。XL2412P发射输出…

JWT 认证校验 从理论到实战

一、JWT理论部分 1.JWT概述 JWT&#xff08;JSON Web Token&#xff09;是一个开放标准&#xff08;RFC 7519&#xff09;&#xff0c;它定义了一种紧凑且自包含的方式&#xff0c;用于在各方之间以 JSON 对象的形式安全地传输信息。这种信息可以被验证和信任&#xff0c;因为…

基于Docker部署常用Paas组件

一、docker部署paas组件 安装之前需要把本地的docker环境的日志都集中到固定的目录下&#xff0c;避免root目录打满&#xff0c;我这里挂载到了/data/docker目录下 二、paas组件搭建 1、MySQL step1&#xff1a;创建目录 mkdir -p /data/mysql-data mkdir -p /data/mysqlstep…

编程中的智慧之设计模式二

设计模式&#xff1a;深度解析与实战应用 在上一篇文章中&#xff0c;我们探讨了创建型模式、结构型模式和行为模式中的一些常用模式及其Java实现。本篇将继续深入探讨设计模式&#xff0c;重点介绍更多的行为模式以及架构模式在实际开发中的应用。 行为模式 责任链模式&…

MQTT服务端EMQX开源版安装和客户端MQTTX介绍

一、EMQX是什么 EMQX 是一款开源的大规模分布式 MQTT 消息服务器&#xff0c;功能丰富&#xff0c;专为物联网和实时通信应用而设计。EMQX 5.0 单集群支持 MQTT 并发连接数高达 1 亿条&#xff0c;单服务器的传输与处理吞吐量可达每秒百万级 MQTT 消息&#xff0c;同时保证毫秒…