郑州专业网站制作的公司哪家好最大的免费网站建设

news/2025/9/22 21:38:59/文章来源:
郑州专业网站制作的公司哪家好,最大的免费网站建设,网站开发及服务器总共多少钱,关键词搜索排名工具今年5月#xff0c;Facebook AI研究院#xff08;FAIR#xff09;发表了他们的研究成果fairseq#xff0c;在fairseq中#xff0c;他们使用了一种新型的卷积神经网络来做语言翻译#xff0c;比循环神经网络的速度快了9倍#xff0c;而且准确性也是现有模型中最高的。此外… 今年5月Facebook AI研究院FAIR发表了他们的研究成果fairseq在fairseq中他们使用了一种新型的卷积神经网络来做语言翻译比循环神经网络的速度快了9倍而且准确性也是现有模型中最高的。此外他们在GitHub公布了fair序列建模工具包的源代码和训练好的系统其他的研究者可以在此基础上建立自己的关于翻译、文本总结和其他任务的模型。 详情可参见快9倍Facebook开源机器学习翻译项目fairseq一文。 日前Facebook AI研究团队又在GitHub上开源了fairseq PyTorch版本。 相关介绍 fairseq是Facebook AI研究院发布的一个序列到序列的学习工具它的原作者排名不分先后是Sergey Edunov、Myle Ott和Sam Gross。该工具包能实现 Convolutional Sequence to Sequence Learning地址https://arxiv.org/abs/1705.03122中描述的全卷积模型并能在一台机器上进行多GPU训练也能在CPU和GPU上快速产生束搜索(beam search)。在开源的数据中他们提供了英译法和英译德的预训练模型。 引用 如果你的论文中用了FAIR的相关代码可以这样引用 inproceedings{gehring2017convs2s,  author     {Gehring, Jonas, and Auli, Michael and Grangier, David and Yarats, Denis and Dauphin, Yann N},  title     {Convolutional Sequence to Sequence Learning},  booktitle {Proc. of ICML},  year       2017, } 工具和安装 macOS或是Linux系统的电脑 要是想训练新的模型需要用到NVIDIA GPU和NCCLhttps://github.com/NVIDIA/nccl Python 3.6 安装PyTorchhttp://pytorch.org/ 目前的fairseq-py需要从GitHub库中获得PyTorch有多种方式安装它。我们建议利用Miniconda3执行如下的步骤。 1、安装Miniconda3https://conda.io/miniconda.html激活 Python 3环境 2、安装PyTorch conda install gcc numpy cudnn nccl conda install magma-cuda80 -c soumith pip install cmake pip install cffi git clone https://github.com/pytorch/pytorch.git cd pytorch git reset --hard a03e5cb40938b6b3f3e6dbddf9cff8afdff72d1b git submodule update --init pip install -r requirements.txt NO_DISTRIBUTED1 python setup.py install 3、在GitHub中复制和执行如下代码来安装fairseq-py pip install -r requirements.txt python setup.py build python setup.py develop 快速开始 你将需要使用到如下的命令 python preprocess.py: 数据预处理: 构造词汇和二进制训练数据 python train.py: 在一个或多个GPU上训练新的模型 python generate.py: 用训练好的模型翻译预处理之后的数据 python generate.py -i:用训练好的模型翻译新的文本 python score.py: 通过与参考译文对比给出生成译文的BLEU分数 评估预训练模型 首先下载预训练好的模型和词汇 $ curl https://s3.amazonaws.com/fairseq-py/models/wmt14.en-fr.fconv-py.tar.bz2 | tar xvjf - 模型中用的是BPE词汇https://arxiv.org/abs/1508.07909用户必须在翻译之前将编码应用到源文本。可以用apply_bpe.py 脚本中的wmt14.en-fr.fconv-cuda/bpecodes文件。是延续标记原始文本可以通过sed s/ //g来恢复此外把 --remove-bpe 标记传递到generate.py也有同样的作用。在生成BPE词汇之前。输入文本需要用mosesdecoder中的tokenizer.perl来标记。 下面是利用python generate.py -i产生翻译的例子 beam size为5 $ MODEL_DIRwmt14.en-fr.fconv-py $ python generate.py -i \ --path $MODEL_DIR/model.pt $MODEL_DIR \ --beam 5 | [en] dictionary: 44206 types | [fr] dictionary: 44463 types | model fconv_wmt_en_fr | loaded checkpoint /private/home/edunov/wmt14.en-fr.fconv-py/model.pt (epoch 37) Why is it rare to discover new marine mam mal species ? S       Why is it rare to discover new marine mam mal species ? O       Why is it rare to discover new marine mam mal species ? H       -0.08662842959165573    Pourquoi est-il rare de découvrir de nouvelles espèces de mammifères marins ? A       0 1 3 3 5 6 6 10 8 8 8 11 12 训练新模型 数据预处理 fairseq-py工具包中包含用于IWSLT 2014德转英语料库的一个预处理脚本样例。先将数据进行预处理和二进制编码 $ cd data/ $ bash prepare-iwslt14.sh $ cd .. $ TEXTdata/iwslt14.tokenized.de-en $ python preprocess.py --source-lang de --target-lang en \  --trainpref $TEXT/train --validpref $TEXT/valid --testpref $TEXT/test \  --thresholdtgt 3 --thresholdsrc 3 --destdir data-bin/iwslt14.tokenized.de-en 这将会得到能够用于训练模型的二进制数据。 训练 用python train.py来训练新的模型下面是能很好的适于 IWSLT 2014数据集中的一些样例设置。 $ mkdir -p checkpoints/fconv $ CUDA_VISIBLE_DEVICES0 python train.py data-bin/iwslt14.tokenized.de-en \  --lr 0.25 --clip-norm 0.1 --dropout 0.2 --max-tokens 4000 \  --arch fconv_iwslt_de_en --save-dir checkpoints/fconv 默认情况下python train.py会占用电脑中所有可用的GPU可以用CUDA_VISIBLE_DEVICES环境来选择特定的GPU或者改变使用的GPU数目。 有一点需要注意batch大小是基于每个batch的最大token数来设置的你需要基于系统中可用的GPU内存选取一个稍小的值。 生成翻译 模型训练好之后就能利用python generate.py用于二进制数据或python generate.py -i用于未处理文本生成翻译了。 $ python generate.py data-bin/iwslt14.tokenized.de-en \  --path checkpoints/fconv/checkpoint_best.pt \  --batch-size 128 --beam 5  | [de] dictionary: 35475 types  | [en] dictionary: 24739 types  | data-bin/iwslt14.tokenized.de-en test 6750 examples  | model fconv  | loaded checkpoint trainings/fconv/checkpoint_best.pt  S-721   danke .  T-721   thank you .  ... 如果只想用一个CPU加入--cpu标记。可以通过--remove-bpe移除掉BPE标记。 训练好的模型 目前开源的全卷积序列到序列模型如下 wmt14.en-fr.fconv-py.tar.bz2https://s3.amazonaws.com/fairseq-py/models/wmt14.en-fr.fconv-py.tar.bz2: 用于WMT14英译法的模型包含词汇 wmt14.en-de.fconv-py.tar.bz2https://s3.amazonaws.com/fairseq-py/models/wmt14.en-de.fconv-py.tar.bz2: 用于WMT14英译德的模型包含词汇 针对以上模型已经预处理和编码过的测试集如下 wmt14.en-fr.newstest2014.tar.bz2https://s3.amazonaws.com/fairseq-py/data/wmt14.en-fr.newstest2014.tar.bz2: 用于WMT14英译法的newstest2014测试集 wmt14.en-fr.ntst1213.tar.bz2https://s3.amazonaws.com/fairseq-py/data/wmt14.en-fr.ntst1213.tar.bz2: 用于WMT14英译法的newstest2012和newstest2013测试集 wmt14.en-de.newstest2014.tar.bz2https://s3.amazonaws.com/fairseq-py/data/wmt14.en-de.newstest2014.tar.bz2: 用于WMT14英译德的newstest2014测试集 下面是在一块GTX-1080ti上利用测试集产生结果的样例英译德运行在batch模式下 $ curl https://s3.amazonaws.com/fairseq-py/models/wmt14.en-fr.fconv-py.tar.bz2 | tar xvjf - -C data-bin $ curl https://s3.amazonaws.com/fairseq-py/data/wmt14.en-fr.newstest2014.tar.bz2 | tar xvjf - -C data-bin $ python generate.py data-bin/wmt14.en-fr.newstest2014  \  --path data-bin/wmt14.en-fr.fconv-py/model.pt \  --beam 5 --batch-size 128 --remove-bpe | tee /tmp/gen.out ... | Translated 3003 sentences (95451 tokens) in 81.3s (1174.33 tokens/s) | Generate test with beam5: BLEU4 40.23, 67.5/46.4/33.8/25.0 (BP0.997, ratio1.003, syslen80963, reflen81194) # Scoring with score.py: $ grep ^H /tmp/gen.out | cut -f3- /tmp/gen.out.sys $ grep ^T /tmp/gen.out | cut -f2- /tmp/gen.out.ref $ python score.py --sys /tmp/gen.out.sys --ref /tmp/gen.out.ref BLEU4 40.23, 67.5/46.4/33.8/25.0 (BP0.997, ratio1.003, syslen80963, reflen81194) 本文作者Non 本文转自雷锋网禁止二次转载原文链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910460.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SUDO提权

今天在NSS上刷题,写这道sudo提权时发现一个大佬wp质量很高,跟着思路记录一下,顺便向大佬致敬。Sudo 提权 向大佬致敬,太厉害了,四个月全勤,估计是写完题顺带写了wp[HZNUCTF 2023 final]ezgo 解题思路 Please POS…

2025.9.19 总结

这一场太逆天了,全靠部分分拿长郡榜二。 T1 逆序对这个东西很好搞,你只需要从前往后加就行了,然后你发现一个数只会和他最前面比它大的数产生贡献。 因为他前面比他大的数前面可能会有比它还大的,但是这样显然这个…

可以上传自己做的视频的网站吗网站建设公司星海网络

[TOC]为什么要有相对跳转和绝对跳转?顺序执行:指令一条一条按照顺序往下执行,比如变量的定义和赋值都是按照顺序执行的。跳转执行:当指令执行到当前位置后跳转到其他位置执行。比如,在主函数中调用其他函数就是典型的跳…

南京哪个网站做物业贷vue.js做静态网站

🏆作者:科技、互联网行业优质创作者 🏆专注领域:.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造 🏆欢迎关注我(Net数字智慧化基地),里面…

国外儿童社区网站模板网站建设的费用

演示站点: https://ai.uaai.cn 对话模块 官方论坛: www.jingyuai.com 京娱AI 一、AI技术创业在线辅导业务有哪些机会? 人工智能(AI)技术作为当今科技创新的前沿领域,为创业者提供了广阔的机会和挑战。随着…

东莞网站建设做网站dw可以做视频网站么

原文地址:http://www.goodfav.com/zh/app-development-tutorials-3559.html 移动应用程序开发是大企业和创意的个人和小团队开发,是一个有很多商业机会的领域之一。它可能需要多次尝试设计来实施一个出类拔萃的应用程序,但是,如果…

自媒体图片素材网站系统开发过程

我试图从Mathematica中获取一张图片.我尝试评估一些使用包中的方法生成图形的Mathematica代码.如果我将代码粘贴到Mathematica Notebook,则会正确生成图形.所以我的问题:如何将这些图形转换为Java ???这是我的示例代码:ml MathLinkFactory.createKer…

阿里云做的网站怎么样宁波网站建设公司哪里有

在Vue中,防抖和节流是两种常用的优化技术,用于限制事件的触发频率,以提高页面性能。 防抖(Debounce)是指在事件被触发后,等待一段时间后再执行回调函数。如果在这段等待时间内,事件又被触发&am…

建立一个网站大约要多少钱个人工作室和公司区别

前言 在上一篇文章中我们介绍了在计算机底层视角下的虚拟内存和操作系统在用户层所进行的各个分层,在这篇文章我们就要开始尝试书写多线程代码了,其实在c11后c就提供供了线程类给我们使用,c线程类其实主要是对c操作多线程的函数进行了封装,本质上其实是…

详细介绍:无公网 IP 访问群晖 NAS:神卓 N600 的安全解决方案(附其他方法风险对比)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

网站开发与设计结课大作业汽车可以做哪些广告视频网站

一、命名空间概念1、命名空间(name space)名称空间是存放名字的地方。若变量x1,1存放在内存中,命名空间是存放名字x、x与1绑定关系的地方。2、名称空间加载顺序python test.py#1、python解释器先启动,因而首先加载的是:内置名称空…

2025.9.18 总结

T1 就是有一个 dp 是 f i 0/1 0/1 表示有 i 个数,异或和是不是 0,异或和是不是等于最后一个数,然后矩阵加速就没了。 T2 会发现这个东西你可以贪心维护,每次能阔就阔不能阔就退出。然后判一下相邻两个颜色块之间的…

越南文识别技术:将纸质文档和信息快速、准确地转化为可编辑、可检索的数字数据

在数字化浪潮席卷全球的今天,如何将海量的纸质文档和信息快速、准确地转化为可编辑、可检索的数字数据,已成为一项关键挑战。光学字符识别(OCR)技术正是解决这一挑战的核心。作为OCR技术的一个重要分支,越南文识别…

#JAVA作业

1、什么样的方法应该用static修饰?不用static修饰的方法往往具有什么特性?Student的getName应该用static修饰吗? 答:用static修饰的方法多为工具类方法、工厂方法等不依赖对象状态的方法;不用static修饰的是实例方…

C#编程练习:使用队列存储消息,一次性存10条消息,每隔一段时间打印一条消息控制台打印消息时要有明显停顿感 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

东莞网站建设企业做彩票网站犯法

1.1 屏蔽罩作用 1.1.1 屏蔽电子信号,防止外界的干扰或内部向外的辐射: 一般见于通信类电路PCB,主要一个无线通信产品上有的敏感器件、模拟、数字电路、DCDC电源电路,都需屏蔽隔离,是为了不影响其它电路,也有防止其它电…

天津河西做网站贵吗市场营销手段13种手段

RelativeLayout用到的一些重要的属性: 第一类:属性值为true或false android:layout_centerHrizontal 水平居中 android:layout_centerVertical 垂直居中 android:layout_centerInparent 相对于父元素完全居中 android:layout_alignParentBottom 贴紧父元素的下边…

中企动力中山分公司网站英文免费注册网站

bigKey的产生 1、使用String存储了大文件的二进制。 2、使用集合没有考虑到数据的规模,或者规模的增长。 3、哈希中冗余了大量键值对。 bigKey问题 1、操作大key时会阻塞线程:redis是单线程。 2、网络阻塞:在网络中占用大量网络流量。 …

建设网站租服务器腾讯企业邮箱怎么注册

近日,力软与重庆科技学院联合推出了为期两周的低代码应用开发培训课程,来自重庆科技学院相关专业的近百名师生参加了此次培训。 融合研学与实践,方能成为当代数字英才。本次培训全程采用线下模式,以“力软低代码平台”为软件开发…

绿色家园网站怎么做wordpress 密码更改

File: rust/compiler/rustc_target/src/spec/x86_64_unknown_netbsd.rs rust/compiler/rustc_target/src/spec/x86_64_unknown_netbsd.rs 文件是 Rust 编译器针对 x86_64-unknown-netbsd 目标平台的配置文件。该文件定义了与该平台相关的特性、链接选项、目标特定的运行时支持以…