【专辑】AI大模型应用开发入门-拥抱Hugging Face与Transformers生态 - 使用Transformers加载预训练模型 - 使用AutoModel自动模型方式调用Bert预训练模型

大家好,我是java1234_小锋老师,最近更新《AI大模型应用开发入门-拥抱Hugging Face与Transformers生态》专辑,感谢大家支持。

本课程主要介绍和讲解Hugging Face和Transformers,包括加载预训练模型,自定义数据集,模型推理,模型微调,模型性能评估等。是AI大模型应用开发的入门必备知识。

使用AutoModel自动模型方式调用Bert预训练模

AutoModel是一个用来自动加载各种预训练 Transformer 模型的类。你可以使用它直接从 Hugging Face 模型库中加载模型,而无须关心具体的模型实现。主要用于构建和微调模型,以便在特定的任务上进行更深入的开发。使用 AutoModel 通常需要更细粒度的操作,比如输入数据的处理、模型的前向传播、输出的处理等。更适合需要模型架构和输入输出控制的用户,如研究人员或需要定制模型的开发者。

AutoModel还是pipeline对比

特性AutoModelpipeline
使用复杂性较复杂,需要手动处理各个步骤简单,自动处理所有步骤
适用场景适合需要灵活性和微调能力的开发适合快速应用于特定任务
示例代码model = AutoModel.from_pretrained("xxx")classifier = pipeline("task")
输出处理需要手动处理模型输出自动处理输出
适用人群研究人员、开发者等快速原型或希望简化流程的用户

具体示例:

import torch from transformers import AutoTokenizer, AutoModelForSequenceClassification def test_classfication(): # 加载分词器 tokenizer = AutoTokenizer.from_pretrained('./Bert-base-chinese') # 加载模型 model = AutoModelForSequenceClassification.from_pretrained('./Bert-base-chinese') print(model) # 准备输入数据 input_ids = tokenizer.encode( text='今天天气不错', # 输入文本 return_tensors='pt', # 返回PyTorch张量 padding="max_length", # 填充到最大长度 truncation=True, # 截断超出长度的输入 max_length=10 # 输入最大长度 ) print(input_ids, input_ids.shape) # 评估模式 model.eval() # 模型预测 output = model(input_ids) # 5. 获取预测结果 logits = output.logits prediction = torch.argmax(logits, dim=-1) print(logits, prediction) sentiment = prediction.item() # 转换为 Python 整数 sentiment_label = "积极" if sentiment == 1 else "消极" if sentiment == 0 else "中性" print(sentiment_label) if __name__ == '__main__': test_classfication()

运行结果:

BertForSequenceClassification( (bert): BertModel( (embeddings): BertEmbeddings( (word_embeddings): Embedding(21128, 768, padding_idx=0) (position_embeddings): Embedding(512, 768) (token_type_embeddings): Embedding(2, 768) (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True) (dropout): Dropout(p=0.1, inplace=False) ) (encoder): BertEncoder( (layer): ModuleList( (0-11): 12 x BertLayer( (attention): BertAttention( (self): BertSdpaSelfAttention( (query): Linear(in_features=768, out_features=768, bias=True) (key): Linear(in_features=768, out_features=768, bias=True) (value): Linear(in_features=768, out_features=768, bias=True) (dropout): Dropout(p=0.1, inplace=False) ) (output): BertSelfOutput( (dense): Linear(in_features=768, out_features=768, bias=True) (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True) (dropout): Dropout(p=0.1, inplace=False) ) ) (intermediate): BertIntermediate( (dense): Linear(in_features=768, out_features=3072, bias=True) (intermediate_act_fn): GELUActivation() ) (output): BertOutput( (dense): Linear(in_features=3072, out_features=768, bias=True) (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True) (dropout): Dropout(p=0.1, inplace=False) ) ) ) ) (pooler): BertPooler( (dense): Linear(in_features=768, out_features=768, bias=True) (activation): Tanh() ) ) (dropout): Dropout(p=0.1, inplace=False) (classifier): Linear(in_features=768, out_features=2, bias=True) ) tensor([[ 101, 791, 1921, 1921, 3698, 679, 7231, 102, 0, 0]]) torch.Size([1, 10]) tensor([[-0.2556, 0.3660]], grad_fn=<AddmmBackward0>) tensor([1]) 积极

AutoTokenizer负责将生文本转换为模型可以理解的输入格式。这一过程通常涉及分词、编码等步骤。

以下介绍AutoTokenizer.encode方法的重要参数:

AutoTokenizer.encode 方法参数

  1. text(strorList[str])

    • 要编码的输入文本,可以是单个字符串或字符串列表。如果是列表,AutoTokenizer将对每个字符串进行编码。

  2. text_pair(strorList[str], optional)

    • 如果您想要处理文本对(例如,问答任务),可以使用此参数。它的值也可以是单个字符串或字符串列表,表示要与text一同编码的第二个文本。

  3. max_length(int, optional)

    • 限制返回的序列最大长度。如果输入文本的编码长度超过此参数,将会被截断。如果没有设置,默认长度由模型的最大输入长度决定。

  4. padding(boolorstr, optional)

    • 控制返回的序列是否进行填充。可以设置为True,让所有返回的序列填充到同一最大长度,或者为'max_length',使所有序列填充到max_length指定的长度。默认值通常是False

  5. truncation(boolorstr, optional)

    • 控制是否截断输入序列。通常可以设置为True,以截断到最大长度,也可以设置为'longest_first''do_not_truncate'等选项。默认值通常是False

  6. return_tensors(str, optional)

    • 如果设置,返回的张量将被转换为指定框架的张量格式,例如'pt'(PyTorch)或者'tf'(TensorFlow)。如果不设置,返回的是普通的 Python 列表。

  7. return_attention_mask(bool, optional)

    • 是否返回注意力掩码。注意力掩码通常用于指示模型在处理输入序列时,应该关注哪些位置。

  8. return_token_type_ids(bool, optional)

    • 是否返回 token 类型 ID 值,在一些任务(如问答)中可能会用到,它帮助模型区分不同的文本对。

  9. add_special_tokens(bool, optional)

    • 控制是否在输入文本前后添加特殊的标记(如[CLS][SEP]),这些标记在 BERT 和其他一些模型中是必需的,帮助模型理解输入的结构。

  10. encoding(str, optional)

    • 指定字符编码类型,例如 "utf-8"。这通常在处理文本输入时很有用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1184992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年的AI发展趋势是什么?

2026年的AI发展趋势将延续当前技术演进的核心逻辑&#xff08;如大模型、多模态、生成式AI&#xff09;&#xff0c;同时在效率、场景渗透、跨学科融合及伦理规范等方面迎来关键突破。以下是基于当前技术路线和行业动态的十大趋势预测&#xff1a;1. 大模型向“高效化专业化”演…

稀疏大模型(MoE架构)的颠覆性工作——Switch Transformers论文精读

目录 1、论文概述 1.1 MoE架构 1.2 核心贡献 1.3 摘要 2、模型结构&#xff08;Pipline&#xff09; 3、方法 3.1 Simplifying Sparse Routing&#xff08;简化稀疏路由&#xff09; 3.2 Efficient Sparse Routing&#xff08;高效稀疏路由&#xff09; 4、实验 4.1 S…

模型量化在边缘计算AI应用中的关键作用

模型量化在边缘计算AI应用中的关键作用&#xff1a;让AI小助手住进手机和摄像头的魔法 关键词&#xff1a;模型量化、边缘计算、AI应用、神经网络压缩、低功耗计算 摘要&#xff1a;你是否好奇过手机里的AI美颜为什么能瞬间完成&#xff1f;摄像头的实时物体检测为何不卡顿&…

当商品计划可被推演 库存就不再是赌

国家统计局数据显示&#xff0c;2025上半年社会消费品零售总额增速持续走低&#xff0c;限额以上服装鞋帽类零售额同比仅增长0.3%。在增长放缓的背景下&#xff0c;许多本土服装企业同时遭遇多重挤压&#xff1a;消费趋势变化更快&#xff0c;品牌进入老化阶段&#xff1b;渠道…

电子信息毕设 stm32 wifi远程可视化与农业灌溉系统(源码+硬件+论文)

文章目录 0 前言1 主要功能2 硬件设计(原理图)3 核心软件设计4 实现效果5 最后 0 前言 &#x1f525; 这两年开始毕业设计和毕业答辩的要求和难度不断提升&#xff0c;传统的毕设题目缺少创新和亮点&#xff0c;往往达不到毕业答辩的要求&#xff0c;这两年不断有学弟学妹告诉…

​盲盒爱好者快看!盲盒小程序开发全解析✨

盲盒爱好者快看&#xff01;盲盒小程序开发全解析✨ 今天来给大家科普下盲盒小程序的核心玩法和开发要点&#x1f43e;作为软件开发公司&#xff0c;我们整理了热门盲盒小程序的核心功能清单&#xff1a; 1. 一番赏模式&#xff1a;多奖池分层设计&#xff0c;用户抽中后可查看…

2026.1.17作业- P8082 [COCI 2011/2012 #4] KEKS

2026.1.17作业- P8082 [COCI 2011/2012 #4] KEKS题目描述 给定正整数 \(N,K\) 和一个 \(N\) 位数,求在 \(N\) 位数中删除 \(K\) 位后剩下的数的最大值。 输入格式 第一行,两个整数 \(N,K\)。 第二行,一个 \(N\) 位整…

深度测评本科生必备9款AI论文软件:开题报告文献综述全搞定

深度测评本科生必备9款AI论文软件&#xff1a;开题报告文献综述全搞定 学术写作工具测评&#xff1a;为何需要一份权威榜单 在当前高校教育日益重视科研能力的背景下&#xff0c;本科生在论文写作过程中面临诸多挑战。从开题报告到文献综述&#xff0c;再到最终的论文撰写&am…

2026 年 1 月电动消防车厂家推荐排行榜:四轮电动消防车,社区巡逻与初期火灾扑救高效装备精选,智能安全与快速响应实力解析 - 企业推荐官【官方】

2026 年 1 月电动消防车厂家推荐排行榜:四轮电动消防车,社区巡逻与初期火灾扑救高效装备精选,智能安全与快速响应实力解析 随着我国城市化进程的深入与消防安全意识的普遍提升,基层消防力量的建设正面临新的挑战与…

实时云渲染助力数字孪生绿色低碳:从“碳可视”到“碳可优”

随着“双碳”目标深入&#xff0c;能源结构优化、工业降碳与建筑绿色化进程全面加速。中国信通院2025年报告指出&#xff0c;数字孪生正从辅助监测工具&#xff0c;向支撑降碳治理全过程的核心底座演进&#xff0c;目标是从 “碳可视” 迈向 “碳可控、碳可优”。然而&#xff…

跨境 / 爬虫必备:高性价比动态代理 IP 实测分享

做跨境电商、海外社媒运营或者数据爬虫的朋友&#xff0c;应该都懂一个干净、稳定的动态代理 IP 有多重要 ——IP 不稳易被风控&#xff0c;纯净度不够易关联&#xff0c;性价比低又会拉高运营成本。最近实测了一款 kookeey 动态代理 IP&#xff0c;体验还不错&#xff0c;分享…

Facebook合规养号全流程(附避坑指南):告别新号秒封

从事跨境业务、依赖Facebook引流或投放的开发者及运营者&#xff0c;大概率都遇到过“新号刚注册就被封”的问题。其实Facebook封号并非玄学&#xff0c;99%的账号失效&#xff0c;本质是IP环境不洁或养号操作触碰平台风控红线。本文整理了一套可直接落地的12天合规养号流程&am…

我在实施oracle ebs项目 帮我想一个方案 我在设计coa架构,coa有公司段com 会计科目段 acct 以及科目子目 subacct 依赖于 acct段,com有值 0916 0918

我在实施oracle ebs项目 帮我想一个方案 我在设计coa架构&#xff0c;coa有公司段com 会计科目段 acct 以及科目子目 subacct 依赖于 acct段&#xff0c;com有值 0916 0918 0919&#xff0c;科目有 10010101 10020101 10030101 等 10010101的子目有 000000 000001 &#xff0c;…

Hi5000Q/Hi5000H高精度无频闪LED恒流驱动器原厂技术支持智芯一级代理聚能芯半导体

在LED照明系统设计中&#xff0c;驱动器的拓扑适配性、恒流精度与调光性能直接决定灯具可靠性与光效表现。Hi5000作为一款高集成度LED恒流驱动器&#xff0c;以简洁外围设计、卓越性能参数&#xff0c;为6.5-75V输入电压范围的照明项目提供高效解决方案&#xff0c;完美适配商业…

2026年!AI时代转型秘籍:普通产品经理如何成功转行AI大模型产品经理?_转行AI产品经理

近期随着ChatGPT的相关发展信息席卷而来&#xff0c;部分产品经理&#xff0c;尤其是功能产品经理越加担忧被职场淘汰&#xff0c;能力无法跟不上科技发展趋势&#xff0c;纷纷了解如何转为AI从产品经理岗位。可以肯定的是随着人工智能技术的发展&#xff0c;不仅是科技公司运用…

深度解析 | 五款免费低代码平台技术选型指南

作为一名长期关注企业数字化的实践者&#xff0c;我发现选择低代码平台不是找“全能冠军”&#xff0c;而是寻找能精准解决当下痛点、理解团队基因的“最佳拍档”。在探索了众多国产工具后&#xff0c;斑斑低代码、炎黄盈动AWS PaaS、活字格、云表和简道云这五个平台&#xff0…

无人机视角水稻稻穗检测数据集VOC+YOLO格式2185张1类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)&#xff1a;2185标注数量(xml文件个数)&#xff1a;2185标注数量(txt文件个数)&#xff1a;2185标注类别…

2026最新VSCode下载安装使用教程:轻松设置中文界面(附安装包+详细图解) - xiema

如果你刚开始学习编程,或者正在寻找一款好用的代码编辑器,那么你一定听说过 VSCode 这个名字。 VSCode(Visual Studio Code) 是由微软开发的一款免费、开源、跨平台的现代化代码编辑器。它不仅轻量级、启动速度快,…

写论文软件哪个好?实测破局!宏智树 AI 成学术写作效率天花板

毕业季的论文战场上&#xff0c;“写论文软件哪个好” 的灵魂拷问&#xff0c;成了无数学子的热议焦点。市面上的论文工具五花八门&#xff0c;却大多难逃 “文献造假”“数据空洞”“逻辑断层” 的三大魔咒。作为深耕论文写作科普的教育测评博主&#xff0c;我以计算机、汉语言…

小程序 智能停车场管理系统

目录智能停车场管理系统摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;智能停车场管理系统摘要 智能停车场管理系统基于小程序平台开发&#xff0c;旨在解决传统停车场效率低、管理成本…