移动互联网站建设修改网站的设计

news/2025/9/23 18:33:40/文章来源:
移动互联网站建设,修改网站的设计,找苏州网站建设,百度一下网页首页本文主要介绍了Prompt设计、大语言模型SFT和LLM在手机天猫AI导购助理项目应用。 ChatGPT基本原理 “会说话的AI”#xff0c;“智能体” 简单概括成以下几个步骤#xff1a; 预处理文本#xff1a;ChatGPT的输入文本需要进行预处理。 输入编码#xff1a;ChatGPT将经过预…本文主要介绍了Prompt设计、大语言模型SFT和LLM在手机天猫AI导购助理项目应用。 ChatGPT基本原理 “会说话的AI”“智能体” 简单概括成以下几个步骤 预处理文本ChatGPT的输入文本需要进行预处理。 输入编码ChatGPT将经过预处理的文本输入到神经网络中进行编码处理使用的是多层transformer编码器结构。 预测输出ChatGPT通过对输入进行逐个token预测输出下一个最可能出现的token序列使用的是softmax函数进行概率预测。 输出解码ChatGPT将预测的token序列作为输入经过多层transformer解码器结构进行解码处理最终输出模型的回答。 重复步骤3和4ChatGPT在处理输入时会持续输出预测的token序列直到遇到停止符号或达到最大输出长度为止。 算法内核——Transformer 由 Encoder 和 Decoder 两个部分组成 技术交流群 建了技术交流群想要进交流群的同学可以直接加微信号mlc2060。加的时候备注一下研究方向 学校/公司CSDN即可。然后就可以拉你进群了。 前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~ 方式①、添加微信号mlc2060备注技术交流 方式②、微信搜索公众号机器学习社区后台回复技术交流 Prompt设计 ▐ 什么是prompt 看来跟我今天想分享的不太一样加个具体的限定条件然后呢 这下对了 Prompt的不同能直接决定模型是否能按我们的预期输出 ▐ prompt基本技巧 1.清晰明确避免模糊的词语 bad casegood case产品描述不应该太短用一些句子就行也不用特别多用3到5个短语描述这个产品给手机天猫写首诗给手机天猫写一首四句的古文诗模仿李白的《早发白帝城》 2.用###或者或者或者’将指令和待处理的内容分开 bad casegood case将下面内容总结为一句话。你应该提供尽可能清晰和具体的指令来表达你想让模型做什么。这将引导模型朝着期望的输出方向发展并减少收到无关或不正确响应的可能性。不要混淆写一个清晰的提示和写一个简短的提示。在许多情况下更长的提示提供更多的清晰度和上下文这可以导致更详细和相关的输出。将下面用三个引号括起来的内容总结为一句话需要总结的文本是你应该提供尽可能清晰和具体的指令来表达你想让模型做什么。这将引导模型朝着期望的输出方向发展并减少收到无关或不正确响应的可能性。不要混淆写一个清晰的提示和写一个简短的提示。在许多情况下更长的提示提供更多的清晰度和上下文这可以导致更详细和相关的输出。 3.指定输出格式 bad casegood case生成三个虚构书名包括它们的作者和类型。生成三个虚构书名包括它们的作者和类型。以JSON列表的格式提供包括以下键book_id、title、author、genre 4.角色扮演用扮演、担任等这一类词汇告诉大模型在对话中特定的人格或角色 bad casegood case给我推销一款男士洗面奶system:我想让你扮演一个专业的导购员。你可以充分利用你的电商知识、导购话术生动活泼的帮顾客介绍推销商品。user:给我推销一款男士洗面奶 ▐ Few shot进阶 启用上下文in-context learning学习在prompt中提供几个样例这里只有一个例子one-shot ▐ Chain of ThoughtCot 思维链CoT是一种改进的提示策略用于提高 LLM 在复杂推理任务中的性能如算术推理、常识推理和符号推理。 one-shotCotmodel inputQ小明有5个球他又买了2筐每一筐有3个球。那么他现在总共有几个球A答案是11Q小花有23个苹果他们午餐用去了20个又买了6个。那么现在还有多少个苹果model outputmodel inputQ小明有5个球他又买了2筐每一筐有3个球。那么他现在总共有几个球A小明开始有5个球又买了2筐球每筐3个共6个球合计11个球答案是11Q小花有23个苹果他们午餐用去了20个又买了6个。那么现在还有多少个苹果model output 上面的例子很好的激发了大模型的潜能是否有prompt技巧无能为力的问题 答案是肯定的一些偏实时模型训练过程中缺乏的语料知识它也无能为力。 ▐ Search API GPT 网页搜索结果: {web_results}当前日期:{current_date}指令: 用给定的网络搜索结果总结回复用户query用户Query: {query}回复语言: {reply_language}私有化知识库嵌入式向量检索LLM ▐ ReAct框架 大模型Agent功能大模型会自己分析问题选择合适的工具最终解决问题。 ReAct方式的作用就是协调LLM模型和外部的信息获取与其他功能交互。如果说LLM模型是大脑那ReAct框架就是这个大脑的手脚和五官。 关键概念描述Thought由LLM模型生成是LLM产生行为和依据ActAct是指LLM判断本次需要执行的具体行为ObsLLM框架对于外界输入的获取。 尽可能回答以下问题可以使用工具 {工具名和描述} 使用以下格式回答 问题你必须回答的问题思考你应该一致保持思考思考要怎么解决问题 动作{工具名}。每次动作只选择一个工具工具列表{工具名和描述} 输入{调用工具时需要传入的参数} 观察{第三方工具返回的结果}【思考-动作-输入-观察】循环N次思考最后输出最终结果 最终结果针对原始问题输出最终结果开始 问题上海最高楼是多少它楼层高度的平方是多少 思考我需要知道上海最高楼然后进行计算。 动作搜索API 观察632米 思考我需要计算上海最高楼高度的平方然后得到结果。 动作计算器 输入632^2 观察399424 思考 最终结果上海最高楼632米它的高度平方是399424大模型SFTsupervised fine tuning ▐ 预训练 VS 微调 预训练模型以一种无监督的方式去训练学习根据前文生成下一个单词。在海量数据下进行让大模型具备语言理解和生成能力。 指令微调有监督的方式进行学习包括任务描述输入等去预测答案。目标是如何跟人类指令对齐让模型更加适应专业化领域场景 业务数据从哪来 人工标注 种子数据 self-instructgpt 3.5构造 ▐ P-tuning 动机Fine-tuning需要微调整个预训练语言模型且额外添加了新的参数而Prompting则可以将整个预训练语言模型的参数保持固定而只需要添加prompt来预测结果即可 P-tuning将Prompt转换为可以学习的Embedding层并用MLPLSTM的方式来对Prompt Embedding进行一层处理。 P-tuning V2每一层都加入可训练的prompts只对Prompt部分的参数进行训练而语言模型的参数固定不变。 ▐ LoRA Low-rank Adaption of LLM利用低秩适配low-rank adaptation的方法可以在使用大模型适配下游任务时只需要训练少量的参数即可达到一个很好的效果。在计算资源受限的情况下的弥补方案。 对于不同的下游任务只需要在预训练模型基础上重新训练AB就可以了这样也能加快大模型的训练节奏。 ▐ LoRA VS 全参数微调 lora的优点在于轻量化低资源。但缺点很明显参与训练的模型参数量不多在百万到千万级别的参数量实验来看效果比全量微调差一些。 ▐ C-Eval评估 C-Eval由上海交通大学清华大学爱丁堡大学共同完成是构造了一个覆盖人文社科理工其他专业四个大方向52 个学科微积分线代 …从中学到大学研究生以及职业考试一共 13948 道题目的中文知识和推理型测试集。 C-Eval认为一个模型要强首先需要广泛的知识然后在知识的基础上做推理这样才能代表一个模型可以做复杂且困难的事情。 此外还有一些公开评测集用于评估模型在学科综合、语言能力、推理能力等。 手机天猫AI导购助理项目落地应用 ▐ 项目背景 “AI形象”璇玑作为个人专属导购员在交互式对话中进行用户理解、导购商品。 定位交互式搜索导购产品 ▐ 算法框架 ▐ 语料收集 电商种子问题收集端内会话日志、小红书sug收集电商领域种子问题 问题泛化明确场景问题定义通过手猫核心query、种子问题等设计prompt通过gpt补充收集问题 人工标注: 标注高质量语料 self-instruction通过prompt(few-shot)方法根据已有人工标注扩充新的instruction。通过gpt获取更多训练语料解决标注人效瓶颈。 ▐ 模型训练 base模型选型 中文评测 数学评测 训练平台AOP/星云/PAI 基于达摩院模型基座qwen-14B针对璇玑产品新增电商领域的训练数据增强模型的电商领域知识、安全、导购等能力。 params--stage sft \ --model_name_or_path /data/oss_bucket_0/Qwen_14B_Chat_ms_v100/ \ --do_train \ --dataset_dir data \ --dataset xuanji \ --template chatml \ --finetuning_type full \ --output_dir file_path \ --overwrite_cache \ --per_device_train_batch_size 2 \ --gradient_accumulation_steps 4 \ --lr_scheduler_type cosine \ --logging_steps 5 \ --save_strategy epoch \ --save_steps 10000 \ --learning_rate 2e-6 \ --num_train_epochs 3.0 \ --warmup_ratio 0.15 \ --warmup_steps 0 \ --weight_decay 0.1 \ --fp16 ${fp16} \ --bf16 ${bf16} \ --deepspeed ds_config.json \ --max_source_length 4096 \ --max_target_length 4096 \ --use_fast_tokenizer False \ --is_shuffle True \ --val_size 0.0 \pai -name pytorch112z -project algo_platform_dev -Dscript${job_path}-DentryFile-m torch.distributed.launch --nnodes${workerCount} --nproc_per_node${node} ${entry_file} -DuserDefinedParameters\${params}\ -DworkerCount${workerCount} -Dcluster${resource_param_config} -Dbuckets${oss_info}${end_point}训练中间过程 ▐ 模型部署调用 达摩院千问 模型基于allspark做量化加速部署在dashscope平台机器为双卡A10。 # For prerequisites running the following sampleimport dashscope from dashscope import Generation from http import HTTPStatusdashscope.api_key your-dashscope-api-keyresponse_generator Generation.call(modelmodel_name,promptbuild_prompt([{role:system,content:content_info},{role:user, content:query}]),streamTrue,use_raw_promptTrue,seedrandom_num )for resp in response_generator:# when stream, you need to get the result through iterationif resp.status_code HTTPStatus.OK:print(resp.output)else:print(Failed request_id: %s, status_code: %s, \code: %s, message:%s %(resp.request_id, resp.status_code, resp.code, resp.message))# Result: # {text: 汝亦来, finish_reason: null} # {text: 汝亦来哉幸会。\n\n汝可, finish_reason: null} # {text: 汝亦来哉幸会。\n\n汝可唤我一声「百晓生, finish_reason: null} # {text: 汝亦来哉幸会。\n\n汝可唤我一声「百晓生」不知可否, finish_reason: null} # {text: 汝亦来哉幸会。\n\n汝可唤我一声「百晓生」不知可否, finish_reason: stop}Whale私有化 部署发布 模型管理 from whale import TextGeneration import json# 设置apiKey # 预发或线上请勿指定base_url TextGeneration.set_api_key(api_key, base_urlapi_url)# 设置模型生成结果过程中的参数config {pad_token_id: 0, bos_token_id: 1, eos_token_id: 2, user_token_id: 0, assistant_token_id: 0, max_new_tokens: 2048, temperature: 0.95, top_k: 5, top_p: 0.7, repetition_penalty: 1.1, do_sample: False, transformers_version: 4.29.2} prompt [{role: user,content: content_info} ]# 请求模型 response TextGeneration.call(modelmodel_name,promptjson.dumps(prompt),timeout120,streamingTrue,generate_configconfig)# 处理流式结果 for event in response:if event.status_code 200:print(event.finished)if event.finished is False:print(event.output[response], end)else:print(error_code: [%d], error_message: [%s]% (event.status_code, event.status_message))EAS 借助EAS将代码和模型文件分离进行LLM服务部署基于http协议提供流式输出。模型存储在oss上。 ▐ 模型评测 基础能力评测在公开评测集上评估模型中英文、推理、知识问答能力表现。 业务评测以业务人工评测为主每个大模型任务150个评测问题。 体验问题埋点日志获取定期review。 参考链接 1.https://www.semanticscholar.org/paper/Attention-is-All-you-Need-Vaswani-Shazeer/204e3073870fae3d05bcbc2f6a8e263d9b72e776 2.https://huggingface.co/Qwen/Qwen-14B-Chat 3.https://github.com/yuanzhoulvpi2017/zero_nlp 4.https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning 5.https://www.bilibili.com/video/BV1jP411d7or/?spm_id_from333.337.search-card.all.click 6.https://arxiv.org/pdf/2305.08322v1.pdf 7.https://zhuanlan.zhihu.com/p/630111535?utm_id0 8.https://cdn.baichuan-ai.com/paper/Baichuan2-technical-report.pdf 9.https://github.com/tatsu-lab/stanford_alpaca

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/913485.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

月嫂网站模板企业网站推广服务协议

PHP 日期处理完全指南 引言 在PHP开发中,日期和时间处理是一个常见且重要的任务。PHP提供了丰富的内置函数来处理日期和时间,包括日期的格式化、计算、解析等。本文将详细介绍PHP中日期处理的相关知识,帮助读者全面理解和掌握这一技能。 1. PHP日期函数基础 1.1 date()函…

宁海县城镇建设局网站wordpress 提示

本文原文来自DataLearnerAI官方网站:ChatGPT内置隐藏debug功能:支持下载原始对话、可视化对话分支等 | 数据学习者官方网站(Datalearner) AIPRM的工作人员最近发现ChatGPT的客户端隐藏内置了一个新的debug特性,可以提高ChatGPT对话的问题调试…

网站系统里不能打印江苏高效网站制作公司

viewdata[alert]"alert(你好)"<script>viewdata[alert]</script> 在Controller存储数据 在 界面得到 关于 ViewData和ViewMode 点击这里 http://wanshiqian1221.blog.163.com/blog/static/6872130420095242016546/

firewalld 端口流量转发

需求说明 将本机 (IP: 192.168.174.100) 发往 192.168.174.165:443 的流量转发到 另一节点 192.168.174.149:20037(nginx 4层代理到192.168.174.165:443) 启用 IP 转发 # 节点IP: 192.168.174.100 sysctl -w net.ipv…

[PaperReading] Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any Resolution

目录Qwen2-VL: Enhancing Vision-Language Model’s Perception of the World at Any ResolutionTL;DRMethodNaive Dynamic ResolutionMultimodal Rotary Position Embedding (M-RoPE)Unified Image and Video Underst…

谈谈对软件工程的理解

谈谈对软件工程的理解软件工程的核心思想在于软件不仅仅是程序,软件工程是一门强调“实践”和“工程化”的学科。软件,即程序、数据和文档**三者的集合体。这彻底改变了我过去认为“写软件就是敲代码”的狭隘观念。文…

[PaperReading] MemGPT: Towards LLMs as Operating Systems

目录MemGPT: Towards LLMs as Operating SystemsTL;DRMethodMain contextExperiment总结与思考相关链接 MemGPT: Towards LLMs as Operating Systems link 时间:23.10 单位:UC Berkeley 相关领域:Agent 作者相关工作…

株洲定制网站建设做网站最贵

使用Python Django框架做一个音乐网站&#xff0c; 本篇音乐播放器-添加播放音乐功能实现。 目录 创建播放器数据表 设置表结构 执行创建表 命令 执行 数据表结构 添加单个歌曲 创建路由 加入播放器视图 模板处理 基类方法 子页面调用 优化弹窗 加入layui文件 基…

总线的性能指标

1.总线的传输周期(总线周期 一次总线操作所需的时间(包括申请阶段,寻址阶段,传输阶段和结束阶段 通常有若干个总线时钟周期构成 2.总线时钟周期 早期由cpu发出,而如今都是由桥接器提供的 即机器的时钟信号,计算机…

网站主页设计收费个人买卖网站怎么做

这里的状态定义一般使用DP【i】 表示 考虑前i个东西能否满足条件&#xff0c;然后我们枚举上一次的转移位置就好了 2369. 检查数组是否存在有效划分 需要注意的是我习惯从1开始写&#xff0c;所以要处理好边界的下标问题 class Solution { public:bool validPartition(vector&l…

网站建设类型的好处延安网站设计公司

闲来无事学一下设计模式&#xff0c;希望这23种可以一直更下去&#xff0c;什么时候能更完呢&#xff0c;也许一个月&#xff0c;也许一年&#xff0c;也许断更 设计模式六大原则 本文是23篇的第一篇&#xff0c;在学习设计模式之前&#xff0c;你需要了解下六大原则。 1、开…

网站开发平台有哪些国内很多网站不是响应式

作者&#xff1a;刘肉酱摩尔定律的终结将使服务于特定领域的架构成为计算的未来。一个开创性的例子就是谷歌在 2015 年推出的张量处理单元&#xff08;TPU&#xff09;&#xff0c;目前已经在为超过十亿人提供服务。TPU 使深度神经网络&#xff08;DNN&#xff09;的计算速度提…

厦门手机网站中国制造网服务种类

1. 题目 给你一个字符串 s 和一个字符 c &#xff0c;且 c 是 s 中出现过的字符。 返回一个整数数组 answer &#xff0c;其中 answer.length s.length 且 answer[i] 是 s 中从下标 i 到离它 最近 的字符 c 的 距离 。 两个下标 i 和 j 之间的 距离 为 abs(i - j) &#xff0c…

网站权重一般有几个等级动漫网站源码下载

提示&#xff1a;RAM模型&#xff1a;环境安装、数据准备与说明、模型推理、模型finetune、模型pretrain等 文章目录 前言一、环境安装二、数据准备与解读1.数据下载2.数据标签内容解读3.标签map内容解读 三、finetune训练1.微调训练命令2.load载入参数问题3.权重载入4.数据加载…

VoxCPM:新一代高拟真语音生成模型

一、概述 仅需0.5B参数,VoxCPM就能用你的声音说任何话:这款开源语音模型在音色克隆和情感表达上突破极限,实时生成媲美真人的播报、演讲甚至方言,错误率低至行业新标杆。在语音合成技术快速发展的背景下,面壁智能…

Day20封装的初步认识

封装是面向对象的三大特性之一,通过private这一关键词将类的属性私有化,且为了对私有的属性进行赋值,需要提供公共的get/set方法对外暴露一个安全的操作接口,使外部可以合法的访问与修改属性 封装的作用:1,保护数…

【Qt开发】显示类控件(三)-> QProgressBar - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

完整教程:数据结构与算法-树和二叉树-二叉树的存储结构(Binary Tree)

完整教程:数据结构与算法-树和二叉树-二叉树的存储结构(Binary Tree)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: …

简单的旅游网站代码做视频网站了几百万

前些天发现了十分不错的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;没有广告&#xff0c;分享给大家&#xff0c;大家可以自行看看。&#xff08;点击跳转人工智能学习资料&#xff09; 微信公众号&#xff1a;创享日记 发送&#xff1a;联合定位 获…

网站销售方案深圳关键词优化

RabbitMQ六种工作模式 RabbitMQ是由erlang语言开发&#xff0c;基于AMQP&#xff08;Advanced Message Queue 高级消息队列协议&#xff09;协议实现的消息队列&#xff0c;它是一种应用程序之间的通信方法&#xff0c;消息队列在分布式系统开发中应用非常广泛。 RabbitMQ有六…