AI的提示词专栏:多模态 LLM(Vision-LLM)Prompt 语法

AI 提示词专栏:多模态 LLM(Vision-LLM)Prompt 语法
(2025–2026 年最实用、最有效的写法指南)

目前主流的多模态大模型(支持图文/视频/文档等)包括:

  • GPT-4o / GPT-4o mini / o1系列
  • Claude 3.5 Sonnet / Claude 4 Opus
  • Gemini 1.5 Pro / 2.0 Flash
  • 通义千问VL / 2.5-max
  • DeepSeek-VL / Janus-Pro
  • Qwen2-VL-72B / 7B

虽然底层模型不同,但目前业界已形成一套*相对通用的多模态 Prompt 语法结构*,掌握这套结构后,你可以比较轻松地迁移到不同模型。

多模态 Prompt 的黄金结构(2025–2026 年最推荐)

【任务类型声明】(最重要的一句) 你现在是一个专业的[角色],请严格按照以下要求分析/描述/推理/回答这张/这些图片。 【图片编号与引用顺序】(强烈建议) 图片1:[一句话简要说明这张图的主要内容/拍摄目的/我希望关注的重点] 图片2:[同上] 图片3:[……] 【核心指令】(越具体越好) 请按照以下步骤完成分析: 1. 先整体观察并总结图片最显著的视觉特征(构图、色调、主主体、情绪氛围等) 2. 再逐个描述每个关键元素的位置、细节、相互关系(建议从左到右、从上到下、从前景到背景) 3. 分析图片可能的拍摄意图/场景意义/情感表达 4. 如果有多张图,请说明它们之间的关系(时间顺序、对比、递进、因果等) 5. 最后给出你的最终结论/判断/创意建议/改进意见 【输出格式要求】(强烈建议写死) 请严格使用以下格式回复,不要添加多余的引导语: 【整体印象】 一句话总结最核心视觉感受 【细节拆解】 • 左上区域: • 中央主体: • 右下元素: …… 【元素关系与叙事】 …… 【最终判断 / 建议】 ……

不同任务类型的“变体模板”(直接套用最省力)

1. 图片内容精准描述(电商/存证/医疗影像/艺术分析常用)
请以极度客观、精确、像法医/鉴证专家一样的语气,逐像素级描述这张图片的所有可见内容。 禁止使用任何主观形容词(漂亮、温馨、可爱、恐怖等一律不要出现)。 必须包含: - 光线方向与强度 - 物体相对大小比例 - 文字内容(完整抄录,不要改写) - 颜色(尽量使用标准色名或色号) - 时间线索(钟表、日期、光影角度等) - 任何可能的环境信息(室内/室外、季节、天气)
2. 图片情感/氛围分析(小说配图、广告创意、心理咨询)
请以电影导演/美术指导的视角分析这张图片的叙事情绪与视觉语言。 必须回答: 1. 这张图最想让观众感受到的主要情绪是什么?(用1-2个词) 2. 它通过哪些具体视觉手法(色彩、光影、构图、镜头语言)制造这种情绪? 3. 如果这是电影海报/小说封面/广告,它最适合搭配哪种故事类型/文案风格? 4. 如果要加强情绪冲击力,你会如何修改这张图?(列出2-3个具体建议)
3. 多图对比/找不同/时序推理(监控、实验、成长记录)
你现在收到一组按时间顺序排列的图片(共N张,按编号1→N)。 请严格按照以下步骤分析: 1. 确认每张图的时间线索(如果有钟表/日期/光线/阴影/物体变化等) 2. 逐张描述画面中最明显的变化点(至少找出3-5个) 3. 判断整个过程的起因、经过、高潮、结果(如果能推理出的话) 4. 如果这是某种实验/行为/事件,请尝试推测: - 实验目的 - 最终结果 - 是否成功/失败的依据
4. 图表/数据可视化解读(最常用于商业/科研)
请以数据分析师/咨询顾问的身份,专业、客观地解读这张图表/数据可视化。 必须包含以下全部内容: 1. 图表类型与坐标轴含义 2. 最关键的3-5个数据点/趋势/异常值 3. 主要结论(用数据说话) 4. 可能的商业/科研启示或建议 5. 如果有明显问题(刻度错误、误导性设计、数据缺失等),请指出来 6. 如果是你来做决策,根据这张图你会做出什么判断?
5. 图片创意/改图建议(设计师/文案/小说配图常用)
你现在是一位顶尖平面设计师+创意总监。 请针对这张图片,给出以下内容: 1. 当前图片最吸引人的3个视觉亮点 2. 最减分的3个问题(构图、配色、细节等) 3. 如果要把它变成[具体用途:小红书爆款封面/科幻小说插图/奢侈品广告/恐怖片海报等] 请给出3-5个具体的改图方向(描述要非常具体,能直接交给美工执行) 4. 推荐配色方案(主色+辅助色+点缀色,尽量给 HEX 码) 5. 建议添加/删除/移动的元素清单

最高效的“多模态 Prompt 写法口诀”(背下来就赢)

  1. 先说清楚“我要你扮演谁”
  2. 必须写明图片顺序和引用方式(图片1、图片2…)
  3. 任务越细分越好(分步骤1、2、3、4…)
  4. 输出格式写死,越严格越不容易跑偏
  5. 对模型情绪化/主观表达进行约束(要客观就写死“禁止主观形容词”)
  6. 复杂任务一定要说“一步一步思考”(chain-of-thought效果非常明显)

掌握这套语法后,你在几乎所有主流 Vision-LLM 上都能得到一致性高、细节丰富、逻辑清晰的输出。

你现在最想用多模态大模型来解决什么具体问题?
(商品图分析、艺术品解读、监控视频摘要、PPT配图生成、实验照片解读、找图中bug……)

告诉我你的使用场景,我可以直接给你最匹配、最强的 Prompt 模板~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1174279.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

导师严选2026一键生成论文工具TOP8:本科生毕业论文写作全攻略

导师严选2026一键生成论文工具TOP8:本科生毕业论文写作全攻略 2026年学术写作工具测评:为何需要一份精准榜单 随着人工智能技术的不断进步,学术写作工具逐渐成为本科生撰写毕业论文的重要辅助。然而,面对市场上种类繁多的AI写作平…

springboot+vue智慧养老手表管理系统 本系统共分为两个角色:家长,养老院管理员 功...

springbootvue智慧养老手表管理系统 本系统共分为两个角色:家长,养老院管理员 功能有:个人管理,公告管理,家庭管理,加好友管理,老人健康管理,基础管理,加好友板等框架:springboot、mybatis、vue…

挂机放置类游戏开发学习 Part.3 UI布局

UI 布局阶段核心目标回顾(落地挂机游戏)搭建双窗口:「挂机游戏主面板」(核心功能,保留原有数值 / 按钮 / 进度条)+「游戏设置面板」(新增,调整挂机参数、UI 样式);掌握分组布局:用分组、折叠面板分隔不同功…

2026年多级泵供应商权威推荐榜单:多级离心泵/污水泵/自吸泵/深井泵/化工泵源头厂家精选 - 品牌推荐官

多级泵作为工业流程、市政供水、建筑消防及暖通空调系统的核心装备,其运行效率、可靠性及使用寿命直接关系到整个系统的稳定性与运营成本。随着国家节能政策的推进与基础设施投入的加大,市场对高效节能、低噪音、高可…

全栈贯通,实效为先:JBoltAI全栈能力集成的落地价值

在AI技术加速渗透各行业的当下,企业智能化转型早已脱离“概念炒作”阶段,进入“实效落地”的深水区。对于Java技术团队而言,AI转型面临的核心难题并非缺乏先进模型,而是如何将分散的AI能力与现有技术体系、业务场景深度融合&#…

sigmoid 函数详解(机器学习基础)

sigmoid 函数详解(机器学习基础)Posted on 2026-01-17 17:23 steve.z 阅读(0) 评论(0) 收藏 举报sigmoid 函数详解(机器学习基础) sigmoid 函数(又称逻辑斯蒂函数)是机器学习与深度学习领域中最基础且核心的…

使用PC浏览器devTool工具调试安卓手机h5页面

背景 开发前端 h5 项目的过程中,经常遇到不同移动端设备的不同浏览器的兼容性问题,尤其是当遇到布局异常问题时,我们往往苦于没有办法去检查移动端设备上的实际元素,从而导致难以定义问题,此时就需要有办法去调试移动…

赋能复杂业务自动化:JBoltAI 链式调用的控制结构设计

在企业级AI应用开发中,复杂业务场景往往需要多步骤、多条件的协同执行,单一的线性调用已无法满足灵活多变的业务需求。JBoltAI作为专注Java生态的企业级AI应用开发框架,其链式调用技术深度融合复杂工作流编排能力,通过条件分支、循…

2025年液体包装机厂家推荐榜:四川西德利自动化科技有限公司,丸剂包装机/粉剂包装机/枕式包装机/粉末包装机/圆角袋包装机/颗粒包装机/包装机/定量包装机/多列包装机厂家精选 - 品牌推荐官

一台包装速度高达70袋/分钟的全自动粉剂包装机,正在医药企业的生产线上飞速运转,精准完成从计量到封口的每一道工序,这正是现代包装工业的一个缩影。 工业包装机械行业正随着全球制造业的升级而快速发展。特别是在中…

学习进度 3

今天的学习目标聚焦解决重复计算的性能问题(RDD 持久化),并摆脱交互式 Shell,完成独立 Spark 应用程序的开发、打包与运行,这也是从 “零散操作” 到 “工程化开发” 的关键一步。 昨天在 Shell 中操作时发现一个…

Flutter OpenHarmony 适配:渐变按钮组件技术详解 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

通化市辉南柳河通化东昌二道江英语雅思培训辅导机构推荐,2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025

在全球化留学热潮下,雅思考试已成为通化市辉南、柳河、东昌、二道江等区县学子申请海外院校的核心门槛,而优质雅思培训的选择却成为备考路上的首要难题。多数考生普遍面临雅思培训选课迷茫、考试技巧缺失、提分乏力等…

2026线路板灌胶机厂家权威推荐榜单:环氧树脂灌胶机/硅胶灌胶机/手动灌胶机/半自动灌胶机/聚氨酯灌胶机源头厂家精选。 - 品牌推荐官

在电子制造行业持续向精密化、高可靠性与高效率方向发展的今天,线路板的防护性灌封已成为保障产品长期稳定运行的关键工艺。线路板灌胶机作为实现环氧树脂、硅胶、聚氨酯等胶水精确涂覆的核心装备,其技术水平直接决定…

2025年南京回收精密仪器公司权威推荐榜单:废金属收购/ 废金属回收 /高价废金属回收/ 废金属的回收 /废不锈钢废金属回收服务商精选 - 品牌推荐官

随着高端制造业升级和科研机构设备更新换代,南京地区积压的二手及淘汰精密仪器正形成一片“隐形富矿”。据统计,南京及周边地区的高校、科研院所、制造企业每年淘汰的各类精密仪器数量可达数千台,其中电子测量、光学…

白山市浑江江源临江英语雅思培训辅导机构推荐,2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025

在留学热潮持续升温的白山市,浑江、江源、临江地区越来越多的学子将雅思考试作为开启国际教育之门的关键钥匙。然而,在雅思培训选课过程中,当地考生普遍面临优质资源匮乏、课程适配性差、提分效果不确定、性价比难把…

乐平市雅思培训辅导机构推荐,2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025

基于雅思官方评分标准及全国雅思考生备考大数据,结合乐平市考生对雅思培训的核心需求,我们开展了为期一个月的全面深度测评,覆盖本地及全国主流机构,从师资资质、提分效果、教学模式、性价比等维度构建评估体系,最…

2026年热门流量计选购指南:插入式涡街流量计怎么选?食用油流量计/喷嘴/柴油流量计/氧气流量计,流量计源头厂家哪家强 - 品牌推荐师

随着工业自动化与智能制造的快速发展,流量计作为过程控制的核心仪表,其选型精度直接影响生产效率与成本控制。尤其在高温高压、腐蚀性介质或大口径管道场景中,插入式涡街流量计凭借“非满管安装、维护便捷、耐温耐压…

web入门51-60

web51 分析代码分析tac被禁用了,使用nl代替 ?c=nl<fl\ag.php||lsweb52 分析代码发现<被过滤了,使用${IFS}代替 ?c=nl${IFS}fl\ag.php||ls 注意这关的flag不在flag.php里面,就在flag里面,所以要查看/flag,…

一下午讲了 9 道题?!

省选模拟 CQXYM的线性规划 考虑到 \(x \in \{0,1\}\),显然并不能套用线性规划的做法。 观察到 \(a_i \leq b_i\),那么原限制相当于是对于所有 \(x_i=1\) 的物品,在 \([a_i,b_i]\) 区间内选一个数进行贡献,要求最后…

单锥真空螺带干燥机怎么挑?2026年优质厂家解析,沸腾干燥机/喷雾干燥机/污泥干化,单锥真空螺带干燥机定制厂家找哪家 - 品牌推荐师

在化工、制药、食品等工业领域,单锥真空螺带干燥机作为核心设备,直接影响产品品质与生产效率。其真空环境下的高效干燥能力,可精准解决传统设备能耗高、污染大、热敏性物料易失效等痛点。然而,市场设备性能参差不齐…