让AI像导演一样规划视频:杜克大学团队让视频生成告别“随机发挥“

这项由杜克大学的黄伦、普林斯顿大学的Guillermo Sapiro教授,以及字节跳动智能创作团队的谢优、徐鸿毅、古天佩、张晨旭、宋国宪、李泽楠、赵晓晨、骆琳杰等研究者共同完成的研究于2025年11月发表,论文编号为arXiv:2511.17986v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象你正在看一部电影,导演在拍摄前会仔细规划每个镜头的构图、演员的动作、物品的位置变化。但如今最先进的AI视频生成系统却像是没有导演的摄制组——它们能拍出画面精美的视频,但经常出现演员拿错道具、动作顺序颠倒、甚至凭空变出新物品的"穿帮"镜头。

现在的AI视频生成技术虽然能制作出视觉效果惊艳的内容,但它们有一个致命弱点:缺乏高层次的语义理解和长期规划能力。当你要求AI生成一个"女人从地上站起来,环顾四周,然后伸展身体"的视频时,AI往往会在某个环节"跑偏"——比如女人突然消失了,或者出现了两个女人,又或者动作顺序完全错乱。

这就像让一个只会临摹但不懂剧本的画师来制作动画片。画师能画出每一帧都很美的画面,但整个故事却支离破碎、逻辑混乱。问题的根源在于现有的AI系统试图同时处理两个完全不同的任务:理解用户想要什么(语义规划),以及如何将想法转化为逼真画面(视觉合成)。这种"一心二用"导致了频繁的失误。

研究团队提出了一个革命性的解决方案:Plan-X框架。这套系统的核心思想是将"构思剧本"和"拍摄制作"彻底分开,让专业的工具做专业的事。具体来说,他们设计了一个名为"语义规划器"的AI大脑,它的唯一职责就是理解用户指令并制定详细的执行计划,然后将这个计划传递给专门负责视觉制作的AI系统。

这种分工就像现代电影制作流程:编剧负责构思故事情节,导演负责制定拍摄计划,摄影团队负责具体拍摄。每个环节都有专业人员处理,最终效果自然比一个人包揽所有工作要好得多。

一、让AI学会"读懂人话":语义规划器的工作原理

语义规划器本质上是一个经过特殊训练的多模态语言模型,它能够同时理解文字描述和图像内容。当用户输入指令时,这个AI助手会像一个经验丰富的导演一样,仔细分析每个细节:场景中有什么物体,用户希望发生什么动作,这些动作应该按什么顺序执行。

为了让语义规划器能够与视频生成系统"对话",研究团队开发了一套特殊的"视觉语言"——文本对齐视觉标记(TA-Tok)。这套标记系统就像是介于文字和图像之间的"翻译器",能够将抽象的语义概念转换为视觉系统能够理解的具体指令。

比如当用户说"手伸向桌上的护照并把它放到唱片上"时,语义规划器不会简单地将这句话原样传递给视频生成器。相反,它会分析理解:首先,场景中应该有一只手、一本护照、一张桌子和一张唱片;然后,手需要从某个位置移动到护照位置;接着,手要抓取护照;最后,手连同护照一起移动到唱片位置并放下。

语义规划器会将这个详细的执行计划转换为一系列时空语义标记,每个标记都对应视频中的一个关键帧。这些标记就像电影分镜头脚本一样,详细描述了每个时间点应该出现的画面内容。

整个过程采用自回归生成方式,也就是说规划器会一步步地生成计划,每生成一个步骤都会考虑前面已经规划的内容,确保整个执行序列逻辑连贯。这种方式让AI能够处理复杂的多步骤任务,避免了传统方法中常见的动作遗漏或顺序错乱问题。

语义规划器的另一个重要特点是支持多模态输入。它不仅能理解文字指令,还能分析提供的初始图像,理解场景中已有的物体和布局。这种能力让它能够生成与现有场景完全一致的动作计划,避免了传统方法中常出现的物体"凭空出现"或"神秘消失"的问题。

二、将抽象计划转化为具体画面:视觉合成系统的精密配合

有了语义规划器制定的详细执行计划,接下来就需要专门的视觉合成系统将这些抽象指令转化为真实的视频画面。这个环节使用的是基于扩散变换器(DiT)的视频生成模型,它的强项就是制作高质量、时间连贯的视觉内容。

为了让视觉系统能够准确理解和执行语义指令,研究团队设计了一套巧妙的"指导机制"。传统的视频生成系统主要依赖文字描述来指导画面生成,但文字往往过于抽象,难以精确控制具体的空间布局和时间序列。Plan-X系统则在原有文字指导的基础上,增加了一个专门的语义指导分支。

这个语义指导分支接收来自规划器的时空语义标记,并将它们转换为视觉系统能够理解的条件信号。这些信号不是像传统控制方法那样强制规定每个像素的具体值,而是提供了一种更加灵活的"建议"机制。视觉系统可以在遵循这些语义指导的前提下,充分发挥自己在画面质量和时间连贯性方面的优势。

为了确保语义标记与视频内容在空间和时间维度上的精确对应,研究团队引入了三维旋转位置编码(3D RoPE)技术。这项技术为每个语义标记和视频像素都分配了精确的时空坐标,就像给电影中的每个镜头都标注了详细的拍摄位置和时间信息。这样,视觉系统就能准确知道某个动作应该在画面的哪个位置、在什么时间点发生。

整个视觉合成过程采用分阶段训练策略。在第一阶段,系统主要学习如何理解和响应语义指导信号,这时会暂时"忽略"原有的文字指导,专心适应新的控制方式。随着训练进展,文字指导会逐步恢复,最终形成文字和语义双重指导的协调工作模式。

在最终的端到端微调阶段,语义规划器和视觉合成系统会进行联合训练。这个过程就像让导演和摄制组进行磨合排练,确保他们能够默契配合。通过这种联合训练,系统能够更好地适应实际应用中可能出现的各种情况,提高对不完美语义指令的容忍度和自适应能力。

三、实验验证:从理论到实践的完美转身

为了验证Plan-X框架的实际效果,研究团队进行了大规模的实验评估。他们构建了一个包含450万训练视频的大型数据集,涵盖了人机交互、多步骤动作、复杂场景理解等多种挑战性任务。这个数据集就像是AI的"演技训练班",包含了各种复杂的表演场景。

实验设计涵盖了三种主要的视频生成任务:纯文本生成视频(T2V)、图像引导生成视频(I2V)和视频续写。每种任务都有其独特的挑战。纯文本生成需要AI完全凭借文字描述来构建场景,图像引导生成需要AI理解现有画面并在此基础上继续创作,而视频续写则要求AI保持前后内容的高度一致性。

在对比实验中,Plan-X与包括Wan 2.2-5B、HunyuanVideo、SkyReelsV2-14B、Kling 1.6和Seedance 1.0在内的五个最先进的视频生成系统进行了全面比较。评估标准包括动作准确性、指令完整性、画面保真度、场景一致性、动作自然度和整体视觉质量等六个维度。

评估过程采用了创新的方法:利用最先进的多模态语言模型Gemini 2.5作为"AI评委",对生成的视频进行客观打分。这种评估方式比传统的人工评估更加标准化和可重复,同时也进行了16人的人类偏好测试作为补充验证。

实验结果显示了Plan-X的显著优势。在动作准确性方面,Plan-X达到了0.7971的得分,相比最强基线系统Seedance 1.0的0.7114有了明显提升。在指令完整性方面,Plan-X的得分为0.8571,远超Seedance 1.0的0.7943。这些数据背后反映的是AI对复杂指令理解和执行能力的质的飞跃。

更令人印象深刻的是,Plan-X在保持高语义准确性的同时,并没有牺牲视觉质量。在画面保真度方面,Plan-X达到了0.9657的高分,在视觉质量方面得分为0.9629。这证明了"分工协作"的设计理念确实能够实现"鱼和熊掌兼得"的效果。

人类偏好测试的结果更加直观地证明了Plan-X的优势。在所有对比中,有26.2%的评价者将Plan-X的生成结果选为最优,这个比例显著高于其他所有系统。评价者普遍认为Plan-X生成的视频在动作逻辑、物体一致性和整体观感方面都更加出色。

四、深入解析:为什么分工协作如此有效

Plan-X成功的关键在于其"术业有专攻"的设计哲学。传统的端到端视频生成系统就像是要求一个人同时担任编剧、导演、摄影师和后期制作的角色,虽然理论上可行,但实际效果往往差强人意。而Plan-X则将这些职责明确分工,让每个组件都能专注于自己最擅长的任务。

语义规划器的优势在于其强大的多模态推理能力。作为基于大型语言模型的系统,它天生具备优秀的逻辑推理和上下文理解能力。通过专门的训练,它学会了将抽象的人类指令转换为具体的执行步骤,并且能够考虑时间序列、空间关系和因果逻辑等复杂因素。

视觉合成系统则专注于发挥扩散模型在高质量图像生成方面的优势。这类模型在处理光影效果、纹理细节、运动模糊等视觉元素方面表现卓越,但在理解复杂语义指令方面相对较弱。通过接受来自语义规划器的结构化指导,它能够在保持视觉质量的同时,大幅提升语义准确性。

TA-Tok标记系统在整个框架中发挥了"翻译器"的关键作用。这套系统基于SigLIP2视觉编码器,能够将图像内容编码为与文本空间对齐的离散标记。这种设计让语言模型能够像处理文字一样处理视觉信息,同时也让视觉模型能够理解来自语言模型的指导信号。

三维旋转位置编码(3D RoPE)技术确保了语义指导的精确性。传统的视频生成方法往往只考虑时间维度的连贯性,而忽略了空间维度的精确对应。3D RoPE为每个语义标记都分配了详细的时空坐标,让视觉系统能够准确知道某个语义概念应该在视频的哪个位置、什么时间出现。

分阶段训练策略也是成功的关键因素之一。第一阶段的纯语义指导训练让视觉系统充分学习了如何响应结构化的语义信号。第二阶段的混合训练恢复了对文本指导的响应能力。最后的端到端联合训练则让两个子系统学会了协调配合,形成了有机的整体。

这种设计的另一个重要优势是可解释性和可控制性。传统的端到端系统就像一个"黑盒子",用户只能看到输入和输出,无法了解中间的决策过程。而Plan-X的语义规划器会生成可读的语义标记序列,用户可以清楚地看到AI是如何理解指令并制定执行计划的。这种透明性不仅有助于调试和改进,也为未来的交互式视频编辑应用提供了可能性。

五、技术细节:让抽象设计落地的工程智慧

Plan-X的成功不仅体现在概念设计的巧妙,更体现在技术实现的精细。研究团队在将理论设计转化为可用系统的过程中,解决了许多实际工程挑战。

在数据处理方面,团队构建了统一的指令格式,能够同时支持文本到视频、图像到视频和视频续写三种不同的生成任务。这种统一格式就像是制定了一套标准的"工作流程",让同一套系统能够灵活应对不同的应用场景。

语义规划器的训练采用了4K标记的上下文窗口,这个长度足以支持20秒视频的语义规划。训练过程中使用了0.9的采样温度,在创造性和一致性之间找到了最佳平衡点。过高的温度会导致生成内容过于随机,过低则会让输出过于保守和重复。

在视觉合成方面,系统使用50步去噪过程和5.0的无分类器指导权重。这些参数是通过大量实验调优得出的最佳配置,能够在生成质量和计算效率之间取得良好平衡。

TA-Tok标记系统使用了81个空间标记来表示每个关键帧,这个数量既保证了足够的空间分辨率,又避免了过度的计算负担。关键帧采样频率设置为2FPS,这个频率能够捕捉主要的动作变化,同时避免冗余信息。

端到端训练阶段使用了加权损失函数,扩散损失和TA-Tok预测损失的权重比例为10:1。这种配置确保系统在学习语义理解能力的同时,不会损失原有的视觉生成质量。

整个系统在48块A100 GPU上进行训练,有效批量大小为48,使用AdamW优化器,语义规划器和视觉合成器的学习率分别为5×10^-5和2×10^-5。语义规划器训练7个epoch,视觉合成器训练2个epoch,最后进行1个epoch的联合端到端微调。

这些看似枯燥的技术参数背后,体现的是研究团队在系统工程方面的深厚功底。每个参数的选择都基于大量的实验验证和理论分析,确保了系统的稳定性和性能。

六、局限性与未来展望:完美路上的下一步

尽管Plan-X在视频生成的语义控制方面取得了重大突破,但研究团队也诚实地指出了当前系统的一些局限性。这种客观的自我评估体现了严谨的科研态度,也为未来的改进指明了方向。

目前系统最主要的限制来自于其依赖预训练的扩散变换器进行最终的视觉渲染。虽然语义规划大大改善了动作逻辑和指令遵循能力,但在物理真实性和视觉一致性方面,系统仍然会继承底层视觉模型的一些问题。比如在处理复杂的物体变形、光影变化或精细的物理交互时,可能会出现不够自然的效果。

另一个重要限制是语义规划器的训练数据规模。虽然450万个文本-视频对已经是一个相当大的数据集,但相比于大型语言模型动辄数万亿参数的训练规模,这个数据量仍然相对有限。这导致系统在处理需要高度抽象推理或常识性知识的任务时,可能会表现不如预期。

TA-Tok视觉标记系统虽然实现了文本与视觉的有效对齐,但在表达能力方面仍有提升空间。特别是在处理复杂概念、抽象推理或数学符号等内容时,当前的标记系统可能无法提供足够丰富的表示能力。

研究团队也提到了计算资源的考虑。虽然分工协作的设计在理论上更加高效,但实际部署时需要同时运行语义规划器和视觉合成器两套系统,这对计算资源和内存的需求比单一端到端系统更高。在资源受限的场景中,如何优化系统架构以降低计算成本将是一个重要的工程挑战。

展望未来,研究团队提出了几个有希望的发展方向。首先是扩展到视频理解和编辑领域,利用相同的语义规划框架实现更加智能的视频分析和交互式编辑功能。这种扩展将让Plan-X从单纯的生成工具演进为综合性的视频处理平台。

开发更加表达力丰富的文本对齐视觉语义标记系统也是重要的研究方向。未来的标记系统可能会整合更多模态的信息,比如音频、深度、运动矢量等,提供更加全面和精确的语义表示能力。

在应用层面,Plan-X的语义转移能力开辟了有趣的可能性。由于语义标记编码的是高层次的动作逻辑而非具体的像素信息,同一套语义规划可以应用到不同的场景或对象上,实现"一次规划,多次使用"的效果。这种能力在内容创作、教育培训、虚拟现实等领域都有广阔的应用前景。

说到底,Plan-X代表的不仅仅是一项技术突破,更是AI系统设计哲学的重要转变。它证明了在人工智能发展的道路上,"分工合作"比"万能全才"往往更加有效。这种思路不仅适用于视频生成,也可能在其他复杂AI任务中发挥重要作用。

未来的AI系统可能会越来越多地采用这种模块化、专业化的设计思路,每个模块专注于自己最擅长的任务,通过精心设计的接口进行协调合作。这样的系统不仅性能更优,也更容易理解、调试和改进,为AI技术的进一步发展铺平了道路。

Q&A

Q1:Plan-X和普通的AI视频生成有什么不同?

A:Plan-X最大的不同是采用了"分工协作"的设计。普通AI视频生成系统试图一次性完成理解指令和制作画面两项任务,经常出现动作错乱、物体消失等问题。而Plan-X先用专门的"语义规划器"理解用户指令并制定详细执行计划,再让专门的视觉系统负责制作高质量画面,就像电影制作中编剧和摄影师分工合作一样。

Q2:语义规划器是如何工作的?

A:语义规划器本质上是一个经过特殊训练的多模态语言模型,它能同时理解文字和图像。当你输入"手伸向桌上的护照"这样的指令时,它会详细分析场景中的物体、规划动作步骤,然后生成一系列时空语义标记,就像制作电影分镜头脚本一样。这些标记会告诉视觉系统在什么时间、什么位置应该出现什么内容。

Q3:Plan-X能处理哪些类型的视频生成任务?

A:Plan-X支持三种主要任务:纯文本生成视频、图像引导生成视频和视频续写。它特别擅长处理复杂的人机交互场景、多步骤动作序列和长期规划任务。比如"女人从地上站起来,环顾四周,然后伸展身体"这样的连续动作,或者"手拿起桌上的物品放到指定位置"这样的精确操作,Plan-X都能生成逻辑清晰、动作连贯的视频。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1159552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【网络安全】Windows 版 Nmap 端口扫描工具:完整安装教程 + 命令全集!

Nmap的介绍 nmap(Network Mapper)是一款开源免费的针对大型网络的端口扫描工具,nmap可以检测目标主机是否在线、主机端口开放情况、检测主机运行的服务类型及版本信息、检测操作系统与设备类型等信息。本文主要介绍nmap工具安装和基本使用方…

网安转行必学:Kali Linux 渗透测试系统入门指南(常用命令详解)

Kali Linux 入门:转行网络安全必学的渗透测试系统(常用命令详解) 引言 我转行面试渗透测试岗位时,面试官问 “你用过 Kali Linux 吗?会用里面的 Nmap、Sqlmap 吗?”—— 当时我只在 Windows 上用过 Sqlmap…

AbMole | 揭示SIRT6-H3K9la-MGMT轴:提升TMZ敏感性关键通路

胶质母细胞瘤(Glioblastoma, GBM)作为最具侵袭性和致命性的原发性脑肿瘤,其临床管理长期面临严峻挑战。尽管烷化剂替莫唑胺(Temozolomide, TMZ)因其良好的血脑屏障穿透能力而被确立为一线干预化合物,但超过…

人工智能早间新闻速递 — 2026年1月14日

🌍 一、政策与产业动态 🇨🇳 国内:推动AI教育与产业融合 甘肃省教育厅发布《人工智能赋能基础教育实施方案(2025–2030)》,提出全面推进AI与中小学教育深度融合,构建系统AI通识教育…

二分——Schedule Management

点击进入题目 思路描述 用二分&#xff0c;二分时间&#xff0c;看这段时间内工人们的工作量。在这段时间内&#xff0c;每个工人都先做自己擅长做的&#xff0c;然后再干自己不擅长干的&#xff0c;计算出总工作量。 #include<bits/stdc.h> #define int long long usi…

淘宝评论API:差评预警系统,及时处理!

在电商平台如淘宝上&#xff0c;商品评论是消费者决策的重要参考。差评&#xff08;负面评论&#xff09;不仅影响商家信誉&#xff0c;还可能导致销量下降。及时处理差评能提升客户满意度、维护品牌形象。本技术帖将介绍如何利用淘宝评论API构建一个差评预警系统&#xff0c;帮…

缺口 480 万!这个领域未来 10 年吃香,零基础小白快上车

缺口480万&#xff01;这个缺人到疯的领域&#xff0c;闭眼入行都能赚&#xff1f; 当数字化浪潮席卷各行各业&#xff0c;网络安全已从“可选配置”变成“生存刚需”。权威数据显示&#xff0c;2026年全球网络安全人才缺口将攀升至480万&#xff0c;国内缺口超300万&#xff…

测试域名挖掘 = 漏洞提款机?SRC 挖洞攻略,零基础看这篇就够

从测试域名挖掘入手&#xff1a;探索SRC漏洞的深度攻略 在网络安全领域&#xff0c;SRC&#xff08;安全应急响应中心&#xff09;漏洞挖掘是一场充满挑战与机遇的探索之旅。近期在对某SRC进行挖掘的过程中&#xff0c;一套独特且通用的挖掘思路浮出水面&#xff0c;其围绕测试…

【课程设计/毕业设计】基于python-CNN深度学习对苹果是否腐烂识别基于python-CNN对苹果是否腐烂识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

深度学习毕设项目推荐-基于python_CNN深度学习卷积神经网络训练识别橘子是否新鲜

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

深度学习毕设项目:基于深度学习对苹果是否腐烂识别基于python-CNN深度学习对苹果是否腐烂识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

PMSM谐波抑制算法:基于DQ轴谐波提取器的永磁同步电机仿真探索

PMSM谐波抑制算法基于DQ轴谐波提取器的永磁同步电机仿真 1.通过谐波提取器&#xff0c;直接提取DQ轴的谐波分量进行抑制&#xff0c; 对五七次谐波电流抑制效果效果很好。 2.为了放大效果&#xff0c;采用主动注入谐波电压的方法&#xff0c;增大了电机中的谐波分量。 3.调制算…

深度学习计算机毕设之基于python-CNN深度学习对苹果是否腐烂识别基于机器学习对苹果是否腐烂识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

学霸同款2026 TOP8 AI论文平台:专科生毕业论文写作全测评

学霸同款2026 TOP8 AI论文平台&#xff1a;专科生毕业论文写作全测评 一、不同维度核心推荐&#xff1a;8款AI工具各有所长 对于专科生而言&#xff0c;撰写毕业论文是一项复杂且耗时的任务&#xff0c;涉及开题、初稿、查重、降重、排版等多个环节。每一步都可能遇到不同的挑…

用 LabVIEW 实现三菱 FX 系列以太网 MC 协议通讯

labview 编写的三菱fx系列&#xff0c;以太网MC协议通讯在工业自动化领域&#xff0c;不同设备之间的通讯至关重要。三菱 FX 系列 PLC 是广泛应用的控制器&#xff0c;而以太网 MC 协议为其提供了高效的通讯方式。LabVIEW 作为一款强大的图形化编程软件&#xff0c;能让我们轻松…

计算机深度学习毕设实战-基于python对苹果是否腐烂识别基于python-CNN深度学习对苹果是否腐烂识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

系统转换方式 *并行转换**- 新旧系统同时运行一段时间,确保新系统稳定可靠,适用于对数据准确性要求高的场景

一、系统转换方式并行转换 新旧系统同时运行一段时间&#xff0c;确保新系统稳定可靠&#xff0c;适用于对数据准确性要求高的场景&#xff08;如银行、财务系统&#xff09;。优点&#xff1a;安全性高&#xff0c;便于对比性能&#xff0c;降低切换风险。缺点&#xff1a;资源…

系统转换方式 *并行转换**- 新旧系统同时运行一段时间,确保新系统稳定可靠,适用于对数据准确性要求高的场景

一、系统转换方式并行转换 新旧系统同时运行一段时间&#xff0c;确保新系统稳定可靠&#xff0c;适用于对数据准确性要求高的场景&#xff08;如银行、财务系统&#xff09;。优点&#xff1a;安全性高&#xff0c;便于对比性能&#xff0c;降低切换风险。缺点&#xff1a;资源…

深度学习毕设选题推荐:基于python-CNN卷神经网络机器学习对苹果是否腐烂识别基于python-CNN深度学习对苹果是否腐烂识别

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

【踩坑】IDEA使用Git push代码时,涵盖了.idea与target

先说说我遇到的这个问题&#xff0c;我项目根目录下已经写了.gitignore文件&#xff0c;是这样的&#xff1a;# 编译产物 target/ classes/ *.class# Maven/Gradle .mvn/ gradle/ gradlew gradlew.bat pom.xml.tag pom.xml.releaseBackup# IDE配置文件&#xff08;IDEA专属&…