DeepSeek R1生成图片总结2(虽然本身是不能直接生成图片,但是可以想办法利用别的工具一起实现)

DeepSeek官网

目前阶段,DeepSeek R1是不能直接生成图片的,但可以通过优化文本后转换为SVG或HTML代码,再保存为图片。另外,Janus-Pro是DeepSeek的多模态模型,支持文生图,但需要本地部署或者使用第三方工具。还有第三方AI工具结合DeepSeek生成的提示词来生成图片。

DeepSeek 虽然本身并非多模态模型(如 R1 系列),但通过多种方法仍可实现文字生成图片或处理图片的需求。以下是我综合目前多个来源总结的具体方法及步骤:

一、直接生成 SVG 图片

DeepSeek R1 支持直接生成 SVG 格式的矢量图代码,用户可将其保存为 .svg 文件并通过浏览器查看。具体步骤:

优化文本内容:使用“背景颜色+页面元素需求+约束条件”模板或模仿特定风格优化原始文本。

  • 示例提问:帮我生成图片:生成一个高端一点的,纯色,渐变的背景图,不要有其他元素,图片风格为清新,尺寸为16:9,主色调:科技蓝(#007BFF)或环保绿(#28A745),渐变过渡,体现科技感和环保主题
  1. 转换为 SVG:要求 DeepSeek 将优化后的文本转为 SVG 代码,并指定配色、布局等要求。

  • 示例指令:“将上述内容转为 SVG 图片,要求配色简约,布局清晰。”
  • 这样生成的代码可直接保存为 .svg 文件,或通过在线工具调整样式。

  • 如果觉得生成的样式是满意的样式,则复制整块内容,创建一个新文件,修改后缀名为 svg,再将内容贴进去就行了。
  • 如果你觉得样式还需要调整,则根据 DeepSeek 提示的配色方案,布局结构等继续调整,直至满意为止。

二、利用html代码完成布局,生成 PNG/JPG 效果图片

  • 若需生成常见格式(如 PNG、JPG),可通过以下两种方式:

  • 生成 HTML 代码并转换
    要求 DeepSeek 输出包含文本内容的 HTML 文件,并嵌入下载按钮(生成图片时隐藏按钮)。例如:先生成一篇
    “将回答以攻略卡片风格展示为 HTML,每块文本对应一个卡片,配色简约。”
    运行 HTML 后,通过浏览器截图或使用工具(如 Puppeteer)导出为图片。

  • 结合 Python 库
    利用 DeepSeek 生成调用 Pillow 或 Matplotlib 的代码脚本,自动将文本转换为图片。


三、生成 Mermaid 图表

  • DeepSeek 支持 Mermaid 语法生成流程图、思维导图等图表。步骤:

  • 要求生成特定主题的 Mermaid 代码(如书籍思维导图)。

    • 示例指令:
      “生成《悲惨世界》的思维导图,使用 Mermaid 格式。”

  • Mermaid数据粘贴至 Mermaid Live 编辑器 渲染并导出为 PNG/SVG


四、结合第三方 AI 工具

DeepSeek 非常擅长生成提示词。所以可以通过 DeepSeek 先生成高质量的提示词,再借助专业文生图工具完成创作:

生成提示词

  • 要求 DeepSeek 输出英文提示词(效果优于中文),例如:
    “生成一段英文提示词,描述‘鲸鱼跃出海面喷水’的场景,包含细节和艺术风格。”

  • 使用工具生成图片
    推荐工具包括 Midjourney(速度快、质量高)、Stable Diffusion(开源可定制)、即梦 AI(支持中文)、Bing Image Creator(基于 DALL·E 3)等。

五、使用多模态模型 Janus-Pro

  1. 部署步骤

  • 从 GitHub 克隆仓库,安装依赖并运行脚本(需 CUDA 支持)。
  • 修改配置加载 7B 模型(需 8GB 以上显存)。
  1. 生成图片

    输入文本指令(如“生成现代风格的城市天际线”),模型会输出图片。实测显示其生成速度较慢,但指令跟随能力优于 Stable Diffusion。

六、图片处理与代码生成

  • 示例
    “生成 HTML 代码,将上传的图片转为像素圆点风格。”
    需多次调试代码并配合工具(如 Photoshop 脚本)实现效果。

总结与建议

  • 优先场景:直接生成 SVG 或 Mermaid 图表适合快速可视化;复杂图片建议结合第三方工具。

  • 性能考量:Janus-Pro 适合本地部署用户,但对硬件要求较高;普通用户推荐即梦 AI 或 Midjourney。

  • 提示词优化:通过 DeepSeek 优化提示词可显著提升生成质量,尤其是英文提示词

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/70199.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是Dubbo?Dubbo框架知识点,面试题总结

本篇包含什么是Dubbo,Dubbo的实现原理,节点角色说明,调用关系说明,在实际开发的场景中应该如何选择RPC框架,Dubbo的核心架构,Dubbo的整体架构设计及分层。 主页还有其他的面试资料,有需要的可以…

kafka消费能力压测:使用官方工具

背景 在之前的业务场景中,我们发现Kafka的实际消费能力远低于预期。尽管我们使用了kafka-go组件并进行了相关测试,测试情况见《kafka-go:性能测试》这篇文章。但并未能准确找出消费能力低下的原因。 我们曾怀疑这可能是由我的电脑网络带宽问题或Kafka部…

【大学生职业规划大赛备赛PPT资料PDF | 免费共享】

自取链接: 链接:https://pan.quark.cn/s/4fa45515325e 📢 同学,你是不是正在为职业规划大赛发愁? 想展示独特思路却不知如何下手? 想用专业模板却找不到资源? 别担心!我整理了全网…

ubuntu20动态修改ip,springboot中yaml的内容的读取,修改,写入

文章目录 前言引入包yaml原始内容操作目标具体代码执行查看结果总结: 前言 之前有个需求,动态修改ubuntu20的ip,看了下: 本质上是修改01-netcfg.yaml文件,然后执行netplan apply就可以了。 所以,需求就变成了 如何对ya…

【算法】双指针(下)

目录 查找总价格为目标值的两个商品 暴力解题 双指针解题 三数之和 双指针解题(左右指针) 四数之和 双指针解题 双指针关键点 注意事项 查找总价格为目标值的两个商品 题目链接:LCR 179. 查找总价格为目标值的两个商品 - 力扣(LeetCode&#x…

Windows 图形显示驱动开发-IoMmu 模型

输入输出内存管理单元 (IOMMU) 是一个硬件组件,它将支持具有 DMA 功能的 I/O 总线连接到系统内存。 它将设备可见的虚拟地址映射到物理地址,使其在虚拟化中很有用。 在 WDDM 2.0 IoMmu 模型中,每个进程都有一个虚拟地址空间,即&a…

软件测评报告包括哪些内容?第三方软件测评机构推荐

在当今信息技术飞速发展的时代,软件的品质与性能直接影响到企业的运营效率和市场竞争力。为了确保软件的可用性和可靠性,软件测评成为一个不可或缺的环节,软件测评报告也是对软件产品进行全面评估后形成的一份文档,旨在系统地纪录…

深浅拷贝区别,怎么区别使用

在 JavaScript 中,深拷贝(Deep Copy) 和 浅拷贝(Shallow Copy) 是两种不同的对象复制方式,它们的区别主要体现在对嵌套对象的处理上。以下是它们的详细对比及使用场景: 1. 浅拷贝(Sh…

tailscale + derp中继 + 阿里云服务器 (无域名版)

使用tailscale默认的中转节点延迟很高,因为服务器都在国外。 感谢大佬提供的方案:Tailscale 搭建derp中继节点,不需要域名,不需要备案,不需要申请证书(最新) - yafeng - 博客园 基于这个方案&…

【异常错误】pycharm debug view变量的时候显示不全,中间会以...显示

异常问题: 这个是在新版的pycharm中出现的,出现的问题,点击view后不全部显示,而是以...折叠显示 在setting中这么设置一下就好了: 解决办法: https://youtrack.jetbrains.com/issue/PY-75568/Large-stri…

【DeepSeek系列】04 DeepSeek-R1:带有冷启动的强化学习

文章目录 1、简介2、主要改进点3、两个重要观点4、四阶段后训练详细步骤4.1 冷启动4.2 推理导向的强化学习4.3 拒绝采样和有监督微调4.4 针对所有场景的强化学习 5、蒸馏与强化学习对比6、评估6.1 DeepSeek-R1 评估6.2 蒸馏模型评估 7、结论8、局限性与未来方向 1、简介 DeepS…

车载音频配置(二)

目录 OEM 自定义的车载音频上下文 动态音频区配置 向前兼容性 Android 14 车载音频配置 在 Android 14 中,AAOS 引入了 OEM 插件服务,使你可以更主动地管理由车载音频服务监督的音频行为。 随着新的插件服务的引入,车载音频配置文件中添加了以下更改: • OEM 自定义的车…

禁止WPS强制打开PDF文件

原文网址:禁止WPS强制打开PDF文件_IT利刃出鞘的博客-CSDN博客 简介 本文介绍如何避免WPS强制打开PDF文件。 方法 1.删除注册表里.pdf的WPS绑定 WinR,输入:regedit,回车。找到:HKEY_CLASSES_ROOT\.pdf删除KWPS.PDF…

深入解析NoSQL数据库:从文档存储到图数据库的全场景实践

title: 深入解析NoSQL数据库:从文档存储到图数据库的全场景实践 date: 2025/2/19 updated: 2025/2/19 author: cmdragon excerpt: 通过电商、社交网络、物联网等12个行业场景,结合MongoDB聚合管道、Redis Stream实时处理、Cassandra SSTable存储引擎、Neo4j路径遍历算法等42…

用 Biome 替代 ESLint 和 Prettier

简介 ESLint 和 Prettier ESLint:代码质量检查工具,确保代码风格一致与无错误 Prettier:代码格式化工具,自动美化代码布局 所以:ESLint Prettier 能自动美化代码、自动检查代码错误的工具 Biome Biome:…

6.3 DBMS的功能和特征

文章目录 DBMS的6大功能DBMS的3个特征DBMS的分类 DBMS的6大功能 DBMS包含数据定义,数据库操作(检索、插入、修改、删除),数据库运行管理(保证多用户环境下正常运行),数据组织、存储、管理&…

力扣hot100——找到字符串中的所有字母异位词

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。 解法思路: 1. // 判断字符相等,其实就是给定一个定长的窗口去滑动查找子串,为了便于判断将p 与窗口中的子…

前端插件使用xlsx-populate,花样配置excel内容,根据坐添加标替换excel内容,修改颜色,合并单元格...。

需求要求:业务人员有个非常复杂得excel表格,各种表头等,但是模板是固定得。当然也可以实现在excel上搞出各种表格,但是不如直接用已有模板替换其中要动态得内容方便,这里我们用到CSDN得 xlsx-populate 插件。 实列中我…

未来AI方向落地场景:小语言模型,super_private_agent

未来AI方向落地场景:小语言模型,super_private_agent 目录 未来AI方向落地场景:小语言模型,super_private_agent小语言模型super - private - agent(注重隐私的智能代理)碳基生命和硅基生命交互界面面向agent的专用交互协议和数据接口从web平台经济到网络平台举例说明社交…

Coze扣子新功能详解

今晚(2025-01-24)扣子再次进行更新 主要更新内容: 搭建小程序和 H5 用户界面时,支持使用音频组件播放音频内容 数据库操作体验提升 界面优化:对数据库详情界面进行了重新设计,并将工作流运行数据库的测试数据位置从原工作流底…