赛博炼丹新姿势!在NAS里造一个听劝的AI图片编辑网站

「NAS、键盘、路由器······年轻就要多折腾,我是爱折腾的熊猫,今天又给大家分享最近折腾的内容了,关注是对我最大的支持,阿里嘎多」

引言

大部分时候,AI都是被我们用来进行文字生成、图片生成等工作,但实际上基于AI我们也可以进行逆向操作,它不光会从零创造,更擅长对已有的文件“动手脚”,最典型的例子,就是目前各大手机厂商上的AI消除、去反光等功能。

目前咱们已知极空间的相册已经有了AI选片、照片去重、图片压缩以及对于老照片的修复、上色以及清晰度提升等功能,在相册功能这块,极空间确实是妥妥地走在了行业前沿。除此之外,通过Docker还可以把图像处理的玩法无限拓展,比如部署熊猫今天要介绍的AI-Image-Edit。

项目介绍

作为新晋项目,AI-Image-Edit目前的功能其实并不多,但它的思路很有意思。相较于传统的文生图以及图生图,AI-Image-Edit的主要功能还是集中在对图像的二次编辑上,感兴趣的可以去看看开源地址的介绍:https://github.com/chunxiuxiamo/ai-image-edit。

在首页,项目的左边有一处上传按钮,通过它可以上传图像,而右边则提供了图像的生成和编辑,因为要涉及到中文的输出,所以这里建议是使用nano-banana2。

至于nano-banana2的API,目前熊猫是没找到稳定的白嫖项目,想要使用暂时只能用半公益的站点,推荐上个人推荐老张API,在AI圈内也是比较知名的老牌API网站了,感兴趣的可以了解(非推广:https://api.laozhang.ai/register/?aff_code=rDFp)

除了gemini官方,也支持OpenAI接口的第三方模型,支持接口地址自定义。除此之外就是下方的图片尺寸与宽高比设置,最大支持4K的输出,不过测试4K下不支持流式传输,同时2K的输出时间要快一些,精度要求不高个人建议2K其实就够用了。

当我们需要改变一张图中的元素时,将其图片上传,随后通过画笔工具将需要修改的位置进行涂抹,最后在右边会得到编辑指令,AI会根据指令识别其中的区域,这时候就可以根据你的需求改变其中的一些元素,例如文字信息。

除了文字,也可以用于人物消除、AI扣图以及背景统一等等功能,其操作和原理其实和咱们日常手机上的相册AI相差不大,只不过因为基于Gemini3 Pro,所以它对于中文的支持更好。

项目部署

AI-Image-Edit并没有提供已经打包好的镜像供我们使用,不过作者提供了Dockerfile文件,所以你可以直接将项目下载下来之后自行构建,或者直接用熊猫构建好的容器镜像。

熊猫构建的镜像地址为:ghcr.io/panda-995/nano-banana-web:latest,针对这种非DockerHUB上的镜像,在进行镜像拉取一定记得带上站点的名称,随后通过极空间Docker仓库的自定义拉取去进行操作。

因为项目不存在环境变量以及文件存储的映射,所以我们下载好镜像之后直接在本地镜像中找到他,随后双击创建容器就行,只需要映射容器端口即可。或者直接用Compose进行拉取与容器创建。

version:'3.8'# Compose 文件版本,选择兼容主流 Docker 版本的 3.8services: nano-banana-web: image: ghcr.io/panda-995/nano-banana-web:latest container_name: nano-banana-web ports: -"8868:80"restart: always

最后通过极空间的远程访问就可以直接访问项目的首页了,项目并不具备鉴权,所以记得不要将其暴露到公网之下。

写在最后

将新兴的AI应用部署到自己的极空间NAS上,这本身就是一种乐趣,AI-Image-Edit虽然目前功能还在早期,但将新兴的AI应用部署到自己的极空间NAS上,这本身就是一种乐趣。

以上便是本次分享的全部内容了,如果你觉得还算有趣或者对你有所帮助,不妨点赞收藏,最后也希望能得到你的关注,咱们下期见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1137680.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qwen2.5-7B知识检索:外部数据库接入

Qwen2.5-7B知识检索:外部数据库接入 1. 引言:为何需要将Qwen2.5-7B与外部数据库结合 1.1 大模型的知识局限性 尽管 Qwen2.5-7B 是阿里云最新发布的高性能大语言模型,具备高达 131,072 tokens 的上下文长度 和对多领域任务的卓越理解能力&a…

【水果质量检测】用于缺陷水果分选的机器学习算法研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

【数据集】时空特征融合的风电机组故障诊断数据集

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

串口通信常见问题解答:新手入门必读

串口通信常见问题解答:新手入门必读 你有没有遇到过这样的场景?STM32烧录程序后,串口助手一片空白;ESP8266明明发了AT指令,却像石沉大海;两个单片机接在一起,数据对不上号……别急,这…

Qwen2.5-7B vs ChatGLM4实战对比:数学与编程能力全面评测

Qwen2.5-7B vs ChatGLM4实战对比:数学与编程能力全面评测 1. 背景与评测目标 随着大语言模型在科研与工程领域的广泛应用,开发者对模型的数学推理能力和代码生成质量提出了更高要求。阿里云最新发布的 Qwen2.5-7B 模型,在编程与数学领域宣称…

Qwen2.5-7B中文处理能力:本土化应用的突出优势

Qwen2.5-7B中文处理能力:本土化应用的突出优势 1. 技术背景与核心价值 随着大语言模型在多语言理解与生成任务中的广泛应用,中文场景下的语义理解、文化适配和本地化表达成为衡量模型实用性的关键指标。阿里云推出的 Qwen2.5-7B 模型,作为 Q…

【质量评估】基于正则化逻辑回归的微芯片质检预测模型研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Qwen2.5-7B商业文案生成:营销内容自动化

Qwen2.5-7B商业文案生成:营销内容自动化 1. 引言:大模型驱动的营销内容自动化新范式 1.1 营销内容生产的挑战与机遇 在数字化营销时代,企业对高质量、高频率、多语言内容的需求呈指数级增长。传统人工撰写方式不仅效率低下,且难…

Qwen2.5-7B与Gemini对比:多语言任务GPU效率评测

Qwen2.5-7B与Gemini对比:多语言任务GPU效率评测 1. 背景与评测目标 随着大语言模型在多语言场景下的广泛应用,如何在有限的GPU资源下实现高效推理成为工程落地的关键挑战。本次评测聚焦于阿里云开源的Qwen2.5-7B与Google Gemini(Pro版本&…

Qwen2.5-7B法律咨询应用:常见问题自动解答

Qwen2.5-7B法律咨询应用:常见问题自动解答 1. 引言:为何选择Qwen2.5-7B构建法律咨询助手? 在法律服务领域,用户常面临大量重复性、基础性的法律问题咨询需求,如“劳动合同解除的赔偿标准”、“交通事故责任划分依据”…

开源大模型选型指南:Qwen2.5-7B是否适合你的业务场景?

开源大模型选型指南:Qwen2.5-7B是否适合你的业务场景? 在当前大语言模型快速演进的背景下,企业与开发者面临的核心挑战之一是如何从众多开源模型中选择最适合自身业务需求的技术方案。阿里云推出的 Qwen2.5-7B 作为 Qwen 系列最新迭代成果&a…

Qwen2.5-7B部署省成本:按需算力+镜像免配置方案实测

Qwen2.5-7B部署省成本:按需算力镜像免配置方案实测 1. 引言:大模型落地的现实挑战与新思路 随着大语言模型(LLM)在自然语言理解、代码生成、多轮对话等场景中的广泛应用,企业与开发者对高性能模型的需求日益增长。阿里…

一文说清多线程/单线程/逻辑核心,让你少走弯路

前阵子翻出台双路Xeon E5-2680 v4的老机器,盯着任务管理器里那56个线程格子,突然就琢磨过来:好多兄弟对“多核利用”“高性能架构”的理解,还停在十年前的老路子上。1. 56个线程格子,不代表能跑快56倍 不少人看任务管理…

Qwen2.5-7B部署节省成本:按小时计费GPU方案实战

Qwen2.5-7B部署节省成本:按小时计费GPU方案实战 1. 背景与挑战:大模型推理的成本瓶颈 随着大语言模型(LLM)在实际业务中的广泛应用,如何高效、低成本地部署高性能模型成为企业关注的核心问题。Qwen2.5-7B作为阿里云最…

Qwen2.5-7B如何提升吞吐量?批量推理部署优化指南

Qwen2.5-7B如何提升吞吐量?批量推理部署优化指南 1. 背景与挑战:从单请求到高并发的推理瓶颈 随着大语言模型(LLM)在实际业务中的广泛应用,推理服务的吞吐量成为决定用户体验和系统成本的核心指标。Qwen2.5-7B 作为阿…

Qwen2.5-7B成本优化实战:中小企业低成本部署完整指南

Qwen2.5-7B成本优化实战:中小企业低成本部署完整指南 1. 引言:为何选择Qwen2.5-7B进行低成本部署? 随着大语言模型(LLM)在企业服务、智能客服、内容生成等场景的广泛应用,如何以最低成本实现高性能模型的本…

Packet Tracer使用教程:三层交换机配置深度剖析

三层交换实战入门:用Packet Tracer搞定跨VLAN通信你有没有遇到过这样的情况?公司里财务部和人事部都连在同一台交换机上,但彼此却ping不通——不是网线问题,也不是IP配错了,而是因为它们被划分到了不同的VLAN。这其实是…

狂揽1.5k Star!别再裸写项目了,这个全栈框架让你3分钟上线应用

每次我有个绝妙的 Side Project 想法时,一腔热血总会被现实浇灭。我不想从零开始搭建用户系统、配置数据库、接入支付、设置邮件服务……这些重复的脏活累活,往往会消耗掉我 80% 的精力。一个残酷的现实是,大部分独立开发项目都死在了起跑线上…

GeeLark 12月功能更新合集

新建环境 ・支持自定义设置云手机设备名称 自动化 ・「 Instagram AI 养号」模板支持设置关键词 ・ 「 TikTok 发布图集」支持带货 ・ 增加浏览器自动化模块,支持导入 GAL 阅读更多👉又更新了 看看怎么个事? ・ 循环任务支持随机发布时间…

Qwen2.5-7B新闻媒体应用:热点文章自动生成系统搭建

Qwen2.5-7B新闻媒体应用:热点文章自动生成系统搭建 随着大模型技术的快速发展,自动化内容生成已成为新闻媒体行业提升效率、实现智能化转型的重要路径。传统新闻采编流程依赖人工撰写与编辑,响应速度慢、人力成本高,尤其在应对突…