UltraShape 1.0: 高保真三维形状生成:基于可扩展几何优化

📖 摘要

本报告介绍了UltraShape 1.0——一个可扩展的三维扩散框架,用于生成高保真三维几何体。该方案采用两阶段生成流程:首先生成粗糙的全局结构,然后进行细化以产出细节丰富的高质量几何体。

为实现可靠的三维生成,我们开发了完整的数据处理流程,包含创新的水密处理方法高质量数据过滤。该流程通过剔除低质量样本、填补孔洞及加厚薄壁结构来提升公开三维数据集的几何质量,同时保留细粒度几何细节。

为实现细粒度几何优化,我们在扩散过程中将空间定位与几何细节合成进行解耦。具体通过在固定空间位置执行体素级优化,其中从粗糙几何体导出的体素查询通过RoPE编码提供显式位置锚点,使扩散模型能专注于在结构化简化的解空间内合成局部几何细节。

大量实验表明,UltraShape 1.0在数据处理质量与几何生成方面均与现有开源方案具有竞争力。

🔥 动态

  • [2025-12-25]📄 我们已在arXiv发布UltraShape 1.0技术报告
  • [2025-12-26]🚀 我们发布了推理代码与预训练模型
  • [2025-12-31]🚀 我们发布了训练代码

🗓️ 待办事项

  • 发布推理代码
  • 发布预训练权重(Hugging Face)
  • 发布训练代码
  • 发布数据处理脚本

🛠️ 安装与使用

1. 环境配置

gitclone https://github.com/PKU-YuanGroup/UltraShape-1.0.gitcdUltraShape-1.0# 1. Create and activate the environmentconda create -n ultrashapepython=3.10conda activate ultrashape# 2. Install PyTorch (CUDA 12.1 recommended)pipinstalltorch==2.5.1torchvision==0.20.1torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121# 3. Install dependenciespipinstall-r requirements.txt# 4. Install cubvh (Required for MC acceleration)pipinstallgit+https://github.com/ashawkey/cubvh --no-build-isolation# For Training & Sampling (Optional)pipinstall--no-build-isolation"git+https://github.com/facebookresearch/pytorch3d.git@stable"pipinstallhttps://data.pyg.org/whl/torch-2.5.0%2Bcu121/torch_cluster-1.6.3%2Bpt25cu121-cp310-cp310-linux_x86_64.whl

⬇️ 模型权重

请从Hugging Face [ infinith/UltraShape ] 下载预训练权重,并将其放入您的检查点目录(例如 ./checkpoints/)。

2. 生成粗粒度网格

首先,使用 Hunyuan3D-2.1 从输入图像生成粗粒度网格。

代码库:Tencent-Hunyuan/Hunyuan3D-2.1

按照 Hunyuan3D-2.1 代码库中的说明获取初始网格文件(例如 .glb 或 .obj 格式)。

3. 生成优化后的网格

获得粗粒度网格后,使用提供的脚本运行优化阶段。

运行推理脚本:

shscripts/run.sh

image: 参考图像的路径。

mesh: 粗粒度网格的路径。

output_dir: 保存优化结果的目录。

ckpt: 下载的 UltraShape 检查点路径。

step: DiT 推理采样步数。默认为 50 步,可减少至 12 步以加速生成。

或者,您可以运行 gradio 应用进行交互式推理:

python scripts/gradio_app.py --ckpt<path_to_checkpoint>
低显存模式
  1. 使用较低的num_latents值(建议尝试8192)
  2. 使用较小的chunk_size(建议尝试2048)
  3. 在gradio_app.py和infer_dit_refine.py脚本中尝试添加–low_vram参数

4. 数据准备与训练

首先准备数据,包括水密网格和渲染图像。
然后按以下方式运行采样脚本:

python scripts/sampling.py \ --mesh_json data/mesh_paths.json \ --output_dir data/sample

此处,mesh_json 是一个包含水密网格文件路径的列表。

多节点训练脚本为:

sh train.sh [node_idx]

training_data_list:包含train.json和val.json的文件夹,存储数据集的ID列表。

sample_pcd_dir:包含采样.npz文件的目录。

image_data_json:渲染图像的文件路径。

您可以在train.sh中切换VAE和DiT训练,并在其中指定输出目录和配置文件。

🔗 引用格式

如果您觉得本仓库有帮助,请引用我们的报告:

@article{jia2025ultrashape, title={UltraShape 1.0: High-Fidelity 3D Shape Generation via Scalable Geometric Refinement}, author={Jia, Tanghui and Yan, Dongyu and Hao, Dehao and Li, Yang and Zhang, Kaiyi and He, Xianyi and Li, Lanjiong and Chen, Jinnan and Jiang, Lutao and Yin, Qishen and Quan, Long and Chen, Ying-Cong and Yuan, Li}, journal={arxiv preprint arXiv:2512.21185}, year={2025} }

致谢

我们的代码基于Hunyuan3D-2.1的优秀工作实现。本方法的核心思想深受LATTICE的启发。我们深切感谢这些工作对3D生成领域的贡献。请同时考虑引用Hunyuan3D 2.1LATTICE

  • Hunyuan3D-2.1
  • Lattice3D

代码

https://github.com/PKU-YuanGroup/UltraShape-1.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124583.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型备案全攻略|AI从业者必看避坑指南

✨2026 AI行业合规门槛升级&#xff01;做生成式大模型相关业务的宝子们注意啦&#xff5e; 不管你是团队自研大模型&#xff0c;还是基于开源模型做二次微调&#xff0c;只要最终要面向公众提供服务&#xff08;比如上线AI写作工具、AI绘画平台、智能客服系统等&#xff09;&a…

(167页PPT)制造业精益数字化转型解决方案(附下载方式)

篇幅所限&#xff0c;本文只提供部分资料内容&#xff0c;完整资料请看下面链接 https://download.csdn.net/download/AI_data_cloud/89525624 资料解读&#xff1a;&#xff08;167 页&#xff09;制造业精益数字化转型解决方案 详细资料请看本解读文章的最后内容 本解决方…

接口自动化测试框架详解(pytest+allure+aiohttp+ 用例自动生成)

近期准备优先做接口测试的覆盖&#xff0c;为此需要开发一个测试框架&#xff0c;经过思考&#xff0c;这次依然想做点儿不一样的东西。 接口测试是比较讲究效率的&#xff0c;测试人员会希望很快能得到结果反馈&#xff0c;然而接口的数量一般都很多&#xff0c;而且会越来越…

(168页PPT)华为流程管理精要体系构建规划设计运营评估与持续改善(附下载方式)

篇幅所限&#xff0c;本文只提供部分资料内容&#xff0c;完整资料请看下面链接 https://download.csdn.net/download/AI_data_cloud/89540503 资料解读&#xff1a;华为流程管理精要体系构建规划设计运营评估与持续改善 详细资料请看本解读文章的最后内容 华为流程管理体系…

深度测评8个一键生成论文工具,本科生轻松搞定毕业论文!

深度测评8个一键生成论文工具&#xff0c;本科生轻松搞定毕业论文&#xff01; AI 工具如何改变论文写作的未来 随着人工智能技术的不断进步&#xff0c;越来越多的本科生开始关注 AI 工具在学术写作中的应用。尤其是在面对毕业论文这一重要任务时&#xff0c;如何高效、高质量…

Flutter 插件通信架构设计:从 Channel 到 FFI 的完整边界

在 Flutter 项目中&#xff0c;一旦涉及&#xff1a;蓝牙 / 串口 / USB机器人 / IoT / 设备 SDK音视频 / 图像 / AI系统能力 / 第三方原生库你本质上就进入了一个领域&#xff1a; &#x1f449; Flutter 插件通信架构设计很多项目前期“能跑就行”&#xff0c; 后期会必然遇到…

爆火!9款AI论文工具实测,20分钟生成6万字文献综述!

毕业季紧急预警&#xff1a;你的论文进度&#xff0c;正在被AI甩飞&#xff01; 距离答辩只剩7天&#xff1f;文献综述还没动笔&#xff1f;导师凌晨3点的修改意见堆满邮箱&#xff1f; 正值2024毕业季高压期&#xff0c;87%的高校已将论文提交截止日提前至5月中旬——别人用A…

基于元胞自动机的室内人员疏散基础模型

一、模型核心架构网格划分与状态定义 空间离散化&#xff1a;将疏散区域划分为 NN的均匀网格&#xff0c;每个元胞代表 0.4m0.4m的物理空间。 状态分类&#xff1a; 0&#xff1a;空闲单元格&#xff08;可行走区域&#xff09; 1&#xff1a;人员&#xff08;初始随机分布&…

UE5 C++(11):

&#xff08;52&#xff09; &#xff08;53&#xff09; 谢谢

深度解析智慧路灯大数据平台:物联网 + 大数据构建智慧城市感知底座

在智慧城市建设浪潮中&#xff0c;智慧路灯作为 “城市神经网络” 的核心终端&#xff0c;正从单一照明工具升级为集成多感知、多服务的综合信息化平台。其背后依托的物联网&#xff08;IoT&#xff09;、大数据、GIS 地图管理、无线通信等技术的深度融合&#xff0c;不仅解决了…

基于拥挤距离的多目标粒子群优化算法(MO-PSO-CD)详解

一、算法原理与核心思想 多目标粒子群优化&#xff08;MO-PSO&#xff09;通过群体协作搜索多目标问题的帕累托最优解集&#xff0c;其核心挑战在于平衡收敛性&#xff08;逼近真实前沿&#xff09;与多样性&#xff08;覆盖解空间&#xff09;。**拥挤距离&#xff08;Crowdin…

测试人员作品集的价值重构:超越简历的技术名片

在DevOps与质量左移的行业背景下&#xff0c;测试工程师的能力评估正从"问题发现者"转向"质量赋能者"。据2025年ISTQB行业报告&#xff0c;73%的技术主管将可验证的工程化能力列为招聘首要指标&#xff0c;而传统简历仅能呈现15%的实际技术水平。本文通过三…

BPSK调制仿真代码

BPSK调制仿真代码&#xff0c;包含了信号生成、调制、信道传输和解调的全过程。 %% BPSK调制解调仿真 clear all; close all; clc;%% 1. 参数设置 N 10000; % 比特数 Rb 1000; % 比特率 (bps) fc 10e3; % 载波…

参会预告 | AtomGit 邀您共赴 TritonNext 2026 技术大会,解锁 AI 系统与编译生态新机遇

2026 年开年首场 AI 技术盛宴即将启幕&#xff01;1 月 9 日&#xff0c;国内首个聚焦 Triton 技术与生态的开发者盛会 —— 2026 TritonNext 技术大会&#xff0c;将在北京海淀区中关村国家自主创新示范区展示中心重磅召开。作为深耕开源协作与 AI 基础设施领域的重要力量&…

【teambition 二开】TB JSAPI 学习

开始使用通过 script 标签引入使用 script 标签加载以下 jshttps://g.alicdn.com/code/npm/alife/teambition-jsapi/0.0.33/tb-jsapi.umd.js文件概述这是一个 Teambition JSAPI 库&#xff08;版本 0.0.33&#xff09;&#xff0c;提供了与 Teambition 平台交互的 JavaScript A…

售价1499元起 华为MatePadSE搭载鸿蒙OS2亮相

华为应用市场 2022年4月28日&#xff0c;华为折叠旗舰及全场景新品发布会召开&#xff0c;华为MatePadSE正式发布亮相&#xff0c;搭载HarmonyOS2&#xff0c;为用户带来智慧体验&#xff1b;10.1英寸全高清显示通过德国莱茵低蓝光认证搭配华为Histen7.0音效技术&#xff0c;为…

飞凌嵌入式ElfBoard-打开目录readdir

1.头文件#include <dirent.h>2.函数原型struct dirent *readdir(DIR *dirp);3.参数dirp&#xff1a;指向由 opendir() 返回的 DIR 结构体的指针&#xff0c;用于表示打开的目录流。4.返回值成功&#xff1a;返回指向 dirent 结构体的指针&#xff0c;该结构体包含目录项的…

飞凌嵌入式ElfBoard-打开目录closedir

用于关闭目录流的函数。 1.头文件 #include <sys/types.h> #include <dirent.h> 2.函数原型 int closedir(DIR *dirp); 3.参数 dirp: 指向 DIR 结构的指针&#xff0c;该结构由 opendir() 返回。它表示要关闭的目录流。 4.返回值 成功: 返回 0。失败: 返回…

Windows 右键集成方案:轻量级图片格式转换工具实践

图片格式转换不是“多此一举”&#xff0c;而是为了适配场景、提升效率、保证兼容、控制质量与体积的必要操作。 它是一款高效简洁的图片格式转换工具。 相较于传统工具需依次执行“启动程序—导入图片—选择输出格式—执行转换—保存文件”等多步操作。 该工具通过集成右键菜…

破解物流分拣效率瓶颈:ARM工控机驱动的智能调度方案深度解析

在日吞吐量数以万计件的现代智慧物流分拣中心&#xff0c;AGV&#xff08;自动导引运输车&#xff09;如同不知疲倦的“搬运工”&#xff0c;穿梭于货架与分拣台之间。然而&#xff0c;随着订单量激增、SKU种类繁杂&#xff0c;AGV数量从几十台增加到数百台&#xff0c;一个核心…