zero123 / README.md
oscnet
重构: 使用 Zero123++ 通过旋转输入生成工程六视图
d7cb9d0

A newer version of the Gradio SDK is available: 6.1.0

Upgrade
metadata
title: Zero123++ 工程六视图生成器
emoji: 🎨
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit

Zero123++ 工程六视图生成器

将单张主视图转换为工程六视图(通过旋转输入 + 选择视角实现)

功能特点

  • 📷 单图生成工程六视图
  • 🎯 接近标准正交投影视图(前/后/左/右/上/下)
  • 🚀 基于 Zero123++ v1.2 模型
  • ✨ 简洁的 Gradio 界面

使用方法

  1. 上传一张主视图图片(建议正方形,>= 320x320)
  2. 点击"生成工程六视图"按钮
  3. 等待 2-3 分钟(需要 3 次推理)
  4. 下载生成的六视图合成图

输出说明

生成的图像包含 6 个视图,排列为 2 行 3 列:

┌─────────┬─────────┬─────────┐
│  主视图  │  右视图  │  后视图  │
├─────────┼─────────┼─────────┤
│  左视图  │  俯视图  │  底视图  │
└─────────┴─────────┴─────────┘

视角实现方法

视图 实现方法 说明
主视图 Zero123++ 30° 视角 正面视角
右视图 Zero123++ 90° 视角 右侧视角
后视图 Zero123++ 210° 视角 背面视角
左视图 Zero123++ 270° 视角 左侧视角
俯视图 输入旋转-90° → Zero123++ 从上往下看
底视图 输入旋转+90° → Zero123++ 从下往上看

技术说明:

  • Zero123++ 固定输出 6 个环绕视角(30°, 90°, 150°, 210°, 270°, 330°)
  • 无法自定义视角参数
  • 通过选择合适的输出视角 + 旋转输入图片来模拟工程六视图

技术细节

  • 模型: Zero123++ v1.2
  • 框架: Diffusers + Gradio
  • 硬件: 需要 GPU (推荐至少 T4 或更高)
  • 推理方式:
    • 第 1 次推理: 水平视图(主/右/后/左)
    • 第 2 次推理: 俯视图(输入旋转-90°)
    • 第 3 次推理: 底视图(输入旋转+90°)
  • 总耗时: 约 2-3 分钟(取决于 GPU 性能)

v1.2 改进

  • 相机内参处理更精细
  • 输出视野角统一为 30°
  • 仰角从 30°/-20° 改为 20°/-10°
  • 更适合 3D 生成而非新视角合成

应用场景

  • 🏗️ 工程制图: 生成类似工程图的六视图
  • 🎮 3D 建模: 为 3D 建模提供多视角参考
  • 📐 产品设计: 产品的多角度展示
  • 🎨 艺术创作: 角色或物体的多视角参考

注意: 由于 Zero123++ 的固定视角限制,生成的视图是"接近"而非"严格"的正交视图。

引用

如果使用了这个模型,请引用:

@misc{shi2023zero123plus,
    title={Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model},
    author={Ruoxi Shi and Hansheng Chen and Zhuoyang Zhang and Minghua Liu and Chao Xu and Xinyue Wei and Linghao Chen and Chong Zeng and Hao Su},
    year={2023},
    eprint={2310.15110},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}

许可证

  • 代码: Apache 2.0
  • 模型权重: CC-BY-NC 4.0 (非商业用途)

致谢