|
|
--- |
|
|
title: Zero123++ 工程六视图生成器 |
|
|
emoji: 🎨 |
|
|
colorFrom: blue |
|
|
colorTo: purple |
|
|
sdk: gradio |
|
|
sdk_version: 5.49.1 |
|
|
app_file: app.py |
|
|
pinned: false |
|
|
license: mit |
|
|
--- |
|
|
|
|
|
# Zero123++ 工程六视图生成器 |
|
|
|
|
|
将单张主视图转换为工程六视图(通过旋转输入 + 选择视角实现) |
|
|
|
|
|
## 功能特点 |
|
|
|
|
|
- 📷 单图生成工程六视图 |
|
|
- 🎯 接近标准正交投影视图(前/后/左/右/上/下) |
|
|
- 🚀 基于 Zero123++ v1.2 模型 |
|
|
- ✨ 简洁的 Gradio 界面 |
|
|
|
|
|
## 使用方法 |
|
|
|
|
|
1. 上传一张主视图图片(建议正方形,>= 320x320) |
|
|
2. 点击"生成工程六视图"按钮 |
|
|
3. 等待 2-3 分钟(需要 3 次推理) |
|
|
4. 下载生成的六视图合成图 |
|
|
|
|
|
## 输出说明 |
|
|
|
|
|
生成的图像包含 6 个视图,排列为 2 行 3 列: |
|
|
|
|
|
``` |
|
|
┌─────────┬─────────┬─────────┐ |
|
|
│ 主视图 │ 右视图 │ 后视图 │ |
|
|
├─────────┼─────────┼─────────┤ |
|
|
│ 左视图 │ 俯视图 │ 底视图 │ |
|
|
└─────────┴─────────┴─────────┘ |
|
|
``` |
|
|
|
|
|
### 视角实现方法 |
|
|
|
|
|
| 视图 | 实现方法 | 说明 | |
|
|
|-----|---------|------| |
|
|
| 主视图 | Zero123++ 30° 视角 | 正面视角 | |
|
|
| 右视图 | Zero123++ 90° 视角 | 右侧视角 | |
|
|
| 后视图 | Zero123++ 210° 视角 | 背面视角 | |
|
|
| 左视图 | Zero123++ 270° 视角 | 左侧视角 | |
|
|
| 俯视图 | 输入旋转-90° → Zero123++ | 从上往下看 | |
|
|
| 底视图 | 输入旋转+90° → Zero123++ | 从下往上看 | |
|
|
|
|
|
**技术说明:** |
|
|
- Zero123++ 固定输出 6 个环绕视角(30°, 90°, 150°, 210°, 270°, 330°) |
|
|
- 无法自定义视角参数 |
|
|
- 通过选择合适的输出视角 + 旋转输入图片来模拟工程六视图 |
|
|
|
|
|
## 技术细节 |
|
|
|
|
|
- **模型**: [Zero123++ v1.2](https://huggingface.co/sudo-ai/zero123plus-v1.2) |
|
|
- **框架**: Diffusers + Gradio |
|
|
- **硬件**: 需要 GPU (推荐至少 T4 或更高) |
|
|
- **推理方式**: |
|
|
- 第 1 次推理: 水平视图(主/右/后/左) |
|
|
- 第 2 次推理: 俯视图(输入旋转-90°) |
|
|
- 第 3 次推理: 底视图(输入旋转+90°) |
|
|
- **总耗时**: 约 2-3 分钟(取决于 GPU 性能) |
|
|
|
|
|
## v1.2 改进 |
|
|
|
|
|
- 相机内参处理更精细 |
|
|
- 输出视野角统一为 30° |
|
|
- 仰角从 30°/-20° 改为 20°/-10° |
|
|
- 更适合 3D 生成而非新视角合成 |
|
|
|
|
|
## 应用场景 |
|
|
|
|
|
- 🏗️ **工程制图**: 生成类似工程图的六视图 |
|
|
- 🎮 **3D 建模**: 为 3D 建模提供多视角参考 |
|
|
- 📐 **产品设计**: 产品的多角度展示 |
|
|
- 🎨 **艺术创作**: 角色或物体的多视角参考 |
|
|
|
|
|
**注意**: 由于 Zero123++ 的固定视角限制,生成的视图是"接近"而非"严格"的正交视图。 |
|
|
|
|
|
## 引用 |
|
|
|
|
|
如果使用了这个模型,请引用: |
|
|
|
|
|
```bibtex |
|
|
@misc{shi2023zero123plus, |
|
|
title={Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model}, |
|
|
author={Ruoxi Shi and Hansheng Chen and Zhuoyang Zhang and Minghua Liu and Chao Xu and Xinyue Wei and Linghao Chen and Chong Zeng and Hao Su}, |
|
|
year={2023}, |
|
|
eprint={2310.15110}, |
|
|
archivePrefix={arXiv}, |
|
|
primaryClass={cs.CV} |
|
|
} |
|
|
``` |
|
|
|
|
|
## 许可证 |
|
|
|
|
|
- 代码: Apache 2.0 |
|
|
- 模型权重: CC-BY-NC 4.0 (非商业用途) |
|
|
|
|
|
## 致谢 |
|
|
|
|
|
- [Zero123++](https://github.com/SUDO-AI-3D/zero123plus) - 原始项目 |
|
|
- [Hugging Face](https://huggingface.co/) - 模型托管和部署平台 |
|
|
|