Spaces:

oscnet
/

zero123

Running

App Files Files Community

zero123 / README.md

oscnet

重构: 使用 Zero123++ 通过旋转输入生成工程六视图

d7cb9d0 28 days ago

preview code

raw

history blame contribute delete

3.37 kB

	---
	title: Zero123++ 工程六视图生成器
	emoji: 🎨
	colorFrom: blue
	colorTo: purple
	sdk: gradio
	sdk_version: 5.49.1
	app_file: app.py
	pinned: false
	license: mit
	---

	# Zero123++ 工程六视图生成器

	将单张主视图转换为工程六视图(通过旋转输入 + 选择视角实现)

	## 功能特点

	- 📷 单图生成工程六视图
	- 🎯 接近标准正交投影视图(前/后/左/右/上/下)
	- 🚀 基于 Zero123++ v1.2 模型
	- ✨ 简洁的 Gradio 界面

	## 使用方法

	1. 上传一张主视图图片(建议正方形,>= 320x320)
	2. 点击"生成工程六视图"按钮
	3. 等待 2-3 分钟(需要 3 次推理)
	4. 下载生成的六视图合成图

	## 输出说明

	生成的图像包含 6 个视图,排列为 2 行 3 列:

	```
	┌─────────┬─────────┬─────────┐
	│ 主视图 │ 右视图 │ 后视图 │
	├─────────┼─────────┼─────────┤
	│ 左视图 │ 俯视图 │ 底视图 │
	└─────────┴─────────┴─────────┘
	```

	### 视角实现方法

	\| 视图 \| 实现方法 \| 说明 \|
	\|-----\|---------\|------\|
	\| 主视图 \| Zero123++ 30° 视角 \| 正面视角 \|
	\| 右视图 \| Zero123++ 90° 视角 \| 右侧视角 \|
	\| 后视图 \| Zero123++ 210° 视角 \| 背面视角 \|
	\| 左视图 \| Zero123++ 270° 视角 \| 左侧视角 \|
	\| 俯视图 \| 输入旋转-90° → Zero123++ \| 从上往下看 \|
	\| 底视图 \| 输入旋转+90° → Zero123++ \| 从下往上看 \|

	技术说明:
	- Zero123++ 固定输出 6 个环绕视角(30°, 90°, 150°, 210°, 270°, 330°)
	- 无法自定义视角参数
	- 通过选择合适的输出视角 + 旋转输入图片来模拟工程六视图

	## 技术细节

	- 模型: [Zero123++ v1.2](https://huggingface.co/sudo-ai/zero123plus-v1.2)
	- 框架: Diffusers + Gradio
	- 硬件: 需要 GPU (推荐至少 T4 或更高)
	- 推理方式:
	- 第 1 次推理: 水平视图(主/右/后/左)
	- 第 2 次推理: 俯视图(输入旋转-90°)
	- 第 3 次推理: 底视图(输入旋转+90°)
	- 总耗时: 约 2-3 分钟(取决于 GPU 性能)

	## v1.2 改进

	- 相机内参处理更精细
	- 输出视野角统一为 30°
	- 仰角从 30°/-20° 改为 20°/-10°
	- 更适合 3D 生成而非新视角合成

	## 应用场景

	- 🏗️ 工程制图: 生成类似工程图的六视图
	- 🎮 3D 建模: 为 3D 建模提供多视角参考
	- 📐 产品设计: 产品的多角度展示
	- 🎨 艺术创作: 角色或物体的多视角参考

	注意: 由于 Zero123++ 的固定视角限制,生成的视图是"接近"而非"严格"的正交视图。

	## 引用

	如果使用了这个模型,请引用:

	```bibtex
	@misc{shi2023zero123plus,
	title={Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model},
	author={Ruoxi Shi and Hansheng Chen and Zhuoyang Zhang and Minghua Liu and Chao Xu and Xinyue Wei and Linghao Chen and Chong Zeng and Hao Su},
	year={2023},
	eprint={2310.15110},
	archivePrefix={arXiv},
	primaryClass={cs.CV}
	}
	```

	## 许可证

	- 代码: Apache 2.0
	- 模型权重: CC-BY-NC 4.0 (非商业用途)

	## 致谢

	- [Zero123++](https://github.com/SUDO-AI-3D/zero123plus) - 原始项目
	- [Hugging Face](https://huggingface.co/) - 模型托管和部署平台