UnifiedReward 1.0 Qwen2.5 Models GGUF - a CodeGoat24 Collection

CodeGoat24 's Collections

UnifiedReward Edit Models

UnifiedReward 2.0 Qwen3VL Models

Pref-GRPO & UniGenBench

UnifiedReward 2.0 Qwen2.5VL Models

UnifiedReward 1.0 Qwen2.5VL Models

UnifiedReward 1.0 Qwen2.5 Models GGUF

UnifiedReward 1.0 LLaVA Model

UnifiedReward Training Data

UnifiedReward 1.0 Qwen2.5 Models GGUF

updated Nov 6

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 122
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning

Paper • 2505.03318 • Published May 6 • 92
mradermacher/UnifiedReward-qwen-32b-i1-GGUF

33B • Updated Jul 10 • 437 • 1
mradermacher/UnifiedReward-Think-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 652
mradermacher/UnifiedReward-Think-qwen-7b-GGUF

8B • Updated Jul 31 • 275
mradermacher/UnifiedReward-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 345 • 1
mradermacher/UnifiedReward-qwen-7b-GGUF

8B • Updated Jul 31 • 290 • 1
mradermacher/UnifiedReward-qwen-3b-GGUF

3B • Updated Jul 31 • 143
mradermacher/UnifiedReward-qwen-32b-GGUF

33B • Updated Jul 31 • 278