Research Paper - a carbene101 Collection

carbene101 's Collections

Research Paper

updated Jun 28

SRFT: A Single-Stage Method with Supervised and Reinforcement Fine-Tuning for Reasoning

Paper • 2506.19767 • Published Jun 24 • 15