Runze Liu's picture

5 21 4

Runze Liu

RyanLiu112

·

https://ryanliu112.github.io

AI & ML interests

LLM, RL

Recent Activity

upvoted a paper 7 days ago

GARDO: Reinforcing Diffusion Models without Reward Hacking

upvoted an article 16 days ago

Deriving the PPO Loss from First Principles

upvoted a paper 20 days ago

Step-DeepResearch Technical Report

View all activity

Organizations

upvoted a paper 7 days ago

GARDO: Reinforcing Diffusion Models without Reward Hacking

Paper • 2512.24138 • Published 14 days ago • 28

upvoted an article 16 days ago

Article

Deriving the PPO Loss from First Principles

19 days ago

•

33

upvoted a paper 20 days ago

Step-DeepResearch Technical Report

Paper • 2512.20491 • Published 21 days ago • 82

upvoted a collection 21 days ago

Physics of Language Models: Part 4.2

17 items • Updated 23 days ago • 2

upvoted a paper 21 days ago

Bottom-up Policy Optimization: Your Language Model Policy Secretly Contains Internal Policies

Paper • 2512.19673 • Published 22 days ago • 61

upvoted a collection 21 days ago

"Physics of Language Models" series

7 items • Updated 23 days ago • 52

upvoted a paper 21 days ago

On the Interplay of Pre-Training, Mid-Training, and RL on Reasoning Language Models

Paper • 2512.07783 • Published Dec 8, 2025 • 36

updated a model about 1 month ago

RyanLiu112/1.5a_first2

2B • Updated Dec 8, 2025 • 2

published a model about 1 month ago

RyanLiu112/1.5a_first2

2B • Updated Dec 8, 2025 • 2

updated a model about 1 month ago

RyanLiu112/1.5a_woabf_480

2B • Updated Dec 8, 2025 • 1

published a model about 1 month ago

RyanLiu112/1.5a_woabf_480

2B • Updated Dec 8, 2025 • 1

updated a model about 1 month ago

RyanLiu112/1.5a_wodiff_420

2B • Updated Dec 8, 2025 • 1

published a model about 1 month ago

RyanLiu112/1.5a_wodiff_420

2B • Updated Dec 8, 2025 • 1

updated a model about 1 month ago

RyanLiu112/1.5a_atb_740

2B • Updated Dec 7, 2025 • 1

published a model about 1 month ago

RyanLiu112/1.5a_atb_740

2B • Updated Dec 7, 2025 • 1

updated a model about 1 month ago

RyanLiu112/1.5t_700

2B • Updated Dec 7, 2025

published a model about 1 month ago

RyanLiu112/1.5t_700

2B • Updated Dec 7, 2025

updated a model about 1 month ago

RyanLiu112/1.5g_740

2B • Updated Dec 7, 2025

published a model about 1 month ago

RyanLiu112/1.5g_740

2B • Updated Dec 7, 2025

updated a dataset 3 months ago

RyanLiu112/a_data

Viewer • Updated Oct 24, 2025 • 184k • 77