Francesco Periti's picture

1 2 2

Francesco Periti

FrancescoPeriti

·

https://francescoperiti.github.io/

AI & ML interests

None yet

Organizations

upvoted 2 articles 9 months ago

Article

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge

Feb 7, 2025

•

269

Article

Reinforcement Learning for Large Language Models: Beyond the Agent Paradigm

Mar 19, 2025

•

8