Jingcheng Liang's picture

4 1

Jingcheng Liang

leoleung04

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients

upvoted a paper about 2 months ago

Abstain-R1: Calibrated Abstention and Post-Refusal Clarification via Verifiable RL

upvoted a paper 2 months ago

SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks

View all activity

Organizations

None yet

Collections 1

models 1

leoleung04/Abstain-R1

3B • Updated Jan 3 • 24

datasets 0

None public yet