Guanxing Lu

GuanxingLu

·

https://guanxinglu.github.io/

GuanxingLu

AI & ML interests

Computer Vision, Reinforcement Learning, etc.

Recent Activity

upvoted a paper 15 days ago

STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability

liked a Space about 1 month ago

WorldArena/WorldArena

updated a model about 2 months ago

GuanxingLu/momo-dapo-overlong-deepseek-r1-no-dpo-loss

View all activity

Organizations

None yet

GuanxingLu 's datasets

None public yet