Takashi Ishida's picture

2

Takashi Ishida

tksii

·

https://takashiishida.github.io

AI & ML interests

None yet

Recent Activity

authored a paper about 21 hours ago

Mitigating Reward Hacking in RLHF via Advantage Sign Robustness

authored a paper about 21 hours ago

LLM Routing with Dueling Feedback

authored a paper about 21 hours ago

Do Coding Agents Deceive Us? Detecting and Preventing Cheating via Capped Evaluation with Randomized Tests

View all activity

Organizations

tksii 's datasets

None public yet