Yotam Perlitz

per

·

AI & ML interests

None yet

Recent Activity

authored a paper about 2 months ago

DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation

authored a paper about 2 months ago

CLEAR: Error Analysis via LLM-as-a-Judge Made Easy

authored a paper about 2 months ago

General Agent Evaluation

View all activity

Organizations

per 's papers 11

arxiv:2605.28556

arxiv:2604.12843

arxiv:2602.22953

arxiv:2507.18392

arxiv:2503.13507

arxiv:2503.01622

arxiv:2412.09569

arxiv:2407.13696

arxiv:2404.18923

arxiv:2401.14019

arxiv:2308.11696