Linnk AI 다운로드
•
자율 연구 보조원
>
로그인
통찰
-
직장 환경에서 에이전트의 과제 수행 능력 평가
현실적인 직장 환경에서 에이전트의 능력을 평가하기 위한 벤치마크 데이터셋: WorkBench
WorkBench는 현실적인 직장 환경에서 에이전트의 과제 수행 능력을 평가하기 위한 벤치마크 데이터셋이다.
1