BizBench는 금융 및 비즈니스 분야의 정량적 추론 능력을 평가하기 위한 새로운 벤치마크이다. 이는 프로그램 합성, 수량 추출, 도메인 지식의 세 가지 범주로 구성되며, 금융 및 비즈니스 전문가가 작성한 실제 문제를 다룬다.
BizBench는 금융 및 비즈니스 분야의 정량적 추론 능력을 평가하기 위한 새로운 벤치마크로, 프로그램 합성, 수량 추출, 도메인 지식 등 3가지 유형의 과제로 구성되어 있다.
BizBench는 금융 및 비즈니스 분야의 정량적 추론 능력을 평가하기 위한 새로운 벤치마크이다. 프로그램 합성, 수량 추출, 도메인 지식 등 3가지 유형의 과제로 구성되어 있으며, 이를 통해 언어 모델의 금융 및 비즈니스 분야 이해도와 문제 해결 능력을 종합적으로 평가할 수 있다.