본 논문에서는 침팬지의 행동을 자동으로 인식하고 추적하기 위해 특별히 설계된 최초의 통합 모델인 알파침프와 대규모 데이터셋인 침프ACT를 소개합니다.
카메라 트랩 영상에서 침팬지 행동 인식을 향상시키기 위해 행동 에토그램 정보를 활용하는 비전-언어 모델을 제안한다.