TimeChat은 장편 비디오 이해를 위해 개발된 시간 민감형 멀티모달 대규모 언어 모델로, 시간 인식 프레임 인코더와 슬라이딩 비디오 Q-Former 모듈을 통해 정확한 시간 위치 파악 및 이벤트 요약 기능을 제공한다.