오픈옴니: 미래형 멀티모달 대화형 에이전트 구축을 위한 협업적 오픈 소스 도구 (OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents)
본 논문에서는 오픈 소스 멀티모달 대화형 에이전트 프레임워크인 OpenOmni를 제안하며, 이는 사용자 정의 가능한 파이프라인, 로컬 및 클라우드 배포 옵션, 벤치마킹 도구를 통해 멀티모달 에이전트 개발의 격차를 해소하고 혁신을 촉진하는 것을 목표로 합니다.