Khái niệm cốt lõi
본 논문에서는 새로운 영화 음악 데이터 세트와 ControlNet 기반 딥러닝 프레임워크를 사용하여 영화 장면에 어울리는 음악을 생성하고 특정 작곡 스타일을 모방하는 방법을 제시합니다.
Tóm tắt
픽셀과 멜로디의 조화: 마에스트로 스타일의 영화 음악 생성 및 작곡 스타일 전이 모델
본 논문에서는 영화 음악 생성 및 작곡 스타일 전이라는 새로운 과제를 해결하기 위해 90.35시간 분량의 방대한 영화 음악 데이터 세트인 FilmScoreDB를 구축하고, HPM(Harmonized Pixel and Melody)이라는 혁신적인 딥러닝 프레임워크를 제안합니다. 또한, 생성된 음악의 독창성과 인식 가능성을 평가하는 새로운 지표를 도입하여 영화 음악 생성 분야의 새로운 기준을 제시합니다.
기존의 춤, 스케이트, 음악 연주 데이터 세트는 영화 음악 생성에 적합하지 않습니다. 영화 음악은 영상의 의미, 감정, 미적 요소를 음악으로 변환해야 하기 때문입니다. 이러한 요구 사항을 충족하기 위해, 본 논문에서는 유명 영화 작곡가들의 작품을 포함하여 32,520개의 영화 클립-음악 쌍으로 구성된 FilmScoreDB 데이터 세트를 구축했습니다.