이 논문은 텍스트 기반 3D 객체 생성을 위한 GAN 기반 딥러닝 프레임워크인 TPA3D를 제안한다. 3D 형상 데이터와 렌더링된 2D 이미지만 있으면 되므로 인간이 주석을 단 텍스트-3D 쌍이 필요하지 않다.
TPA3D는 문장 수준의 삼면 생성기와 단어 수준의 삼면 정제 모듈로 구성된다. 문장 수준의 삼면 생성기는 문장 특징을 활용하여 삼면 특징을 생성한다. 단어 수준의 삼면 정제 모듈은 제안된 삼면 주의 집중(TPA) 블록을 통해 단어 수준의 세부 정보를 삼면 특징에 통합한다.
실험 결과, TPA3D는 기존 방법보다 시각적 품질과 텍스트-3D 정렬이 우수하며, 실시간 응답성도 보여준다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Bin-Shih Wu,... às arxiv.org 09-10-2024
https://arxiv.org/pdf/2312.02647.pdfPerguntas Mais Profundas