이 논문에서는 심각한 범죄 사건에서 가해자의 손 이미지를 활용하여 개인 신원, 성별 및 연령을 동시에 추정하는 딥 멀티태스크 표현 학습 프레임워크를 제안한다.
다양한 최신 딥러닝 아키텍처를 조사하고 손 이미지에서 신원, 성별 및 연령을 공동으로 추정하는 성능을 비교한다. 연령 예측을 단순화하기 위해 연령 그룹을 생성한다.
11k 손 이미지 데이터셋을 활용하여 광범위한 평가와 비교를 수행한 결과, 컨볼루션 기반 ConvNeXt-Tiny와 트랜스포머 기반 Swin-T 아키텍처가 가장 우수한 성능을 보였다. 이를 통해 심각한 범죄 사건에서 가해자의 손 이미지로부터 신원, 성별 및 연령을 효과적으로 추정할 수 있음을 확인했다. 이는 국제 경찰력이 법정에서 가해자를 식별하고 기소하는 데 도움이 될 것이다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Nathanael L.... at arxiv.org 03-21-2024
https://arxiv.org/pdf/2303.15263.pdfDeeper Inquiries