자가 지도 CNN 모델의 설명 가능성을 높이기 위해 터커 분해를 활용한 새로운 Saliency Map 생성 기법(TSM, MTSM)을 제안하고, 기존 방법 대비 성능 향상을 실험적으로 증명했습니다.
허리케인으로 인한 경제적 피해를 평가할 때, 야간 조명 데이터(NTL)의 정확성은 데이터 세트 선택 및 전처리 기법에 따라 크게 달라진다.
본 논문에서는 엑스레이 및 CT 스캔에서 팔꿈치, 손가락, 어깨, 손목 관절을 포함한 인체 상지의 여러 뼈 관절을 자동으로 위치를 파악하는 데 YOLOv3, YOLOv7, EfficientDet, CenterNet과 같은 다양한 딥러닝 모델의 성능을 비교 분석하여 의료 영상 작업의 효율성을 향상시키는 방법을 제시합니다.
본 논문에서는 알려진 범주 정보만을 활용하여 알려진 클래스와 알려지지 않은 클래스 모두에 속하는 새로운 스트림 데이터를 온라인에서 발견하는 것을 목표로 하는 실용적이면서도 어려운 과제인 온더플라이 범주 발견(OCD)을 연구하여, 기존 해시 기반 방법의 문제점을 해결하고 성능을 향상시키는 새로운 프로토타입 해시 인코딩(PHE) 프레임워크를 제안합니다.
본 논문에서는 알려지지 않은 위조 방법으로 생성된 비디오를 탐지하는 데 어려움을 겪는 기존 탐지 모델의 일반화 문제를 해결하기 위해, 알려지지 않은 비디오의 시공간 패턴에 적응하는 잠재 시공간 적응(LAST) 접근 방식을 제안합니다.
본 논문에서는 비디오에서 표정 발생 구간을 정확하게 찾아내는 표정 스포팅 작업을 위해 새롭고 효율적인 트랜스포머 기반 모델인 PESFormer를 제안합니다. 이 모델은 직접 타임스탬프 인코딩(DTE) 방식을 사용하여 기존 앵커 기반 방식의 한계를 극복하고, 모든 학습 구간을 활용하여 성능을 향상시킵니다.
제한된 학습 데이터를 사용하는 비디오 행동 인식 모델의 일반화 능력을 향상시키기 위해, 두 비디오에서 가장 유익한 볼륨을 선택적으로 혼합하는 새로운 데이터 증강 전략인 SV-Mix를 제안합니다.
TIPS는 합성 이미지 캡션과 자기 지도 학습 기법을 활용하여 밀집 예측 및 이미지 수준 예측 작업 모두에서 우수한 성능을 달성하는 범용 이미지-텍스트 인코더입니다.
본 논문에서는 도로 환경에서 복잡하고 동시적인 행동을 더 잘 인식하기 위해 강력한 시각적 특징 추출 및 향상된 주의력 메커니즘을 활용한 다중 레이블 원자 활동 인식 프레임워크를 제안합니다.
본문은 딥러닝과 머신러닝의 기초 개념부터 객체 감지 및 시맨틱 분할 기술의 심층적인 이론, 다양한 모델 비교 분석, 그리고 Python 기반 실습 예제까지 제공하는 종합 안내서입니다.