toplogo
Sign In

이미지넷과 대조되는 이미지넷 아닌 데이터셋은 모델 순위를 보존한다


Core Concepts
이미지넷 아닌(ImageNot) 데이터셋은 이미지넷 데이터셋과 크게 다르지만, 이미지 분류 모델의 순위와 상대적 성능 향상 정도가 유사하게 나타난다.
Abstract
연구진은 이미지넷과 크게 다른 특성을 가진 새로운 이미지 데이터셋 이미지넷 아닌(ImageNot)을 구축했다. ImageNot은 이미지넷과 달리 인간 주석 없이 웹 크롤링 데이터에서 자동으로 구축되었으며, 클래스 간 관련성이 낮은 임의의 개념으로 구성되어 있다. 연구진은 이미지넷에서 개발된 주요 모델 아키텍처(AlexNet, VGG, ResNet, DenseNet, EfficientNet, ConvNeXt)를 ImageNot 데이터셋에 적용하여 성능을 평가했다. 그 결과, ImageNot 데이터셋에서의 모델 순위와 상대적 성능 향상 정도가 이미지넷과 매우 유사하게 나타났다. 이는 이미지넷 중심의 모델 개발 과정이 다른 데이터셋에서도 유사하게 진행되었을 것이라는 점을 시사한다. 또한 ImageNot 사전 학습 모델의 CIFAR10 데이터셋 fine-tuning 및 전이 학습 성능도 이미지넷 사전 학습 모델과 유사한 경향을 보였다. 이를 통해 ImageNot이 이미지넷과 유사한 전이 학습 효용성을 가지고 있음을 확인했다. 이 연구 결과는 기존에 우려되었던 이미지넷 모델의 외적 타당성 문제가 과도하게 걱정되었을 수 있음을 시사한다. 모델 순위와 상대적 성능 향상이 유지되는 것이 중요하며, 정확도 지표 자체는 그다지 중요하지 않을 수 있다는 점을 보여준다.
Stats
이미지넷 모델들의 ImageNot 데이터셋 정확도는 약 50% 수준으로, 이미지넷 정확도 약 85%에 비해 크게 낮다. ImageNot 데이터셋의 클래스 간 이미지 유사도는 이미지넷에 비해 낮다. ImageNot 데이터셋의 클래스 간 워드넷 트리 깊이는 이미지넷에 비해 얕은 편이다.
Quotes
없음

Key Insights Distilled From

by Olawale Sala... at arxiv.org 04-03-2024

https://arxiv.org/pdf/2404.02112.pdf
ImageNot

Deeper Inquiries

0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star