Core Concepts
효율적인 데이터 수집은 AI 모델의 성능 향상에 중요하며, 조사 방법론의 통찰은 모델 성능을 향상시킬 수 있다.
Abstract
높은 품질의 데이터 수집의 중요성
AI/ML 연구자들이 데이터 수집 방법에 대해 미흡한 부분
조사 방법론의 통찰이 모델 성능 향상에 기여할 수 있는 방법
레이블 수집과 조사 데이터 수집의 유사성과 차이점
레이블 수집 방법에 대한 통계적 접근 방법
레이블러의 특성이 데이터 수집에 미치는 영향
데이터 수집의 투명성과 문제점
AI 모델의 신뢰성 향상을 위한 향후 연구 방향
Stats
"데이터 수집의 과학은 어려우며, 조사 데이터 수집 방법에 대한 투명성이 필요하다."
"레이블 수집 방법에 대한 통계적 접근 방법이 모델 성능 향상에 도움이 될 수 있다."
"레이블러의 특성이 레이블 수집에 영향을 미치며, 이는 모델의 예측에도 영향을 줄 수 있다."
Quotes
"모델이 사람들이 원하는 대로 훈련되기를 원한다면, 우리는 사람들을 연구해야 한다." - Irving & Askell, 2019
"데이터 수집의 과학은 어렵고, 최근의 중요한 실패 사례들이 이를 보여준다." - Sturgis et al., 2016; Kennedy et al., 2017; Clinton et al., 2021