이 논문은 의료와 인공지능 분야의 데이터셋 용어 사용 역사를 고찰하고, 이들 간 혼란을 해소하기 위한 권장사항을 제시한다.
의료 분야에서는 '검증(validation)'이라는 용어가 모델 평가를 의미하지만, 인공지능 분야에서는 모델 개발 과정의 한 단계를 나타낸다. 이러한 용어 사용의 차이로 인해 의료 인공지능 연구에서 오해와 혼란이 발생할 수 있다.
이 논문은 '훈련 데이터셋', '검증(또는 조정) 데이터셋', '테스트 데이터셋'과 같은 표준화된 용어 사용을 권장한다. 또한 각 연구에서 이러한 용어를 명확히 정의하여 연구 방법론을 투명하게 제시할 것을 제안한다.
이를 통해 의료 인공지능 분야의 효과적이고 투명한 연구 수행을 도모할 수 있다. 의료와 인공지능 분야 간 용어 통일은 윤리적이고 효과적인 임상 적용을 위해 필수적이다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Shannon L. W... alle arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19303.pdfDomande più approfondite