Core Concepts
대형 서지 데이터베이스의 SDG 분류는 편향적이며, 이는 과학적 성과와 영향력 측정에 중요한 영향을 미친다.
Abstract
이 연구는 대형 서지 데이터베이스(Web of Science, OpenAlex, Scopus)의 SDG 분류에 내재된 편향성을 탐구한다. 연구진은 공통 데이터셋을 구축하고 대형 언어 모델(DistilGPT-2)을 활용하여 각 데이터베이스의 SDG 분류 결과를 비교 분석하였다.
연구 결과, SDG 4, 5, 8, 9, 10에 대한 데이터베이스 간 분류 중복도가 매우 낮은 것으로 나타났다. 이는 데이터베이스마다 SDG 분류에 대한 해석이 크게 다르다는 것을 보여준다. 또한 언어 모델의 반응이 모델 구조, 미세 조정 과정, 디코딩 전략 등에 매우 민감한 것으로 나타났다. 이는 겉으로 보이는 객관성에도 불구하고 SDG 분류 실무에 내재된 임의성을 보여준다.
이 연구는 대형 서지 데이터베이스의 SDG 분류가 편향적이며, 이것이 과학적 성과와 영향력 측정에 중요한 영향을 미칠 수 있음을 보여준다. 또한 언어 모델 활용에 대한 윤리적 우려를 제기한다.
Stats
SDG 4, 5, 8, 9, 10에 대한 Web of Science, OpenAlex, Scopus의 분류 중복도는 1.3%~7.2% 수준에 불과하다.
SDG 4의 경우 73% 이상의 논문이 단일 데이터베이스에서만 분류되었고, SDG 10의 경우 90%에 달한다.
Quotes
"대형 서지 데이터베이스의 SDG 분류는 편향적이며, 이는 과학적 성과와 영향력 측정에 중요한 영향을 미친다."
"언어 모델의 반응이 모델 구조, 미세 조정 과정, 디코딩 전략 등에 매우 민감하다는 것은 겉으로 보이는 객관성에도 불구하고 SDG 분류 실무에 내재된 임의성을 보여준다."