핵심 개념
대규모 언어 모델의 언어 이해, 생성 및 추론 기능을 활용하여 인터뷰 전사본과 같은 큐레이션된 질적 데이터를 코딩하고 주제와 차원을 개발하여 근거 이론 모델을 발전시킬 수 있다.
초록
이 논문은 대규모 언어 모델을 활용하여 질적 연구의 근거 이론 개발을 자동화하는 AcademiaOS라는 첫 시도를 소개한다.
인터뷰 전사본, 보고서, 정책, 관찰 연구의 현장 노트, 일기, 사례 연구 등 다양한 질적 데이터 원천을 활용한다.
데이터 코딩, 주제와 차원 개발, 이론 개발의 단계로 구성된다.
데이터 코딩 단계에서는 초기 코드, 2차 주제, 종합 차원을 생성한다.
이론 개발 단계에서는 적용 가능한 기존 이론 브레인스토밍, 개념 튜플 개발, 관계 요약, 이론 모델 생성, 시각화, 비판 등의 과정을 거친다.
사용자 연구(n=19)에 따르면 학계에서 수용도가 높고 인간을 보조할 잠재력을 보인다.
AcademiaOS는 오픈소스로 공개되어 다른 사용자들이 활용하고 발전시킬 수 있다.
통계
"질적 연구 과제는 시간이 많이 소요되고 비용이 많이 든다."
"인터뷰 전사본 하나를 코딩하는 데 수 시간이 걸린다."
"질적 데이터는 다양한 도구로 수집되며, 목적 표집은 연구 방향을 결정한다."
"코딩은 대규모 비구조화된 텍스트 소스를 관리하는 체계적인 관행이다."
인용구
"질적 데이터 분석과 이론 개발을 위한 투명한 프로세스가 필요하다."
"구조화된 접근법은 유연성과 적응성이 필요하다."
"질적 연구 과제는 자금과 연구팀 규모에 따라 달라진다."