핵심 개념
반구조화 인터뷰 대본에서 정보 추출 자동화의 중요성과 효과적인 방법론 소개
초록
본 논문은 반구조화 인터뷰 대본에서 정보 추출을 자동화하는 시스템의 개발과 적용을 탐구합니다.
주요 내용은 BERT 임베딩과 HDBSCAN 클러스터링의 결합이 최적의 모델이라는 것입니다.
연구는 테마 구조를 효율적으로 처리하고 시각화하는 사용자 친화적인 소프트웨어 프로토타입을 제시합니다.
자동화된 분석은 질적 분석의 초기 단계를 용이하게 하고 주제 간의 상호 연결성을 제공하여 질적 분석의 심도를 향상시킵니다.
현재의 코딩 방법론과 주제 모델링 기술을 비교하고 최적의 방법을 선택하는 과정을 다룹니다.
프로토타입은 연구자들이 프로그래밍 기술이 없어도 텍스트 처리 방법을 사용할 수 있도록 돕는다.
자동화된 분석은 연구자의 주관성을 줄이고 판단적인 태도를 피하는 데 도움이 될 수 있다.
통계
전통적인 질적 분석 방법의 노동 집약적 성격에 대한 언급
BERT 임베딩과 HDBSCAN 클러스터링의 결합이 최적의 모델로 판명됨
텍스트 전처리를 위한 자연어 처리 기술의 중요성 강조
인용구
"연구는 테마 모델링 기술을 조사하고 인터뷰 텍스트를 분석하는 최적의 모델은 BERT 임베딩과 HDBSCAN 클러스터링의 결합이라고 결론 지었다."
"자동화된 분석은 연구자의 주관성을 줄이고 판단적인 태도를 피하는 데 도움이 될 수 있다."