Core Concepts
본 연구는 환자 관점에서 의약품 부작용 경험을 표현하는 독일어, 프랑스어, 일본어 문서로 구성된 다국어 데이터셋을 제공하고, 이를 활용한 개체명 인식, 속성 분류, 관계 추출 등의 기준선 모델을 제시한다.
Abstract
본 연구는 의약품 부작용(ADR) 탐지를 위한 다국어 데이터셋을 제공한다. 데이터는 독일어, 프랑스어, 일본어로 구성되며, 환자 관점에서 ADR 경험을 표현하는 문서들로 구성된다.
데이터셋에는 12개 개체 유형, 4개 속성 유형, 13개 관계 유형이 주석되어 있다. 이를 통해 의약품, 증상, 신체 부위, 검사, 의견 등 ADR과 관련된 다양한 정보를 모델링할 수 있다.
실험에서는 개체명 인식, 속성 분류, 관계 추출 등의 기준선 모델을 제시했다. 단일 언어 모델, 다국어 모델, 교차 언어 전이 학습 등 다양한 실험 설정을 통해 언어 간 성능 차이와 전이 학습의 효과를 확인했다.
이 데이터셋은 다국어 의약품 부작용 탐지 모델 개발을 위한 기반을 제공하며, 환자 관점의 건강 정보 처리 연구에 활용될 수 있다.
Stats
의약품 부작용으로 인한 관절 통증이 있었다.
투약 후 심한 두통이 발생했다.
3kg 감량했다.
머리에 솜이 든 것 같은 느낌이 있었다.
탈모가 있었다.
비현실감이 있었다.
야한 꿈을 꾸었다.
Quotes
"의약품을 중단했지만 여전히 두통이 있다."
"투약 후 3일 만에 구토와 어지러움이 시작되었다."
"이 약을 복용하면서 식욕이 크게 줄었다."