Grunnleggende konsepter
대규모 언어 모델을 활용하여 환자의 임상시험 참여 적격성을 정확하게 예측하고 효율적으로 매칭할 수 있다.
Sammendrag
이 연구는 대규모 언어 모델(LLM)을 활용하여 환자-임상시험 매칭 문제를 해결하는 TrialGPT 프레임워크를 제안한다. TrialGPT는 두 가지 핵심 기능을 수행한다:
기준 수준 예측: TrialGPT는 환자 기록과 임상시험 기준을 입력받아 각 기준에 대한 환자의 적격성을 예측하고 설명을 제공한다. 전문가 평가 결과, TrialGPT의 기준 수준 예측 정확도는 전문가 수준에 근접한다.
기준 수준 예측 통합: TrialGPT는 기준 수준 예측을 통합하여 임상시험 수준의 점수를 생성한다. 이 점수는 환자에게 적합한 임상시험을 효과적으로 순위화하고 부적격 임상시험을 제외하는 데 활용될 수 있다. TrialGPT의 통합 점수는 전문가 평가와 높은 상관관계를 보인다.
또한 사용자 연구를 통해 TrialGPT가 실제 임상시험 매칭 작업에서 42.6%의 시간을 절감할 수 있음을 확인했다. 이를 통해 대규모 언어 모델이 환자-임상시험 매칭 프로세스를 지원할 수 있는 유망한 기회를 보여주었다.
Statistikk
환자 기록의 평균 길이는 88.1 ~ 156.2 단어이다.
환자당 적격 임상시험 수는 6.5 ~ 40.8개이다.
환자당 부적격 임상시험 수는 0 ~ 40.0개이다.
환자당 관련 없는 임상시험 수는 39.9 ~ 50.0개이다.
Sitater
"TrialGPT는 기준 수준 예측 정확도가 전문가 수준에 근접하며, 통합 점수가 전문가 평가와 높은 상관관계를 보인다."
"TrialGPT는 실제 임상시험 매칭 작업에서 42.6%의 시간을 절감할 수 있다."