소음 환경에서 자동 음성 인식(ASR) 기술의 한계로 인해 자연어 처리(NLP) 모델의 성능이 크게 저하되는 문제를 해결하기 위해, 생물의학 도메인의 새로운 데이터셋을 소개하고 GPT4를 활용한 전사 개선 방법을 제안한다.
ChatGPT로 생성된 콘텐츠는 실제 과학 논문과 구별되는 특징을 가지고 있으며, xFakeSci 알고리즘은 이를 효과적으로 구분할 수 있다.