Concetti Chiave
雑音の多い生物医学分野の音声トランスクリプトから、有害な薬物反応や認知機能検査の質問項目に含まれる動物や果物の名称を正確に抽出するための新しいデータセットとアプローチを提案する。
Sintesi
本論文は、生物医学分野における自動音声認識(ASR)とテキストマイニング(NLP)の間のギャップに取り組んでいる。特に、雑音の多い環境下での名称エンティティ認識(NER)タスクに焦点を当てている。
まず、新しいデータセットBioASR-NERを開発した。このデータセットには、有害な薬物反応に関する会話と、電話による成人認知機能検査(BTACT)の質問項目が含まれている。これらの会話は、クリーンな録音と雑音の多い録音の2種類が用意されている。
次に、GPT4を使ったトランスクリプト修正手法を提案した。これにより、ゼロショットおよびフューショットの2つのアプローチで、雑音の多いトランスクリプトの性能を改善することができる。
さらに、エラー分析を行い、トランスクリプションソフトウェアのエラー、GPT4による修正、GPT4の限界について明らかにした。
本研究は、生物医学分野における雑音の多い音声トランスクリプトからの情報抽出の課題に取り組み、その理解と解決策の提案を目指している。
Statistiche
雑音の多いトランスクリプトでは、正確なNER性能が大幅に低下する(平均F1スコアが62%低下)。
ゼロショットのGPT4修正により、NER性能を平均14%改善できる。
フューショットのGPT4修正により、NER性能をさらに3%改善できる。
Citazioni
"自動音声認識(ASR)技術は、話し言葉を文字に変換する上で不可欠であり、臨床の分野でも重要な用途を持っている。"
"しかし、トランスクリプションにノイズが含まれると、自然言語処理(NLP)モデルの性能が大幅に低下する問題がある。"
"名称エンティティ認識(NER)は臨床上の重要なタスクであり、このASR-NLPギャップの影響を特に受ける。"