本研究は、医療記録の質問応答システムの信頼性を高めるために、回答不能な質問の検出における問題点を指摘し、その解決策を提案している。
まず、EHRSQL データセットの回答不能な質問には特定のN-gramパターンが多く含まれており、単純なフィルタリングで多くの回答不能な質問を識別できることを示した。このようなデータバイアスは、質問応答システムの評価の信頼性を損なう可能性がある。
そこで本研究では、検証データと試験データの分割方法を改善することで、このデータバイアスを軽減する手法を提案した。具体的には、検証データからN-gramパターンの多い回答不能な質問を試験データに移すことで、単純なフィルタリングでは識別できなくなるようにした。
実験の結果、提案手法によりデータバイアスが軽減され、質問応答システムの性能評価がより適切に行えるようになることが示された。これにより、医療記録の質問応答システムの信頼性向上に貢献できると考えられる。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yongjin Yang... a las arxiv.org 05-06-2024
https://arxiv.org/pdf/2405.01588.pdfConsultas más profundas