Core Concepts
提出了一种基于双BERT架构和层次标签学习算法的中国胸部X线报告疾病标签器,并基于此标签器构建了一个包含51,262个样本的中国胸部X线报告数据集。
Abstract
本研究针对中国胸部X线报告缺乏疾病标签器的问题,提出了一种基于双BERT架构和层次标签学习算法的中国胸部X线报告疾病标签器。该标签器通过双BERT架构独立编码诊断报告和临床信息,并利用疾病和身体部位之间的层次关系构建层次标签学习算法,显著提高了疾病标注的准确性。随后,基于该标签器构建了一个包含51,262个胸部X线样本的中国胸部X线报告数据集(CCXRD)。专家构建的中国数据子集的实验分析验证了所提出的疾病标签器的有效性。
未来的工作将集中在提高疾病标签器的性能以及使用该标签器构建更大规模的中国数据集。随着大模型的日益流行,预计更广泛的数据集将推动自动胸部X线报告生成研究的发展,在临床实践中发挥重要作用。
Stats
双肺纹理增多
双肺见多发网格影,边缘模糊
右肺可见散在索条、结节影
右肺中带外野见一结节状密度增高影,边缘较光滑,2.9*2.4cm
心影轻度增大
双侧胸膜增厚、右侧胸膜粘连
Quotes
"双肺纹理增多,双下肺见多发网格影,边缘模糊,右肺可见散在索条、结节影,右肺中带外野见一结节状密度增高影,边缘较光滑,2.9*2.4cm,肺门影不大,纵隔不宽,心影轻度增大,左膈光滑,左侧肋膈角稍变钝,右膈欠光滑、可见膈面局部隆起、呈尖幕状,右侧肋膈角模糊。"
"PICC置管术后,管末位于颈部。双肺纹理增多,双下肺见网格影,散在小结节、斑片影。双肺门影无增大。纵隔不宽,心影大小形态未见异常。双膈面光滑,双肋膈角锐利。"