本研究では、MAIRA-1と呼ばれる放射線科特化の大規模多様モデルを提案している。MAIRA-1は、大規模言語モデルのVicuna-7Bと、放射線科用に事前学習されたRAD-DINO画像エンコーダを組み合わせている。さらに、GPTによるデータ拡張も活用している。
MAIRA-1の特徴は以下の通り:
MAIRA-1の評価では、従来の言語メトリクスに加えて、放射線科特有のメトリクスも用いている。その結果、MAIRA-1は放射線科医の評価に最も近いRadCliQスコアにおいて最高水準の性能を示した。また、所見の有無や所見記載の有無によって性能が大きく変わることも明らかになった。
本研究は、大規模言語モデルと放射線科特化の画像エンコーダを組み合わせることで、放射線科レポート生成の精度を大幅に向上させた。今後は、より大規模なデータセットを用いることで、さらなる性能向上が期待できる。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Step... : arxiv.org 04-29-2024
https://arxiv.org/pdf/2311.13668.pdfDaha Derin Sorular