本研究では、医療における5つの基本的な自然言語処理タスク(テキストデータの分類、数値データの分類、臨床推論、要約、トリアージ)を対象に、教師付きファインチューニング(SFT)とパラメータ直接最適化(DPO)の2つのファインチューニング手法を比較した。
テキストベースの分類タスクではSFTのみで十分な性能が得られたが、より複雑な臨床推論、要約、トリアージのタスクではDPOによる性能向上が見られた。一方、数値データの分類タスクではどちらのファインチューニング手法も有効ではなかった。
これらの結果から、単純な単語関連推論にはSFTで十分だが、より複雑なパターン認識を必要とするタスクではDPOが有効であることが示された。医療分野では、各医療機関の独自の実践スタイルや文書化スタイルに合わせた高度な個別最適化が求められるため、SFTとDPOの両方が重要な役割を果たすと考えられる。
ただし、DPOの広範な適用には、クローズドソースモデルにDPO機能を提供すること、GPUを活用したDPOライブラリの並列化機能の改善など、いくつかのソフトウェア上の課題を解決する必要がある。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Thomas Savag... alle arxiv.org 09-20-2024
https://arxiv.org/pdf/2409.12741.pdfDomande più approfondite