GPT-4は医療分野の問題に対して高い正答率と自信を示したが、フィードバックの有無によって自己評価に変化が見られた。フィードバックは相対的な自信に影響を与えるが、一貫して自信を高めたり低めたりするわけではない。