OFAモデルを基盤とし、高品質なキャプション生成データの活用、リトリーバル拡張戦略、キャプションレベル戦略を組み合わせることで、NICE 2024データセットに対する高精度なゼロショット画像キャプショニングを実現した。