แนวคิดหลัก
提案されたMeaCapフレームワークは、ゼロショット画像キャプショニングにおいて、記憶を活用して高品質なキャプション生成を実現する。
บทคัดย่อ
MeaCapは、ゼロショット画像キャプショニングにおいて、記憶を活用した新しいフレームワークであり、訓練フリーとテキストのみ訓練の両方の方法で優れたパフォーマンスを示す。提案手法は幻覚を減らし、世界知識を保持しつつ高品質なキャプション生成が可能であることが示された。
สถิติ
MAGIC: A picture of a stop sign with a man standing behind it.
DeCap: A man in a suit and tie is giving a bike line to a business sign.
MeaCapTF: Someone cutting the ribbon.
MeaCapToT: A ribbon cutting ceremony on a street.
ConZIC: A California commercial filming undergraduate college students in Google photo.
ZeroCap: A video crew showing the scene of a recent study.
คำพูด
"A slice of lemon pie with spoon on serving plate on table."
"A bedroom with various posters and paintings on the wall."
"The famous Eiffel tower in Paris."
"A fictional character known as Batman."
"An airliner parked behind a jet at airport tarmac."