Core Concepts
大規模言語・ビジョンモデルの主要な限界である創造的問題解決を解決するためには、計算創造性の原理を統合することが不可欠である。
Abstract
本論文では、大規模言語・ビジョンモデル(LLVM)の創造的問題解決能力を向上させるために、計算創造性(CC)の原理を適用する方法について議論している。
まず、LLVMの典型的なタスク計画アプローチを概説し、創造的問題解決の限界を指摘する。次に、Boden's 3つの創造性の形態(探索的、組合せ的、変換的)をLLVMに適用する方法について議論する。探索的アプローチはLLVMの潜在空間を直接探索することで、組合せ的アプローチは異なる概念の組み合わせによって、変換的アプローチはタスクの再定式化によって創造的問題解決を実現する可能性がある。
さらに、これらの原理を適用するために、LLVMの潜在空間にどのような情報を組み込むべきかについて検討する。特に、物体の置換に関する予備実験を通じて、物体の機能的特性(アフォーダンス)に関する情報が創造的問題解決に有効であることを示す。
最後に、創造的問題解決と汎用人工知能(AGI)の関係について議論し、CCの原理がAGIの実現にも重要であることを指摘する。
Stats
オブジェクト置換テストでは、アフォーダンス情報を含むプロンプトを使用することで、モデルの正解率が向上した。