核心概念
本論文は、大規模言語モデルの限界を克服するため、内部時間意識マシン(ITCM)と呼ばれる計算意識構造に基づいた汎用エージェントITCMAを提案する。ITCMAは、環境との相互作用と推論を考慮することで、暗黙の指示の理解と常識知識の適用を強化し、柔軟性と解釈可能性を向上させる。
要約
本論文は、大規模言語モデル(LLM)ベースのエージェントの限界を克服するため、内部時間意識マシン(ITCM)と呼ばれる計算意識構造に基づいた汎用エージェントITCMAを提案している。
ITCM構造の主な特徴は以下の通り:
- 知覚領域と現象領域の概念を導入し、エージェントの主観的な意識体験を表現する
- 保持、一次印象、先行予期の3つの時間的構造を組み合わせ、エージェントの時間意識を構築する
- 記憶の自発的活性化メカニズムを設計し、過去の経験を現在の知覚に融合させる
- 情動の3次元モデル(快楽、覚醒、支配)を導入し、エージェントの動機づけと行動選択に組み込む
基づいたITCMA構造は以下のように動作する:
- 知覚入力(一次印象)を受け取る
- 過去の記憶(保持)と現在の一次印象から、未来の予期(先行予期)を生成する
- 情動モデルに基づいて、予期に対する動機づけを生成する
- 動機づけと予期を言語モデルに入力し、行動出力を生成する
ITCMA は、Alfworld環境での評価で、既存手法に比べ9%高い性能を示した。未訓練のITCMAでも、既存手法より5%高い課題完了率を達成した。さらに、実世界の四足ロボットタスクでも、未訓練のITCMAが85%の課題完了率を示し、現実世界でも高い有用性を実証した。
統計
訓練済みITCMAは既存手法に比べ9%高い性能を示した
未訓練のITCMAは既存手法より5%高い課題完了率を達成した
実世界の四足ロボットタスクで、未訓練のITCMAが85%の課題完了率を示した