본 연구는 의사결정자(DM)의 행동 빈도만 관찰 가능하고, 보상 관련 상태에 따른 행동 빈도는 알 수 없는 상황에서 DM의 선택을 합리화하는 방법을 다룹니다.
본 연구는 관찰된 행동 데이터를 사용하여 DM이 행동을 취하기 전에 상태에 대한 정보를 학습한다는 가정 하에 DM의 선택을 합리화할 수 있는 조건을 규명하는 것을 목표로 합니다.
저자들은 DM의 행동 분포가 주어진 사전 정보와 효용 함수 하에서 정보와 일치하는 효용 함수, 사전 신념 및 행동에 대한 (주변) 분포의 특징을 제시합니다. 이를 위해 상태 공간의 카디널리티와 효용 함수에 대한 가정을 통해 특징을 구체화하고, 효용 함수, 사전 분포 및 행동 분포가 충족해야 하는 유한한 부등식 시스템을 도출합니다.
본 연구는 DM의 행동 분포가 주어진 사전 정보와 효용 함수 하에서 정보와 일치하는 데 필요한 조건을 제시합니다. 구체적으로, 상태 공간의 카디널리티가 3 이하인 경우와 효용 함수가 아핀 차이 및 2단계 차이를 갖는 경우에 대한 명확한 특징을 제공합니다. 또한, 행동 공간과 상태 공간이 컴팩트 폴리시 공간이고 1차 접근 방식이 적용되는 경우 결과를 확장합니다.
본 연구는 공개된 정보를 바탕으로 DM의 행동을 합리화하는 방법을 제시하고, 이를 통해 DM의 선호도와 정보 구조를 추론할 수 있는 토대를 마련합니다.
본 연구는 제한된 정보만으로도 DM의 의사결정 과정을 이해하고 예측하는 데 유용한 도구를 제공한다는 점에서 의의가 있습니다. 특히, 실증 연구에서 정보 가정에 대한 강력한 추정치를 얻는 데 활용될 수 있습니다.
본 연구는 주로 단일 에이전트 설정에 초점을 맞추고 있습니다. 향후 연구에서는 다중 에이전트 설정으로 분석을 확장하여 전략적 상호 작용이 정보 공개 및 의사 결정에 미치는 영향을 조사할 수 있습니다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania