本研究探討了專家和一般用戶對多模態語言模型(MM-LLM)在解釋政治影片內容時的期望和價值觀。
首先,我們訪談了10位媒體學者和記者,了解他們在處理多模態數據(如文本、圖像和視頻)時的做法。他們強調情感和敘事性是重要因素,但也需要保持客觀性和事實性。
接下來,我們設計了一個名為Inclusive.AI的工具,讓114名美國網民參與個人和集體討論,表達他們對MM-LLM在處理政治敏感話題時的期望和價值觀。參與者強調情感、演講者立場和客觀性是重要因素。
我們還探討了不同的民主治理機制(如加權投票和二次方投票)如何影響參與者對改善MM-LLM模型的看法。參與者認為二次方投票能增強少數群體的影響力,並提高民主進程的感知質量。
總的來說,本研究提出了在開發MM-LLM模型時需要平衡的關鍵因素,並探討了利用民主治理機制來指導模型未來發展的潛力。
翻譯成其他語言
從原文內容
arxiv.org
深入探究