本研究は、政治的に敏感なビデオの解釈におけるマルチモーダル言語モデル(MM-LLM)のガバナンスについて、専門家と一般市民の視点を探索しました。
まず、10人の専門家(ジャーナリストや研究者)にインタビューを行い、彼らが政治的ビデオの解釈にどのようなアプローチを取るかを理解しました。専門家は、感情や物語性を重視する一方で、一般市民は事実の明確さ、状況の客観性、感情的な中立性を優先することが明らかになりました。
次に、114人の一般市民を対象に、Inclusive.AIツールを使ったデリベレーションと民主的な意思決定プロセスを行いました。個人デリベレーションでは、話者の感情、主観的な内容、話者の立場などが重要な要因として挙げられました。一方、グループデリベレーションでは、参加者の間で矛盾や多様な視点が表出しましたが、AIによる要約に対して概して肯定的な反応を示しました。
ガバナンス決定プロセスでは、投票方式(加重投票、二乗投票)や投票権の分配(均等、パレート分布)が、参加者の民主的プロセスの質の認識に影響を与えることが明らかになりました。二乗投票は、少数派の影響力を高めると評価されました。全体として、参加者は民主的プロセスの質を高く評価しましたが、決定された結果がAIモデルに反映されるかについては懸念を示しました。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Tanusree Sha... في arxiv.org 10-04-2024
https://arxiv.org/pdf/2410.01817.pdfاستفسارات أعمق