最近、事前学習された計算言語モデルは人間に固有と考えられていた言語能力で顕著な進歩を遂げています。この成功は、これらのモデルが人間のように言語を表現し処理しているかどうかに興味を引き起こしました。本論文では、中国と英国出身者から収集された多様な認知データを含むMulCogBenchというマルチモーダルな認知ベンチマークデータセットが提案されています。このデータセットは、主観的意味評価、アイ・トラッキング、機能的磁気共鳴画像法(fMRI)、および脳磁囲計測法(MEG)などさまざまな認知データを包括しています。また、言語モデルと認知データの関係を評価するために、類似性符号化分析が実施されました。その結果、言語モデルは人間の認知データと重要な類似性を共有し、この類似性パターンはデータの形態や刺激の複雑さによって変動します。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Yunhao Zhang... at arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01116.pdfDeeper Inquiries