アラビア語の方言と文化的な特徴を捉えるためのベンチマークを開発し、大規模言語モデルの性能を評価する。
並列トレーニングデータなしでも、大規模な非並列オーディオデータを活用することで、言語クエリに基づいた対象音声抽出モデルを効率的に学習できる。
手話とジェスチャーにおける認識的ジェスチャーの発話特徴には共通点がある。特に、中立位置を通過する素早い頭の動きは確実性の指標であり、中立位置から外れた姿勢の保持と遅い動きは不確実性を示す。
強化学習を用いることで、情報理論的に効率的な再帰的数値システムを習得できる。
言語の重複には様々な形式があり、それぞれに特徴があるため、状況に応じて適切な形式を選択することが重要である。
大規模言語モデルの構築には、言語コミュニティの権利と文化的アイデンティティを尊重し、倫理的で責任あるアプローチが不可欠である。
言語経験は人間の知覚の基本的な側面、すなわち規則的な音列の神経処理を形作る。
人工語彙の学習難易度によって、睡眠時の標的記憶再活性化の有効性と、その基盤となる神経活動が異なることが示された。
エミラティ人のバイリンガル音声データセット「Mixat」を紹介し、既存の音声認識モデルの性能評価を行った。
IgboAPI データセットは、Igbo 言語の多様な方言を網羅し、Igbo 言語テクノロジーの開発を促進する。