従来の定義済みアクションに制限される大規模言語モデルエージェントの限界を克服するため、動的にアクションを生成・蓄積し、Pythonコードとして実行する新しいフレームワーク「DynaSaur」を提案する。
大規模言語モデル(LLM)のエージェントシステムにおいて、ツール登録プロセスをエージェントの推論手順に統合することで、コンテキストの使用を最適化し、計算コストを大幅に削減できる。
大規模言語モデル(LLM)は、モジュラーオントロジーをガイドとして使用することで、テキストデータから知識グラフ(KG)を構築するための効果的なツールになり得る。
本稿では、メンタルヘルスポストの要約において、専門用語と文脈情報を活用したガイド付き要約モデルと、事後修正モデルを組み合わせることで、ドメイン特化かつ信頼性の高い要約生成を実現する手法を提案する。
大規模言語モデル (LLM) は、長さやトピックなどの特定の属性を制御しながらテキストを要約する能力において有望性を示していますが、複数の属性を同時に制御することになると、依然として課題に直面しています。
アラビア語に特化した埋め込みモデルSwanと、その包括的な評価ベンチマークであるArabicMTEBは、アラビア語NLPの分野を大きく前進させ、多様なタスクにおいて最先端の性能を実現する。
英語中心の大規模言語モデル(LLM)は、他の言語、特にリソースの少ない言語ではパフォーマンスが低下するという課題を克服するため、辞書挿入プロンプト(DIP)と呼ばれる新しい手法が提案されている。
大規模言語モデル (LLM) は、ユーザー入力に含まれる著作権情報を認識して尊重することが苦手であり、著作権侵害を助長する可能性がある。
Infant Agentは、ツール統合、階層的なエージェントコラボレーション、メモリ検索メカニズムを通じて、大規模言語モデルの推論能力とタスク実行能力を向上させ、APIコストを大幅に削減する。
大規模言語モデル(LLM)の生成出力における事実誤認を検出するため、軽量なファクトチェック手法であるProvenanceを提案する。