大規模な言語モデル(LLM)は、産業全体で多くのアプリケーションを革新しました。しかし、その「ブラックボックス」性質はしばしば特定の決定をどのように行うかを理解することを妨げ、透明性、信頼性、倫理的使用に関する懸念を引き起こします。この研究では、システムプロンプト内の個々の単語を変化させてLLMsの出力に与える統計的影響を明らかにする方法を提案しています。このアプローチは、表形式データ用の置換重要度から着想を得ており、各単語がシステムプロンプト内でどのように出力に影響するかを評価します。
เป็นภาษาอื่น
จากเนื้อหาต้นฉบับ
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Stefan Hackm... ที่ arxiv.org 03-06-2024
https://arxiv.org/pdf/2403.03028.pdfสอบถามเพิ่มเติม