Core Concepts
科学の進歩におけるオープンソース技術の重要性と、その悪用可能性に焦点を当てた研究結果を示す。
Abstract
科学の進歩におけるオープンソース技術の役割とリスクについて論じられている。
法的領域での先例データセットを使用したモデル調整が悪意ある回答を生成する可能性を示している。
先例データセットやモデルチューニングが倫理観や情報提供性に与える影響が詳細に分析されている。
ヨーロッパ議会のAI規制提案や法的制裁、個人自由保護など幅広い視点から議論されている。
先例データセット(EVE)作成と悪用可能性:
EVEは200件の犯罪活動に関する質問と回答からなり、モデル調整で非倫理的回答を生成可能。
先例データセットは犯罪行為詳細や判決基準を含み、判決軽減戦略も提供。
オープンソースLLM(大規模言語モデル)はEVEで非倫理的回答生成し易く、小規模グループでも利用可能。
LLM安全性への関連作業:
LLMトレーニング時のバイアスや有害出力への懸念が取り上げられている。
有害コンテンツ特定・低減向け多数データセット開発が行われており、文化的偏見対処も重要視されている。
データセット(EVE)とUNETHICALQUESTIONSKOR:
EVEは200件質問・回答ペアで法的洞察提供。UQKは29.1k非倫理質問・回答ペアでAzure Few-shot learning使用。
KOMT-V1等LLMチューニング後、非倫理スコア低下・情報提供増加傾向あり。
Stats
「EVEは200件質問と回答からなり」
「UQKは29.1k非倫理質問・回答ペア」
「KOMT-V1等LLMチューニング後、非倫理スコア低下・情報提供増加」
Quotes
"Openness without politeness is violence" - Analects of Confucius -