FLAMESベンチマークは、LLMsの価値アラインメントを包括的に評価するための高度な敵対的ベンチマークである。FLAMESは、LLMsの深刻な安全上の脆弱性を明らかにし、価値アラインメントの向上に向けた新たな課題を提示している。