大規模言語モデルを使った情報抽出の質を客観的に評価する新しい手法を提案する。人手で作成したラベル付きデータがない場合でも、人工的に生成した情報(ニードル)を文書に埋め込むことで、抽出の正確性を測ることができる。