人工的に生成されたテキストデータの品質検査と出自追跡を支援するツールINSPECTORを開発した。INSPECTORは、データの変換履歴や言語的特徴に基づいてテキストをグループ化し、品質メトリクスや大規模言語モデルの予測を提示することで、人手による効率的な品質検査を可能にする。