Core Concepts
大規模言語モデル(LLMs)を仮想アノテーターとして使用することの可能性を探るための研究。
Abstract
人間による伝統的なアノテーション手法に代わり、LLMsを仮想アノテーターとして使用する方法に焦点を当てた研究。LLMsは生のセンサーデータを直接アノテートし、高い精度で注釈を提供できる可能性があることが示唆されている。この研究では、SimCLRおよびTFCなどのエンコーディング手法を使用して、LLMsが物理センシングデータをラベリングする際の能力向上を検証した。結果は、エンコーディングされたデータが原始データよりも一貫性が高く、正確な注釈が得られることを示している。
Stats
大量の公開数値データからトレーニングされたLLMsによって提供された注釈は、計算的に高価な微調整や洗練されたプロンプトエンジニアリングなしで正確な注釈が可能であった。
エンコードされたセンサーデータは、GPT-4によって理解されやすく、一貫性のある注釈が提供された。
APIへのアクセス制限下で、エンコードされたデータの注釈取得にかかった時間は約13.33分であり、費用は5.03ドルだった。
Quotes
"大規模言語モデル(LLMs)は生のセンサーデータを直接アノテートし、高い精度で注釈を提供できる可能性があることが示唆されている。"
"エンコードされたセンサーデータは原始データよりも一貫性が高く、正確な注釈が得られる。"