Die Studie präsentiert TnT-LLM, ein zweiphasiges Framework zur automatisierten Taxonomie-Generierung und Textklassifizierung unter Verwendung Großer Sprachmodelle (LLMs).
In der ersten Phase nutzt TnT-LLM einen nullstelligen, mehrstufigen Reasoning-Ansatz, um iterativ eine Taxonomie zu erstellen und zu verfeinern. In der zweiten Phase werden LLMs als Datenbeschrifter verwendet, um Trainingsdaten zu generieren, die dann zur Erstellung leichtgewichtiger, skalierbarer Klassifikatoren verwendet werden.
Die Autoren wenden TnT-LLM auf Konversationstranskripte von Bing Copilot an und zeigen, dass das Framework genauere und relevantere Taxonomien im Vergleich zu state-of-the-art-Baselines erstellt. Außerdem erreichen die leichtgewichtigen, auf LLM-Annotationen trainierten Klassifikatoren eine vergleichbare oder sogar bessere Leistung als direkt verwendete LLMs, bei deutlich höherer Skalierbarkeit und Modell-Transparenz.
Die Studie bietet auch praktische Erkenntnisse und Empfehlungen für den Einsatz von LLMs bei der großskaligen Textanalyse in realen Anwendungen.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Mengting Wan... às arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12173.pdfPerguntas Mais Profundas