Der Artikel untersucht die Verwendung von Großsprachmodellen (LLMs), um die Überzeugungen und Präferenzen einer menschlichen Population zu modellieren. Dies kann nützlich sein, um simulierte Fokusgruppen für neue Produkte durchzuführen, virtuelle Umfragen durchzuführen und Verhaltensinterventionen zu testen, insbesondere für Interventionen, die teuer, unpraktisch oder unethisch sind.
Die Autoren verwenden einen bestehenden Datensatz zu Präferenzen für Batterieelektrofahrzeuge (BEV), um zwei bekannte Feinabstimmungsmethoden zu testen und die resultierenden Populationen auf ihre Fähigkeit hin zu bewerten, die Präferenzen realer menschlicher Befragter zu treffen. Sie evaluieren ihre Modelle anhand ihrer Fähigkeit, bevölkerungsweite Statistiken sowie individuelle Antworten zu treffen, und untersuchen die Rolle der Temperatur bei der Steuerung des Kompromisses zwischen diesen beiden.
Darüber hinaus schlagen die Autoren einen neuartigen Verlustterm vor, um die Modellleistung bei Antworten zu verbessern, die eine numerische Antwort erfordern.
Die Ergebnisse zeigen, dass es einfacher ist, bevölkerungsweite Statistiken als Einzelpersonen zu modellieren, was darauf hindeutet, dass Einzelinterviews schwierig zu replizieren sein könnten. Die bevölkerungsweiten Modelle können jedoch immer noch in Kontexten wie Marketing oder gemeinweite Simulationen nützlich sein.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Keiichi Nami... о arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20252.pdfГлибші Запити