本研究では、LLMを用いたハードウェアコード生成の創造性を評価するためのフレームワークCreativEvalを提案した。このフレームワークでは、流暢性、柔軟性、独創性、精緻化の4つの創造性の下位要素を定量化し、評価する。
具体的には以下の手順で評価を行う:
これらの4つの下位要素を総合して、LLMの創造性を定量的に評価する。
実験の結果、GPT-3.5が最も創造性が高いことが示された。一方、モデルサイズが大きくなるにつれ、創造性が若干低下する傾向が見られた。
今後の研究では、より多様なLLMモデルを評価し、創造性向上のための手法を探索していくことが期待される。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Matthew DeLo... às arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.08806.pdfPerguntas Mais Profundas