本研究では、LLMを用いたハードウェアコード生成の創造性を評価するためのフレームワークCreativEvalを提案した。このフレームワークでは、流暢性、柔軟性、独創性、精緻化の4つの創造性の下位要素を定量化し、評価する。
具体的には以下の手順で評価を行う:
これらの4つの下位要素を総合して、LLMの創造性を定量的に評価する。
実験の結果、GPT-3.5が最も創造性が高いことが示された。一方、モデルサイズが大きくなるにつれ、創造性が若干低下する傾向が見られた。
今後の研究では、より多様なLLMモデルを評価し、創造性向上のための手法を探索していくことが期待される。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Matthew DeLo... a las arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.08806.pdfConsultas más profundas