本研究は、大規模言語モデル(LLM)を表形式データの予測タスクに適用することを目的としている。表形式データは複雑な多次元の相互作用と構造的な微妙な違いを持つため、従来の手法では課題が残されていた。
本研究では以下の取り組みを行った:
実験の結果、分類タスクで平均8.9%、回帰タスクで10.7%の性能向上を達成した。また、欠損値補完タスクではGPT-4を27%上回った。さらに、極端な少量学習(4shot)では28.8%、長文脈学習では18.8%の大幅な性能向上を示した。
これらの成果は、LLMの表形式データ理解と活用の新たな可能性を開拓するものであり、データサイエンス分野における大きな進展となる。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yazheng Yang... a las arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.20208.pdfConsultas más profundas