Konsep Inti
トランスフォーマー表現を使用した確率的トピックモデリングの提案とその優れた性能に焦点を当てる。
Abstrak
自然言語処理におけるトピックモデリングの進化について、トランスフォーマー表現を活用した新しい手法であるTNTMが提案された。この手法は、他の従来のモデルよりも優れた埋め込みの一貫性とトピックの多様性を維持しつつ、最先端の結果を達成している。論文では、TNTMが他の12種類のモデルと比較され、その性能が示されている。
Statistik
20 News-groupsデータセットで20トピックの場合、TNTMは埋め込み一貫性で0.367を達成。
20 News-groupsデータセットで200トピックの場合、TNTMは埋め込み一貫性で0.370を達成。
Kutipan
"We propose the TNTM that allows for probabilistic topic modeling with transformer-based word embeddings."
"TNTM achieves state-of-the-art topic coherence while maintaining almost perfect topic diversity."