本論文では、Diffusion-KTOと呼ばれる新しい手法を提案している。これは、テキストから画像への拡散モデルを人間の好みに合わせて整列させるためのものである。従来の手法では、ペアの好み情報を収集する必要があり、コストがかかっていた。Diffusion-KTOでは、単純なイメージごとのバイナリフィードバック(好き/嫌い)のみを使用して学習できる。
具体的には以下の通り:
Diffusion-KTOは、人間の好みに合わせてテキストから画像への拡散モデルを整列させる新しい手法であり、ペアの好み情報を必要とせず、簡単なバイナリフィードバックのみで学習できるという特徴がある。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Shufan Li,Ko... um arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04465.pdfTiefere Fragen