本論文では、Diffusion-KTOと呼ばれる新しい手法を提案している。これは、テキストから画像への拡散モデルを人間の好みに合わせて整列させるためのものである。従来の手法では、ペアの好み情報を収集する必要があり、コストがかかっていた。Diffusion-KTOでは、単純なイメージごとのバイナリフィードバック(好き/嫌い)のみを使用して学習できる。
具体的には以下の通り:
Diffusion-KTOは、人間の好みに合わせてテキストから画像への拡散モデルを整列させる新しい手法であり、ペアの好み情報を必要とせず、簡単なバイナリフィードバックのみで学習できるという特徴がある。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Shufan Li,Ko... a las arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04465.pdfConsultas más profundas