本論文では、Diffusion-KTOと呼ばれる新しい手法を提案している。これは、テキストから画像への拡散モデルを人間の好みに合わせて整列させるためのものである。従来の手法では、ペアの好み情報を収集する必要があり、コストがかかっていた。Diffusion-KTOでは、単純なイメージごとのバイナリフィードバック(好き/嫌い)のみを使用して学習できる。
具体的には以下の通り:
Diffusion-KTOは、人間の好みに合わせてテキストから画像への拡散モデルを整列させる新しい手法であり、ペアの好み情報を必要とせず、簡単なバイナリフィードバックのみで学習できるという特徴がある。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Shufan Li,Ko... pada arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04465.pdfPertanyaan yang Lebih Dalam