toplogo
Увійти

高次元データ解析のための条件付きスパイクアンドスラブ事前分布を用いた共変量重視頑健局所情報転移


Основні поняття
本論文では、高次元データ解析のための新しい転移学習手法CONCERTを提案する。CONCERTは、条件付きスパイクアンドスラブ事前分布を用いることで、ターゲットデータとソースデータの局所的な類似性を捉え、ロバストに情報を転移することができる。
Анотація

本論文では、高次元データ解析のための新しい転移学習手法CONCERTを提案している。従来の転移学習手法は、ターゲットデータとソースデータの全体的な類似性を利用するが、ソースデータが部分的にしか有用でない場合に効率的ではない。そこで、CONCERTは条件付きスパイクアンドスラブ事前分布を用いることで、各共変量ごとの局所的な類似性を捉え、ロバストに情報を転移することができる。

具体的には、ターゲットデータのパラメータと各ソースデータのパラメータの関係を条件付きスパイクアンドスラブ分布でモデル化する。これにより、変数選択と情報転移を同時に行うことができる。理論的には、変数選択の一致性を示すことができる。また、変分ベイズ法を用いることで、スケーラブルな実装が可能となる。

数値実験では、CONCERTが既存の転移学習手法に比べて優れた性能を示すことを確認した。特に、ソースデータが部分的にしか有用でない場合や、冗長な情報を含む場合においても、CONCERTは頑健に振る舞うことが分かった。さらに、遺伝子発現データの分析においても、CONCERTが優れた予測性能を示すことを確認した。

edit_icon

Customize Summary

edit_icon

Rewrite with AI

edit_icon

Generate Citations

translate_icon

Translate Source

visual_icon

Generate MindMap

visit_icon

Visit Source

Статистика
ターゲットデータのサンプルサイズはn0=150である。 ソースデータのサンプルサイズはnk=100である。 共変量の次元数はp=200である。
Цитати
なし

Ключові висновки, отримані з

by Ruqian Zhang... о arxiv.org 04-08-2024

https://arxiv.org/pdf/2404.03764.pdf
CONCERT

Глибші Запити

ターゲットデータとソースデータの局所的な類似性を定量化する指標はどのように設計できるか。

CONCERTの手法では、ソースデータとターゲットデータの局所的な類似性を定量化するために、条件付きスパイクアンドスラブ事前分布を導入しています。この条件付きスパイクアンドスラブ事前分布は、各ソースのパラメータとターゲットのパラメータの結合分布に適用されます。具体的には、各ソースの各説明変数の係数に、その対応するターゲットパラメータを中心とした条件付きスパイクアンドスラブ事前分布を適用します。これにより、各ソースからの局所的な類似性を特徴付けることができます。この手法によって、ソースデータからの有用な情報を適応的に利用して、ターゲットの学習を改善することが可能となります。
0
star