本論文では、基盤モデルをデータ発見とデータエクスプローレーションのタスクに適用する手法であるChorusを提案する。Chorusは3つの代表的なタスク、1)テーブルクラス検出、2)列タイプ注釈、3)結合列予測において、従来のタスク固有のモデルを上回る性能を示す。
テーブルクラス検出: Chorusは、DBPediaオントロジーを使ってテーブルのクラスを正確に検出する。ベースラインと比較して、F1スコアを0.169ポイント、精度を17.5ポイント、再現率を15.5ポイント改善した。
列タイプ注釈: Chorusは、列のセマンティックタイプを正確に注釈する。ベースラインと比較して、F1スコアを0.035ポイント、精度を1.8ポイント、再現率を1.6ポイント改善した。
結合列予測: Chorusは、2つのテーブルを結合するための正しい列を提案する。ベースラインと比較して、F1スコアを0.072ポイント、精度を8.4ポイント、再現率を6.0ポイント改善した。
Chorusは、タスク間の情報フローを可能にする統一アーキテクチャを持ち、さらにアンカリングと呼ばれるリスク軽減手法を導入している。これらの特徴により、Chorusは従来のアプローチを上回る性能を発揮する。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Moe Kayali,A... ב- arxiv.org 04-09-2024
https://arxiv.org/pdf/2306.09610.pdfשאלות מעמיקות