CODE-ACCORDは、英国とフィンランドの建築規制から抽出された862個の自己完結文で構成されるユニークなデータセットであり、機械可読形式への変換を目指す情報抽出タスクを促進します。各文はエンティティと関係で注釈が付けられました。このデータセットは、ACCにおける機械学習や自然言語処理(NLP)に関連するさまざまなタスクに対応し、テキスト分類、エンティティ認識、関係抽出などを可能にします。CODE-ACCORDは、コンプライアンスチェックにおける最初のエンティティと関係が注釈付けされたデータセットであり、公開されています。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Pertanyaan yang Lebih Dalam