핵심 개념
特許文書の意味的類似性を検出するために、PaECTERは引用情報を活用した数値表現を生成します。
초록
PaECTERは特許文書の意味的類似性を検出するためにBERTを微調整し、特許分野で使用されている最新モデルよりも優れたパフォーマンスを発揮します。このモデルは、特許テキストから生成された数値表現を利用して、分類や知識フローの追跡、または意味的類似性検索などの下流タスクに使用できます。PaECTERはHugging Face上で利用可能です。
통계
PaECTERは平均1.32位で25の無関連特許と比較して1つ以上の最も類似した特許を予測します。
PaECTERはMAPおよびMRR@10においてBERT for Patentsよりも7.85ポイント(有意、p<.001)高い精度を達成します。
PaECTERはRFRスコアにおいて他のモデルと比較して常に最初に関連するものを予測します。
인용구
"PaECTER predicts at least one most similar patent at a rank of 1.32 on average when compared against 25 irrelevant patents."
"PaECTER achieves higher accuracy over BERT for Patents by 7.85 points (significant, p<.001) in MAP and 7.76 points (significant, p<.001) in MRR@10."
"our model consistently predicts first relevant one within the topmost positions of the predicted outcome compared to other models."