toplogo
Sign In

특허 발명자 이름 구분을 위한 개체 중심 평가 프레임워크


Core Concepts
개체 중심 데이터 레이블링 방법론과 통합 프레임워크를 통해 요약 통계, 핵심 성능 지표 추정, 오류 원인 분석을 수행할 수 있다.
Abstract
이 논문은 특허 발명자 이름 구분을 위한 개체 중심 평가 프레임워크를 제안한다. 주요 내용은 다음과 같다: 요약 통계: 클러스터 크기 분포, 동음이의어율, 이름 변이율 등의 요약 통계를 제안하여 발명자 이름 구분 결과를 모니터링할 수 있다. 데이터 레이블링: 대표적인 개체 클러스터를 샘플링하여 수동으로 레이블링하는 방법론을 제안한다. 이를 통해 기준 데이터셋을 구축할 수 있다. 오류 분석: 클러스터 단위 오류 지표를 정의하고, 이를 활용하여 오류 유형을 분석할 수 있다. 이를 통해 발명자 이름 구분 시스템의 약점을 파악할 수 있다. 성능 지표 추정: 클러스터 단위 오류 지표를 활용하여 쌍별 정밀도/재현율, 클러스터 정밀도/재현율, B-Cubed 정밀도/재현율 등의 대표적인 성능 지표를 추정할 수 있다. 이 프레임워크는 발명자 이름 구분 뿐만 아니라 다양한 개체 구분 문제에 적용할 수 있다.
Stats
발명자 이름 구분 결과의 평균 클러스터 크기는 4.5 정도이다. 발명자 이름 구분 결과의 매칭률은 약 90%이다. 발명자 이름 구분 결과의 동음이의어율은 약 15%이다. 발명자 이름 구분 결과의 이름 변이율은 약 35%이다.
Quotes
"개체 중심 데이터 레이블링 방법론과 통합 프레임워크를 통해 요약 통계, 핵심 성능 지표 추정, 오류 원인 분석을 수행할 수 있다." "이 프레임워크는 발명자 이름 구분 뿐만 아니라 다양한 개체 구분 문제에 적용할 수 있다."

Key Insights Distilled From

by Olivier Bine... at arxiv.org 04-09-2024

https://arxiv.org/pdf/2404.05622.pdf
How to Evaluate Entity Resolution Systems

Deeper Inquiries

발명자 이름 구분 오류의 원인이 되는 다른 요인들은 무엇이 있을까?

발명자 이름 구분 오류의 원인은 다양한 요인에 의해 발생할 수 있습니다. 몇 가지 주요 요인은 다음과 같습니다: 이름의 다양성: 발명자 이름에는 다양한 형태와 철자가 있을 수 있으며, 이로 인해 동일한 발명자라도 이름이 다를 수 있습니다. 이는 이름의 철자 오류, 다른 이름 형식 사용, 또는 결혼 후 성이 변경된 경우 등으로 나타날 수 있습니다. 공동 발명자: 여러 명의 발명자가 함께 특허를 신청하는 경우, 각 발명자의 이름이 다를 수 있습니다. 이는 공동 발명자의 이름이 다르게 기록되거나, 특허 문서에서 다른 발명자들의 이름이 누락되는 경우에 발생할 수 있습니다. 지리적 요인: 발명자의 위치 정보가 다를 경우, 발명자 이름 구분에 어려움을 줄 수 있습니다. 특히 이름이 일반적인 경우, 같은 이름을 가진 발명자가 여러 국가에 걸쳐 활동하는 경우가 있을 수 있습니다. 기술적 한계: 발명자 이름 구분 시스템의 기술적 한계로 인해 발생하는 오류도 있을 수 있습니다. 예를 들어, 기술적인 알고리즘의 한계로 인해 유사한 이름을 가진 발명자를 정확하게 구분하지 못할 수 있습니다. 이러한 요인들은 발명자 이름 구분 시스템의 정확성에 영향을 미치며, 이를 고려하여 시스템을 개선하고 오류를 최소화하는 것이 중요합니다.

발명자 이름 구분 성능 향상을 위해 어떤 추가적인 정보를 활용할 수 있을까?

발명자 이름 구분 성능을 향상시키기 위해 다양한 추가 정보를 활용할 수 있습니다. 몇 가지 유용한 정보는 다음과 같습니다: 특허 주제: 발명자가 특허를 신청한 주제나 분야를 고려하여 발명자를 구분할 수 있습니다. 특정 기술 분야에 특화된 발명자들은 해당 분야의 특정 용어나 주제를 공유할 가능성이 높습니다. 공동 발명자: 발명자가 공동으로 특허를 신청한 경우, 공동 발명자들 간의 관계를 고려하여 발명자를 구분할 수 있습니다. 공동 발명자들 간의 협업 패턴이나 공통된 특징을 분석하여 발명자를 식별할 수 있습니다. 기타 신원 정보: 발명자의 소속 기관, 위치, 과거 특허 이력 등의 정보를 활용하여 발명자를 식별할 수 있습니다. 이러한 정보는 발명자의 신원을 더욱 명확하게 파악하는 데 도움이 될 수 있습니다. 이러한 추가 정보를 활용하여 발명자 이름 구분 시스템을 보다 정확하고 효율적으로 만들 수 있으며, 특허 분석의 정확성을 향상시킬 수 있습니다.

발명자 이름 구분 결과가 특허 분석에 어떤 영향을 미칠 수 있을까?

발명자 이름 구분 결과는 특허 분석에 중요한 영향을 미칠 수 있습니다. 몇 가지 영향은 다음과 같습니다: 특허 통계 및 추이 분석: 올바르게 구분된 발명자 정보를 기반으로 한 특허 분석은 정확한 특허 통계 및 추이 분석을 제공할 수 있습니다. 발명자의 활동 패턴, 기술 분야 선호도, 협업 네트워크 등을 식별하여 특허 분석을 보다 효과적으로 수행할 수 있습니다. 기술 혁신 식별: 올바르게 식별된 발명자 정보를 통해 특정 기술 분야에서의 혁신을 식별할 수 있습니다. 발명자의 특정 기술 분야에서의 활동이나 성과를 추적하여 기술 혁신을 파악하고 분석할 수 있습니다. 특허 침해 및 라이센싱: 발명자 정보를 올바르게 구분하면 특허 침해나 라이센싱 관련 분석을 보다 정확하게 수행할 수 있습니다. 특정 발명자의 특허 포트폴리오를 식별하고 관련 기업이나 조직과의 라이센싱 협상을 진행할 수 있습니다. 따라서 발명자 이름 구분 결과는 특허 분석의 정확성과 효율성에 중요한 영향을 미치며, 올바르게 구분된 발명자 정보는 다양한 특허 관련 의사 결정에 도움이 될 수 있습니다.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star