toplogo
Sign In

특허 출원인 이름 통합을 위한 Terrorizer 알고리즘


Core Concepts
Terrorizer 알고리즘은 자연어 처리, 네트워크 이론, 규칙 기반 기술을 활용하여 특허 데이터베이스에 등록된 기업 이름의 변형을 통합하는 혁신적인 방법을 제시한다.
Abstract
이 연구는 특허 데이터에서 유용한 정보를 추출하는 데 있어 주요 장애물인 기업 이름 구분 문제를 해결하기 위해 Terrorizer 알고리즘을 제안한다. parsing 단계에서는 웹 크롤러를 통해 기업 이름에 대한 추가 정보를 수집하고 정제한다. matching 단계에서는 각 기업 이름 쌍에 대한 매칭 점수를 계산한다. 이때 토큰 공통성, 도메인 일치, URL 텍스트 유사성 등 다양한 조건을 고려한다. filtering 단계에서는 네트워크 이론을 활용하여 커뮤니티를 탐지하고, 브릿지 중심성을 기반으로 잘못 연결된 엣지를 제거한다. 또한 각 커뮤니티에 대해 평균 코사인 유사도가 가장 높은 이름을 선정한다. Terrorizer는 USPTO 특허 출원인 325,917개 이름을 42% 감소시켰다. 벤치마크 데이터셋에 대한 성능 평가 결과, Terrorizer는 기존 알고리즘보다 우수한 F1 점수를 달성했다.
Stats
특허 출원인 이름 중 20,461개에서 맞춤법 오류가 수정되었다. 특허 출원인 이름이 325,917개에서 188,445개로 42% 감소했다.
Quotes
"특허 데이터는 혁신, 지식 생산, 기술 진화에 대한 중요한 정보원이지만, 특허권자 수준에서 특정 우려사항이 있다." "기업 이름 구분 문제는 연구 결과를 왜곡시키며, 특히 다양한 이름으로 특허를 출원하는 다국적 기업의 경우 더욱 그렇다."

Key Insights Distilled From

by Grazia Sveva... at arxiv.org 03-20-2024

https://arxiv.org/pdf/2403.12083.pdf
Presenting Terrorizer

Deeper Inquiries

특허 데이터 외에 기업 이름 통합에 활용할 수 있는 다른 데이터 소스는 무엇이 있을까?

기업 이름 통합을 위해 특허 데이터 이외에도 다양한 데이터 소스를 활용할 수 있습니다. 몇 가지 예시로는 다음과 같은 소스들이 있을 수 있습니다: 기업 등기 정보: 기업 등기 정보 데이터베이스에서 기업의 공식 등기 이름과 정보를 활용하여 기업 이름을 통합할 수 있습니다. 금융 보고서: 기업의 금융 보고서에서 사용된 공식적인 기업 이름과 관련 정보를 추출하여 기업 이름을 일치시키는 데 활용할 수 있습니다. 뉴스 및 언론 자료: 기업에 대한 뉴스 기사 및 언론 자료에서 언급된 기업 이름을 수집하여 기업 이름을 통합하는 데 활용할 수 있습니다. 소셜 미디어: 소셜 미디어 플랫폼에서 기업에 대한 언급을 모니터링하고 해당 정보를 기반으로 기업 이름을 일치시키는 데 활용할 수 있습니다. 이러한 다양한 데이터 소스를 결합하여 기업 이름 통합 기술을 보다 효과적으로 구축하고 정확도를 향상시킬 수 있습니다.

기업 인수합병 등 기업 구조 변화에 따른 이름 변화를 어떻게 더 효과적으로 반영할 수 있을까?

기업 인수합병 및 구조 변화에 따른 이름 변화를 효과적으로 반영하기 위해서는 다음과 같은 방법을 고려할 수 있습니다: 역사적 데이터 분석: 기업의 역사적 데이터를 분석하여 인수합병 및 구조 변화에 따른 이름 변화를 추적하고 기록할 수 있습니다. 자동화된 데이터 수집: 자동화된 데이터 수집 및 분석 도구를 활용하여 기업 이름의 변화를 실시간으로 모니터링하고 업데이트할 수 있습니다. 자연어 처리 기술: 자연어 처리 기술을 활용하여 기업 이름의 다양한 형태 및 변형을 식별하고 일치시키는 데 활용할 수 있습니다. 외부 데이터 연동: 외부 데이터베이스와 연동하여 기업 이름의 변화를 추적하고 해당 정보를 기반으로 통합된 기업 이름을 유지할 수 있습니다. 이러한 방법을 통해 기업 구조 변화에 따른 이름 변화를 효과적으로 반영하고 정확한 기업 이름 통합을 실현할 수 있습니다.

기업 이름 통합 기술이 발전하면 특허 데이터 분석을 통해 어떤 새로운 통찰을 얻을 수 있을까?

기업 이름 통합 기술이 발전함에 따라 특허 데이터 분석을 통해 다음과 같은 새로운 통찰을 얻을 수 있습니다: 정확한 특허 소유자 식별: 기업 이름 통합 기술을 통해 정확한 특허 소유자를 식별하고 특허 데이터의 정확성을 향상시킬 수 있습니다. 기술 혁신 추적: 기업 이름 통합을 통해 특정 기업의 기술 혁신 활동을 추적하고 분석하여 시장 동향 및 기술 발전을 파악할 수 있습니다. 경쟁사 분석: 정확한 기업 이름 통합을 통해 경쟁사 간의 특허 활동을 비교하고 분석하여 시장 경쟁력을 평가할 수 있습니다. 투자 및 협력 기회 식별: 정확한 기업 이름 통합을 통해 특정 기업의 특허 포트폴리오를 분석하여 투자 및 협력 기회를 식별할 수 있습니다. 기업 이름 통합 기술의 발전은 특허 데이터 분석을 통해 더 정확하고 신속한 의사결정을 지원하며, 기업의 기술 혁신과 경쟁력을 평가하는 데 중요한 역할을 할 수 있습니다.
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star