核心概念
本文提出了一種基於知識空間的科研人員知識廣度測量方法,並使用語義相似性網路對其進行了操作化,通過與已知研究主題發生重大變化的科研人員的外部驗證數據和自我引用數據進行比較,驗證了該方法的有效性。
摘要
文獻類型
這是一篇研究論文,包含摘要、引言、方法、結果、討論和結論等部分。
研究目標
- 本文旨在為「科研人員知識廣度」這一概念提供一個有效的文獻計量指標。
- 作者認為,現有的指標在衡量科研人員知識結構的廣度和動態變化方面存在不足,缺乏經驗驗證。
方法
- 作者採用「知識空間」的方法,利用SPECTER語義文本嵌入技術,將每篇出版物定位在一個共同的知識空間中,並根據其內容計算出版物之間的語義相似度。
- 作者提出了幾個候選指標,包括:
- 出版物之間的平均餘弦相似度
- 每篇出版物與其他出版物之間的最小相似度(最遠鄰居相似度)
- 每篇出版物與其他出版物之間的最大相似度(最近鄰居相似度)
- 出版物相似性網路的平均最短路徑長度
- 基於作者貢獻加權的最遠鄰居相似度
- 作者使用HFSP跨學科獎學金獲得者的出版物數據作為外部驗證數據,並將其與隨機選擇的具有相似特徵的科研人員進行匹配比較。
- 作者還使用了自我引用數據作為內部驗證數據,計算了自我引用率、已實現自我引用率和自我引用網路的標準化平均連通組件大小等指標,並將其與候選知識空間指標進行了相關性分析。
主要發現
- 外部數據驗證結果顯示,基於作者貢獻加權的最遠鄰居相似度指標能夠有效區分已知具有較高知識廣度的科研人員和隨機選擇的科研人員。
- 內部數據驗證結果顯示,該指標與已實現自我引用率和自我引用網路的標準化平均連通組件大小指標呈顯著正相關,表明知識廣度較高的科研人員傾向於較少引用自己的先前論文,其自我引用網路也較不密集。
主要結論
- 基於知識空間和語義文本嵌入技術的科研人員知識廣度測量方法是有效的。
- 基於作者貢獻加權的最遠鄰居相似度指標是一個可靠的知識廣度指標。
研究意義
- 本研究為科研人員知識廣度的測量提供了一種新的、經過驗證的方法,有助於推動該領域的發展。
- 該方法可以應用於研究不同學科、職業階段、研究機構類型和部門的科研人員知識廣度分佈,以及知識廣度與其他社會和認知特徵之間的關係。
局限性和未來研究方向
- 本研究的樣本量有限,未來需要使用更大規模的數據集進行驗證。
- 未來可以探索其他語義文本嵌入模型和知識空間構建方法,以進一步提高測量精度。
統計資料
控制組(匹配作者)論文的平均餘弦相似度為 0.67,標準差為 0.06。
治療組(CDF 研究員)論文的平均餘弦相似度為 0.63,標準差為 0.06。
在 72% 的配對中,控制組的平均餘弦相似度值大於治療組。
加權最遠鄰居指標的效應量約為 -0.85。
簡單自我引用率與加權最遠鄰居指標的皮爾遜相關係數為 r = -0.04 (p < 0.01; 95% CI: [-0.05, -0.04])。
已實現自我引用率與加權最遠鄰居指標的皮爾遜相關係數為 r = 0.40 (p < 0.01; 95% CI: [0.40, 0.41])。
自我引用網路的標準化平均連通組件大小與加權最遠鄰居指標的皮爾遜相關係數為 p = 0.40 (p < 0.01; 95% CI: [0.39, 0.40])。