Concepts de base
LMMはLCSH生成に有用であり、人間のカタログ作成者が重要性を保持する。
Résumé
この研究は、大規模言語モデル(LLM)を使用してLibrary of Congress Subject Headings(LCSH)を生成する可能性に焦点を当てています。ChatGPTを使用して、電子論文および博士論文(ETD)のタイトルと要約に基づいて主題見出しを生成しました。結果は、一部の生成された主題見出しが有効であることが示されましたが、特定性と包括性に関する問題がありました。LLMは、学術図書館でカタログ化待ちアイテムの対応策として機能し、迅速なLCSH生成のための費用対効果の高いアプローチも提供します。ただし、人間のカタログ作成者は、LLMによって生成されたLCSHの妥当性、包括性、特定性を検証および向上させるために不可欠です。
Introduction
- MARC and LCSH Systems:
- MARC形式:図書館資料に関する情報を整理するデータ形式。
- LCSH:1898年から遡る豊富な歴史がある。
- Automatic Cataloging Record Generation:
- Subject Analysis for Theses and Dissertations:
Methodology
- ChatGPT内部知識と3つの例を使用してMARC 21形式で出力記述。
- Prompt設計:コンテキスト、指示、出力指示子と入力データ。
Results
- ChatGPTは各ETDレコードごとに3〜5件の主題見出し(多くはサブディビジョン付き)を生成。
- マークフィールドコーディング:90%以上が正確。
- LCSH割り当て:7つのETDレコードで問題なくLCSHが生成された。
Discussion
- LLMs(ChatGPT)はカタログ作成者に依存できる程度までマークフィールドコーディング精度が高い。
- LCSH妥当性問題への解決策:
Conclusion
- LLMs(ChatGPT)はLCSH生成に有望な探索手法。
- ChatGPT内部知識ベースが更新され続けることから人間カタログ作成者が品質監視を継続的に行う必要あり。