Conceitos essenciais
大型語言模型展現自動化與增進質性分析的潛力,但仍面臨挑戰,需整合人類專業知識、提升模型穩健性並精進評估方法。
Resumo
大型語言模型於質性研究之應用:系統性文獻探討
文獻回顧
本研究為一系統性文獻探討,旨在分析大型語言模型(LLMs)於質性研究之應用現況。研究遵循 Kitchenham 和 Charters 提出的指南,透過系統性搜尋、篩選、資料擷取和分析,探討 LLMs 在質性分析中的應用脈絡、模型配置、方法論、評估指標以及未來研究方向。
研究發現
- 研究領域涵蓋醫療保健、教育、文化研究和科技分析等。
- 主要目標包含評估 LLMs 自動化分析能力、自動化分析流程以及與人工分析比較結果。
- 常用模型包括 ChatGPT、LLaMA-2、ATLAS.TI、BERT 和 Sabi´a-2,多數研究會調整或改編模型。
- 資料來源以訪談資料為主,其次為文件、社群媒體和歌詞等。
- 常用技術包含主題提取、內容分析、開放式編碼、歸類和扎根理論等。
- LLMs 的效能評估結果多數與傳統方法相當,部分研究顯示 LLMs 表現更佳或略遜一籌。
- 評估指標包含與人工分析比較、準確度、F1 分數和精確率等。
研究限制與未來方向
- LLMs 依賴結構良好的提示才能產生準確結果。
- LLMs 可能產生「幻覺」,即缺乏資料依據的回應。
- 模型可能存在內在偏見,尤其處理敏感資訊時。
- 其他限制包括難以理解主觀表達、缺乏情境敏感度和解讀複雜含義等。
研究建議
- 將 LLMs 視為輔助工具而非完全取代人工分析。
- 強調人機協作以提升準確性和結果有效性。
- 改善提示工程技術,探索更複雜的架構以增進 LLMs 的文本理解能力。
- 增加訓練資料量以提升準確度,並微調預先訓練的模型以優化主題分配。
- 增進 LLMs 捕捉語義和主觀細微差異的能力。
- 持續改進開源模型以降低成本並提高可及性。
- 開發更友善的介面以利非 AI 專家使用。
- 建立標準化且穩健的評估指標以評估 LLMs 執行質性分析的複雜性。
總結
本研究結果顯示 LLMs 在質性分析領域應用日益普及,但仍處於早期階段。LLMs 展現自動化和增進質性分析的潛力,但仍面臨挑戰。未來研究應著重於提升模型穩健性、精進評估方法並整合人類專業知識,以充分發揮 LLMs 在質性研究中的潛力。
Estatísticas
71.4% 的研究發表於 2024 年,顯示該領域相當新穎。
57.1% 的研究調整或改編了 LLMs 模型。
Citações
"LLMs can significantly reduce the effort and time required for qualitative analysis of large data volumes by automating steps that traditionally demand exhaustive human analysis."
"LLMs offer transformative solutions to many challenges faced by traditional qualitative research methods."
"While LLMs demonstrate performance close to or even superior to traditional methods in some cases, there is a clear need for improvements."