本文提出了一項新任務SciDoc2Diagram,目標是從學術論文自動生成科學圖表,並建立了相應的基準數據集SciDoc2DiagramBench。作者開發了一個多步驟管線SciDoc2Diagrammer,該管線首先從論文中提取相關信息,然後生成中間代碼以渲染最終圖表。
作者發現,初始生成的圖表常常存在不完整或不忠實於原文的問題,因此提出了SciDoc2Diagrammer-Multi-Aspect-Feedback (MAF)的優化策略。該策略通過三個專門的評估模塊(完整性、忠實度和佈局)提供有針對性的反饋,顯著提高了圖表的事實正確性和視覺吸引力,並在自動和人工評估中優於現有模型。
作者還發現,對於複雜的流程圖和表格,從單一或多個文檔中迭代合成信息可以顯著提高清晰度和精確性。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Ishani Monda... ב- arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19242.pdfשאלות מעמיקות