本文提出了一項新任務SciDoc2Diagram,目標是從學術論文自動生成科學圖表,並建立了相應的基準數據集SciDoc2DiagramBench。作者開發了一個多步驟管線SciDoc2Diagrammer,該管線首先從論文中提取相關信息,然後生成中間代碼以渲染最終圖表。
作者發現,初始生成的圖表常常存在不完整或不忠實於原文的問題,因此提出了SciDoc2Diagrammer-Multi-Aspect-Feedback (MAF)的優化策略。該策略通過三個專門的評估模塊(完整性、忠實度和佈局)提供有針對性的反饋,顯著提高了圖表的事實正確性和視覺吸引力,並在自動和人工評估中優於現有模型。
作者還發現,對於複雜的流程圖和表格,從單一或多個文檔中迭代合成信息可以顯著提高清晰度和精確性。
翻譯成其他語言
從原文內容
arxiv.org
深入探究