本文提出了一種新的顯著性預測模型TempSAL,能夠同時預測傳統的圖像顯著性和時間序列的顯著性軌跡。
首先,作者分析了SALICON數據集中人類注意力隨時間的變化模式,發現注意力會隨時間發生轉移,並且不同時間段的注意力分布存在顯著差異。
基於這一發現,作者提出了TempSAL模型。該模型包含三個主要組件:
圖像編碼器和顯著性解碼器:用於提取圖像特徵並預測圖像顯著性。
時間顯著性解碼器:用於預測時間序列的顯著性地圖。
時空混合模塊:將時間顯著性預測和圖像顯著性預測結合,產生最終的顯著性預測。
作者在SALICON和CodeCharts1k數據集上進行了實驗,結果顯示TempSAL模型在多個評估指標上均優於現有的顯著性預測方法,尤其是在考慮時間信息的情況下。這表明時間信息對於提高顯著性預測的準確性非常重要。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Baha... alle arxiv.org 09-11-2024
https://arxiv.org/pdf/2301.02315.pdfDomande più approfondite