المفاهيم الأساسية
신경 알고리즘적 추론에서 역사적 임베딩의 사용이 마르코프 특성과 상충됨을 밝히고, ForgetNet 및 G-ForgetNet을 제안하여 더 나은 일반화 능력을 달성함.
الإحصائيات
ForgetNet은 기존 방법보다 23/30 알고리즘적 추론 작업에서 더 나은 성능을 보임.
G-ForgetNet은 모든 30 작업에서 기준선보다 향상된 성능을 보임.
اقتباسات
"Such a misalignment introduces noise, thus hindering the model’s generalization ability, especially in out-of-distribution scenarios."
"Our extensive experiments, based on the CLRS-30 algorithmic reasoning benchmark, demonstrate that both ForgetNet and G-ForgetNet achieve better generalization capability than existing methods."