이 논문은 모델 편집 기술인 ROME과 MEMIT을 하나의 통합된 개념적 프레임워크 아래 설명한다. 두 기술 모두 "보존-기억" 목적함수를 최적화하지만, ROME은 등식 제약을 사용하고 MEMIT은 최소제곱 제약을 사용한다.
MEMIT은 편집 분배 알고리즘을 추가로 사용하여 다중 레이어 편집을 가능하게 한다. 이 편집 분배 알고리즘은 ROME에도 적용할 수 있으며, 편집 목적함수와는 별개의 개체로 간주되어야 한다.
저자들은 등식 제약을 사용하는 새로운 배치 편집 알고리즘 EMMET을 제안한다. EMMET은 ROME과 MEMIT을 통합하는 역할을 하며, 작은 배치 크기에서는 MEMIT과 유사한 성능을 보인다. 하지만 대규모 배치 편집에서는 등식 제약으로 인해 MEMIT보다 성능이 떨어진다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Akshat Gupta... alle arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14236.pdfDomande più approfondite