이 논문은 모델 편집 기술인 ROME과 MEMIT을 통합하는 개념적 프레임워크를 제시한다. 두 기술 모두 보존-기억화 목적함수를 최적화하지만, ROME은 등식 제약을 사용하고 MEMIT은 최소 제곱 목적함수를 사용한다.
ROME은 한 번에 하나의 사실만 편집할 수 있지만, MEMIT은 일괄 편집을 지원한다. 이를 위해 MEMIT은 편집 분배 알고리즘을 사용한다. 저자들은 이 편집 분배 알고리즘을 ROME에도 적용할 수 있음을 보여주고, 이 알고리즘이 최적화 목적함수와는 별개의 엔티티라고 주장한다.
마지막으로 저자들은 EMMET이라는 새로운 일괄 편집 알고리즘을 제안한다. EMMET은 등식 제약 하에서 보존-기억화 목적함수를 최적화하며, 작은 배치 크기에서 MEMIT과 유사한 성능을 보인다. 그러나 배치 크기가 커질수록 등식 제약으로 인해 성능이 저하된다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Akshat Gupta... às arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14236.pdfPerguntas Mais Profundas