본 연구 논문에서는 대규모 언어 모델(LLM)의 성능과 보안을 동시에 향상시키는 새로운 프롬프트 최적화 프레임워크인 SoS(Survival of the Safest)를 제안합니다. 기존의 프롬프트 최적화 연구는 주로 성능 향상에만 초점을 맞추어 실제 애플리케이션 적용 시 심각한 보안 문제를 야기할 수 있다는 한계점을 가지고 있었습니다.
SoS는 인터리브된 다목표 진화 전략을 사용하여 LLM의 성능과 보안을 동시에 향상시킵니다. 이 프레임워크는 의미, 피드백 및 교차 변이를 통합하여 개별 프롬프트 공간을 효율적으로 탐색합니다. SoS는 계산적으로 비용이 많이 드는 파레토 프론트 방법과 달리 복잡하고 고차원적인 이산 검색 공간에서 최적화를 빠르게 수행하면서도 계산 요구 사항을 낮게 유지하는 확장 가능한 솔루션을 제공합니다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Ankita Sinha... um arxiv.org 10-15-2024
https://arxiv.org/pdf/2410.09652.pdfTiefere Fragen