본 연구는 비평활 볼록 덧셈 복합 문제를 해결하기 위해 새롭게 정규화된 근위 준 뉴턴 방법 두 가지를 제안하고, 이 방법들이 전역적 비점근 초선형 수렴 속도를 달성함을 이론적으로 증명하는 것을 목표로 합니다.
기존의 뉴턴 방법 또는 준 뉴턴 방법은 빠른 수렴 속도를 보이지만, 전역적 수렴을 위해 라인 검색이나 신뢰 영역과 같은 전역화 전략이 필요했습니다. 또한, 준 뉴턴 방법의 초선형 수렴 속도는 대부분 지역적이거나 점근적인 경우에만 증명되었습니다. 본 연구에서는 정규화 전략과 SR1 방법을 결합하여 전역화 전략 없이도 전역적 비점근 초선형 수렴 속도를 달성하는 방법을 제안합니다.
본 논문에서는 두 가지 정규화 근위 SR1 준 뉴턴 방법을 제안합니다. 첫 번째 방법은 3차 정규화 항을 사용하여 전역적 수렴을 보장하며, 두 번째 방법은 그래디언트 정규화 항을 사용하여 계산 비용을 줄이면서도 전역적 수렴을 보장합니다.
이 방법은 기존의 준 뉴턴 업데이트 단계에 3차 정규화 항을 추가하여 전역적 수렴을 보장합니다. 하지만, 3차 정규화 항을 포함하는 부분 문제는 일반적으로 닫힌 형태의 해를 가지고 있지 않아 계산 비용이 높다는 단점이 있습니다.
이 방법은 3차 정규화 항 대신 그래디언트 정규화 항을 사용하여 계산 비용을 줄이면서도 전역적 수렴을 보장합니다. 또한, 준 뉴턴 메트릭의 트레이스를 기반으로 재시작 기준을 설정하여 메트릭이 항상 유계가 되도록 합니다.
본 논문에서는 제안된 두 가지 방법이 초기화와 무관하게 전역적 비점근 초선형 수렴 속도를 달성함을 증명했습니다. 3차 정규화 방법은 $O(N^{-1/2})^N$의 속도를, 그래디언트 정규화 방법은 $O(N^{-1/4})^N$의 속도를 달성합니다.
본 연구는 정규화 전략과 SR1 준 뉴턴 방법을 결합하여 전역적 비점근 초선형 수렴 속도를 달성하는 새로운 방법을 제시했습니다. 이는 기존의 준 뉴턴 방법의 한계를 극복하고, 머신러닝 및 컴퓨터 비전 분야에서 널리 사용되는 비평활 복합 문제를 해결하는 데 효과적인 방법을 제공합니다.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Shida Wang, ... : arxiv.org 10-16-2024
https://arxiv.org/pdf/2410.11676.pdfDaha Derin Sorular