핵심 개념
에너지 기반 모델은 확률적 접근에서 중요한 모델 클래스로, 음성 인식, 언어 모델링, 텍스트 생성 등 다양한 음성 및 언어 처리 분야에 성공적으로 적용되고 있다.
초록
이 논문은 에너지 기반 모델에 대한 체계적인 소개를 제공한다. 먼저 확률적 그래픽 모델에 대한 배경 지식을 설명하고, 에너지 기반 모델의 특징과 예시를 소개한다. 이어서 에너지 기반 모델의 학습 알고리즘, 샘플링 방법 등을 다룬다.
다음 세 장에서는 에너지 기반 모델을 세 가지 시나리오에 적용하는 방법을 설명한다:
- 언어 모델링과 같이 관측 시퀀스 자체의 주변 분포를 모델링하는 경우
- 관측 시퀀스가 주어졌을 때 목표 시퀀스의 조건부 분포를 모델링하는 경우 (음성 인식, 시퀀스 레이블링, 텍스트 생성 등)
- 관측 시퀀스와 목표 시퀀스의 결합 분포를 모델링하는 경우 (반지도 학습, 보정된 자연어 이해 등)
각 시나리오에서 에너지 기반 모델의 특징과 장점, 그리고 다양한 응용 사례를 자세히 소개한다.
통계
에너지 기반 모델은 정규화 상수 계산이 필요 없어 효율적인 우도 평가가 가능하다.
에너지 기반 모델은 지역적 정규화 모델이 겪는 레이블 편향과 노출 편향 문제를 자연스럽게 극복할 수 있다.
에너지 기반 모델은 생성-판별 하이브리드 학습과 반지도 학습에 유리하다.
인용구
"에너지 기반 모델은 정규화 제약이 없어 모델 파라미터화에 훨씬 더 큰 유연성을 제공한다."
"에너지 기반 모델은 지역적 정규화 모델이 겪는 레이블 편향과 노출 편향 문제를 자연스럽게 극복할 수 있다."
"에너지 기반 모델은 생성-판별 하이브리드 학습과 반지도 학습에 유리하다."