논문 리뷰의 표준화, 평가 및 분석을 통해 저자들이 논문을 개선할 수 있도록 도움을 제공하는 자동화된 프레임워크 SEA를 소개한다.
LLM 생성 합성 데이터를 활용하여 온라인 정치 토론에 대한 입장 탐지 모델의 성능을 향상시킬 수 있다. 합성 데이터를 통한 데이터 증강과 능동 학습 기법을 통해 라벨링 노력을 줄이면서도 우수한 성능을 달성할 수 있다.
TOPFORMER는 변형 기반 모델과 위상 데이터 분석 기법을 결합하여 인공지능 생성 텍스트와 인간 작성 텍스트를 더 정확하게 구분할 수 있다.
본 연구는 SVM, KNN, 의사결정 트리 분류기를 결합한 앙상블 접근법을 제안하여 전자상거래 플랫폼의 가짜 리뷰를 효과적으로 탐지하고자 한다.
본 논문에서는 SemEval-2024 환각 탐지 과제를 위해 개발한 혁신적인 시스템을 소개합니다. 다양한 기준으로 모델 예측과 참조 표준을 비교하는 전략을 탐구했으며, 사전 훈련된 인코더의 감독 학습을 통한 개선과 여러 고성능 모델을 활용한 앙상블 접근법을 시도했습니다. 이를 통해 강력한 성능 지표를 보이는 세 가지 독특한 방법을 제시합니다. 또한 레이블이 없는 훈련 데이터에서 추가 훈련 샘플을 생성하여 데이터를 증폭시켰습니다. 마지막으로 접근법들에 대한 자세한 비교 분석을 제공합니다.
대규모 언어 모델의 에세이 채점 능력을 향상시키기 위해 다중 특성 전문화 기법을 제안하였다. 이를 통해 언어 모델이 에세이의 다양한 측면을 종합적으로 평가할 수 있게 하였다.
본 연구는 수학 문제 해결 능력을 향상시키기 위해 다양한 데이터 증강 기법을 제안하고 평가한다. 특히 문맥 학습 기반 데이터 증강 방법을 통해 기존 데이터를 확장하여 모델의 성능을 개선한다.
대규모 언어 모델을 활용하여 제로 및 소량 학습 기반의 환각 탐지 분류기를 개발하였으며, 이를 SemEval-2024 Task 6에 적용하여 경쟁적인 성과를 달성하였다.
단일 레이어의 분리된 주의 메커니즘이 일반화된 Potts 모델의 조건부 확률 분포를 정확하게 학습할 수 있음을 보여준다.
BERT 모델에 언어 특징을 추가하여 복잡한 언어 구조를 이해하고 정확한 답변을 예측할 수 있다.