Основные понятия
최신 AI 모델과 전통적인 모델의 데이터 익명화 성능을 비교하여 각 접근법의 장단점을 분석하고 향후 발전 방향을 제시한다.
Аннотация
이 연구는 데이터 익명화를 위한 다양한 AI 모델의 성능을 비교 분석한다.
먼저 전통적인 모델인 CRF, LSTM, ELMo의 성능을 평가했다. CRF와 LSTM이 가장 우수한 성능을 보였으며, ELMo는 상대적으로 낮은 정확도를 보였다.
다음으로 BERT, ELECTRA, 커스텀 Transformer 모델의 성능을 비교했다. 커스텀 Transformer 모델이 가장 뛰어난 성능을 보였고, BERT와 ELECTRA도 우수한 결과를 나타냈다.
Microsoft Presidio 모델과 GPT2 모델도 평가했는데, Presidio 모델은 CRF, LSTM 수준의 성능을 보였고, GPT2 모델은 상대적으로 낮은 정확도를 보였다.
종합적으로 볼 때, 커스텀 Transformer 모델이 가장 뛰어난 성능을 보였지만, 전통적인 모델과 Presidio 모델도 우수한 결과를 나타냈다. 이를 통해 데이터 익명화를 위해서는 모델 선택 시 각 접근법의 장단점을 고려해야 함을 알 수 있다.
Статистика
CRF 모델은 정확도, 재현율, F1 점수 모두 0.93으로 우수한 성능을 보였다.
LSTM 모델은 정확도 0.93, 재현율 0.92, F1 점수 0.92로 CRF와 유사한 수준의 성능을 나타냈다.
커스텀 Transformer 모델은 정확도 0.94, 재현율 0.95, F1 점수 0.95로 가장 뛰어난 성능을 보였다.
Цитаты
"Transformers pose a significant innovation in deep learning offering advanced capabilities, like: Parallel Processing, Attention Mechanisms, and Scalability."
"LLMs can effectively be used in the field of Named Entity Recognition. The state-of-the-art LLMS are equipped with modules that can detect language subtleties hence making them effective in the realm of anonymization tasks."