이 연구는 데이터 익명화를 위한 다양한 AI 모델의 성능을 비교 분석한다.
먼저 전통적인 모델인 CRF, LSTM, ELMo의 성능을 평가했다. CRF와 LSTM이 가장 우수한 성능을 보였으며, ELMo는 상대적으로 낮은 정확도를 보였다.
다음으로 BERT, ELECTRA, 커스텀 Transformer 모델의 성능을 비교했다. 커스텀 Transformer 모델이 가장 뛰어난 성능을 보였고, BERT와 ELECTRA도 우수한 결과를 나타냈다.
Microsoft Presidio 모델과 GPT2 모델도 평가했는데, Presidio 모델은 CRF, LSTM 수준의 성능을 보였고, GPT2 모델은 상대적으로 낮은 정확도를 보였다.
종합적으로 볼 때, 커스텀 Transformer 모델이 가장 뛰어난 성능을 보였지만, 전통적인 모델과 Presidio 모델도 우수한 결과를 나타냈다. 이를 통해 데이터 익명화를 위해서는 모델 선택 시 각 접근법의 장단점을 고려해야 함을 알 수 있다.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Dimitris Asi... ב- arxiv.org 04-24-2024
https://arxiv.org/pdf/2404.14465.pdfשאלות מעמיקות