Conceitos Básicos
개인정보 보호 정책은 정보 주체의 권리를 알리고 데이터 관리 관행을 투명하게 설명해야 하지만, 이를 위해서는 정책이 공정하게 작성되어야 한다. 이 연구는 개인정보 보호 정책의 정보적 공정성, 대표적 공정성, 윤리 및 도덕성을 자동으로 평가하는 방법을 제안한다.
Resumo
이 연구는 개인정보 보호 정책의 공정성을 평가하기 위한 접근 방식을 제안한다.
정보적 공정성:
- 정책의 완전성을 평가하기 위해 감독 학습을 사용한다.
- 어휘 수준에서 외래어, 복잡한 단어, 전문 용어 등을 식별하여 사회경제적, 국적, 장애, 연령 관련 편향을 평가한다.
- 문장 수준에서 읽기 용이성 지표(Flesch Reading Ease, TAASSC 2.0)와 응집성 지표(DiscoScore)를 사용한다.
- 문서 구조 수준에서 문단 길이, 제목 수, 구조 깊이 등을 평가한다.
대표적 공정성:
- 다양한 인구통계학적 특성(능력, 사회경제적 지위, 연령, 정치, 국적, 성별, 성적 지향, 문화 등)을 나타내는 용어집을 구축한다.
- 이 용어집을 사용하여 정량적 및 의미론적 평가를 수행한다.
윤리 및 도덕성:
- 취약성, 위험, 이해관계의 균형 등을 평가하기 위해 대규모 언어 모델(LLM)을 사용한다.
- LLM을 통해 정책에 내재된 윤리 기준을 식별하고 정량화한다.
이 연구는 개인정보 보호 정책의 공정성 평가를 위한 기반을 마련했다. 향후 연구에서는 전체 평가 시스템을 구현하고 법률 및 윤리 전문가와의 협력을 통해 평가 기준을 보완할 계획이다.
Estatísticas
개인정보 보호 정책의 평균 단어 수는 4,809.59개이다.
평균 문단 수는 149.63개이며, 평균 문단 길이는 32.14단어이다.
평균 제목 수는 33.82개이며, 평균 제목 길이는 4.83단어이다.
91.59%의 정책에서 목록이 사용되었고, 71.52%에서 굵은 글씨, 15.37%에서 기울임꼴이 사용되었다.
6.15%의 정책에는 제목이 없었다.