Основные понятия
본 논문은 텍스트 마이닝 기법을 활용하여 건물 제어 및 거주자 상호 작용 분야에서 추천 시스템과 강화 학습 적용에 대한 연구 동향을 분석하고, 기존 연구의 한계점과 향후 연구 방향을 제시합니다.
Аннотация
건물 제어 및 거주자 상호 작용을 위한 추천 시스템 및 강화 학습: 텍스트 마이닝 기반 과학 문헌 검토
본 연구는 건물 제어 및 거주자 상호 작용 분야에서 추천 시스템과 강화 학습의 적용 가능성을 탐구하기 위해 텍스트 마이닝 및 자연어 처리(NLP) 기법을 활용한 과학 문헌 검토 결과를 제시합니다.
연구 배경
실내 환경은 인간의 건강과 웰빙에 큰 영향을 미치며, 하루 평균 약 86%의 시간을 실내에서 보내는 것으로 알려져 있습니다.
스마트 건물 제어 시스템은 에너지 사용량을 줄이고 실내 환경을 개선하는 데 효과적인 것으로 입증되었지만, 높은 초기 비용과 복잡한 구현 과정으로 인해 광범위한 도입이 제한적입니다.
정보 통신 기술(ICT)의 발전과 함께 인공지능(AI), 사물 인터넷(IoT), 스마트 모바일 기기의 보급이 확산되면서, 추천 시스템과 강화 학습은 건물 제어 및 거주자 상호 작용 분야에서 에너지 효율을 개선하고 실내 환경을 최적화하는 유망한 접근 방식으로 주목받고 있습니다.
텍스트 마이닝 기반 문헌 검토의 필요성
기존 문헌 검토 방식은 방대한 양의 출판물을 효과적으로 처리하는 데 어려움을 겪으며, 특히 학제 간 분야에서 연구 간의 미묘한 관계를 파악하는 데 한계를 보입니다.
텍스트 마이닝 기반 문헌 검토는 데이터 기반 기술을 활용하여 대규모 텍스트 코퍼스에서 정보를 체계적으로 추출하고 분석함으로써, 기존 방식의 한계를 극복하고 연구 동향, 패턴 및 새로운 주제를 식별하는 데 효과적인 도구입니다.
본 연구에서는 Elsevier API를 통해 ScienceDirect 데이터베이스에서 27,000개 이상의 관련 논문을 수집하고, 텍스트 마이닝, NLP 및 시각적 분석을 통해 데이터를 분석했습니다.
주요 단계
논문 검색 및 필터링: 추천 시스템, 에너지 효율성, 실내 환경, 건물 및 건축 환경과 관련된 키워드를 사용하여 Elsevier API를 통해 ScienceDirect 데이터베이스에서 관련 논문을 검색하고 중복 및 오류 파일을 제거하여 데이터 세트를 구축했습니다.
키워드 분류: 수집된 논문에서 추출한 키워드를 알고리즘, 추천 시스템 유형, 입력 데이터, 중재/목표, 플랫폼의 다섯 가지 범주로 분류하고, 복합 키워드를 단일 엔터티로 변환하여 NLP 모델 학습을 용이하게 했습니다.
텍스트 전처리: NLP 모델 학습에 부정적인 영향을 미칠 수 있는 단어를 제거하고, 복합 단어를 병합하고, 단어 토큰화 및 표제어 추출을 수행하여 전체 텍스트 데이터를 정제했습니다.
Word2Vec을 사용한 NLP 텍스트 마이닝: Word2Vec을 사용하여 텍스트 내 단어 간의 의미적 유사성을 식별하고 각 단어를 다차원 벡터에 매핑하여 유사도를 측정했습니다.
범주 간 관계 추출: 학습된 Word2Vec 모델을 사용하여 각 범주에서 의미적으로 유사한 단어를 추출하고, 동일한 개념을 나타내는 여러 단어를 하나의 대표 용어로 매핑하여 용어 간의 관계를 분석했습니다.
관계 그래프 네트워크 생성: 추출된 키워드 간의 관계를 시각적으로 표현하기 위해 히트 맵과 계층적 클러스터링을 활용하여 각 범주 내 하위 클러스터를 형성하고 범주 간의 상호 관계를 분석했습니다.