이 연구에서는 BoUTS (Boosted Universal and Task-specific Selection) 알고리즘을 제안한다. BoUTS는 다중 과제 데이터셋에서 보편적 특징과 과제 특정적 특징을 효과적으로 선택할 수 있다.
첫째, BoUTS는 다중 과제 트리를 사용하여 모든 과제에서 중요한 보편적 특징을 선택한다. 이 방법은 특징 중요도의 최소값을 최대화하여 모든 과제에 대해 예측력이 높은 특징을 선택한다.
둘째, BoUTS는 개별 과제에 대해 부스팅 트리를 사용하여 과제 특정적 특징을 선택한다. 이때 새로운 특징 추가에 대한 페널티를 부여하여 특징 집합의 크기를 최소화한다.
BoUTS를 7개의 화학 회귀 데이터셋에 적용한 결과, 기존 방법들에 비해 더 적은 수의 특징을 선택하면서도 예측 정확도를 유지할 수 있었다. 특히 BoUTS의 보편적 특징은 데이터셋 간 지식 전이를 가능하게 하고, 겉보기 다른 화학 데이터셋 간의 깊은 연관성을 시사한다.
BoUTS는 데이터가 부족한 시스템에서 데이터가 풍부한 유사 시스템의 정보를 활용할 수 있어, 다양한 과학 분야에서 중요한 발전을 이룰 것으로 기대된다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문