Temel Kavramlar
과학 워크플로우 개발 과정에서 서비스 선택 의사 결정 행동을 학습하여 다음 적절한 서비스를 예측하고 추천하는 방법을 제안한다.
Özet
이 연구는 과학 워크플로우 개발 과정을 순차적인 서비스 선택 과정으로 정의하고, 이를 자연어 처리의 문장 생성 문제로 매핑하여 접근한다.
먼저 워크플로우 이력 데이터에서 서비스 간 의존 관계를 추출하여 지식 그래프를 구축한다. 이 지식 그래프를 바탕으로 두 가지 전략(intra-workflow, inter-workflow)을 통해 서비스 조합 경로를 생성한다.
생성된 서비스 조합 경로 데이터를 활용하여 목표 지향적 순차 모델(gLSTM)을 학습한다. 이 모델은 서비스 표현과 서비스 선택 의사 결정 전략을 학습한다.
온라인 추천 단계에서는 현재 구축 중인 워크플로우의 앵커 서비스와 제외된 서비스 집합을 입력으로 받아, 학습된 모델을 통해 다음에 선택할 적절한 서비스 후보들을 예측하고 추천한다.
실험 결과, 제안 방법의 효과성이 입증되었다.
İstatistikler
2018년까지 생명과학 분야 서비스의 10% 미만만이 과학 워크플로우에서 재사용되었다.
NASA의 기후 모델 진단 분석기(CMDA) 서비스는 12개 이상의 입력 매개변수가 필요하다.
Alıntılar
"Unless a user fully understands each parameter, both of its syntactic and semantic meaning and requirements, she may not feel comfortable to reuse the service."
"Our rationale is that, each path (i.e., a sequence of services) in a workflow reflects a scenario of data analytics experiment, which is analogous to a sentence in a conversation."