핵심 개념
MLCommons CloudMask Benchmark의 성능 평가 및 개선 사항 보고
초록
1. 소개
AI가 거의 모든 삶의 측면을 변형하는 강력한 기술로 부상함
AI의 발전을 완전히 활용하지 못한 여러 과학 분야가 존재
MLCommons는 과학 AI 벤치마킹을 촉진하기 위한 공동 노력
MLCommons 과학 워킹 그룹은 다양한 분야의 네 가지 과학 벤치마크 개발
본 논문에서는 대기 과학 분야의 클라우드 마스킹 과학 벤치마크에 대한 초기 작업 제시
2. 클라우드 마스킹 벤치마크
위성 이미지를 통해 구름 픽셀을 정확하게 식별하는 것이 목표
구름 마스킹은 정확한 해수면 및 육지 온도 추정을 위한 중요한 단계
간단한 규칙 기반 방법부터 딥러닝 기술까지 다양한 방법 사용
베이지안 방법은 각 픽셀의 맑은 하늘 확률을 추론하여 임의 정보와 관측에 기초
딥러닝 모델은 이미지 분할을 통해 구름 마스크를 생성하고 예측
3. 데이터 처리
Sentinel-3 위성 이미지를 사용하여 클라우드 마스킹 벤치마크 작업 수행
U-Net 모델을 사용하여 벤치마크에 대한 작업 수행
훈련 및 추론 시간에 대한 실험 결과 보고
4. 모델
U-Net 아키텍처를 사용하여 이미지 분할에 대한 레이블 출력
5. 실험
NYU의 HPC Greene에서 V100 시리즈의 GPU를 사용하여 U-Net 모델을 200회 에폭으로 훈련
5회 실험 결과 평균 정확도는 0.889
6. 결과
147회 에폭에서 최상의 결과를 얻음
훈련 및 검증 손실 및 정확도에 대한 상세한 결과 제시
7. 결론
MLCommons 과학 클라우드 마스킹 벤치마크에 대한 코드 개선 및 NYU Greene에서의 평가 보고
MLCommons 팀에 진행 상황을 알리고 코드 제출을 제안
통계
MLCommons은 여러 과학 분야의 과학 벤치마크를 감독
클라우드 마스킹 벤치마크에는 180GB의 위성 이미지 데이터 포함
U-Net 모델을 사용하여 200회 에폭으로 훈련
5회 실험 결과 평균 정확도는 0.889
인용구
"MLCommons는 과학 AI 벤치마킹을 촉진하기 위한 공동 노력"
"베이지안 방법은 각 픽셀의 맑은 하늘 확률을 추론하여 임의 정보와 관측에 기초"
"U-Net 아키텍처를 사용하여 이미지 분할에 대한 레이블 출력"