반응형

캐글 노트북 필사 첫번째 대회는 Cassava Leaf Disease Classification입니다. 이 대회의 목적은 아프리카에서 두 번째로 큰 탄수화물 카사바에 발생하는 질병을 식별하여, 감염된 식물을 태워 확산을 방지하고, 식량 공급에 문제를 해결하기 위함입니다. Image competition이며, 이번 대회에서 가장 많은 vote를 받은 Notebook부터 필사 하도록 하겠습니다. 

 

필사커널링크 : www.kaggle.com/ihelon/cassava-leaf-disease-exploratory-data-analysis

 

Cassava Leaf Disease - Exploratory Data Analysis

Explore and run machine learning code with Kaggle Notebooks | Using data from Cassava Leaf Disease Classification

www.kaggle.com

 

4개의 질병과 1개의 정상 labels 총 5개의 labels가 존재합니다.

 

 

이미지의 갯수는 21,397, 픽셀 사이즈는 600 x 800

 

각 class의 비율을 그림을 통해 보여줍니다.

 

랜덤 샘플을 통한 시각화

 

클래스 별 시각화
albumentations image agumentation 1
albumentations image agumentation 2

 

augmentation 1,2 compose를 통해 동시적용

 

이번 대회의 평가지표는 AUC, 따라서 이러한 불균형 클래스를 가질경우 높은 빈도(3)로 예측하여도 약 60%의 AUC를 얻을 수 있습니다.

반응형

'competition' 카테고리의 다른 글

DACON - 전력사용량 예측 AI 경진대회(8th)  (0) 2021.07.10
DACON - 천체 유형 분류대회 후기(3th)  (0) 2020.05.02
14th solution - 9%  (0) 2019.11.07
Pseudo Labelling  (0) 2019.11.06
Compare optimizer of efficientNet  (2) 2019.11.06

+ Recent posts