[09] KT AIVLE 3기 ai트랙 - 에이블스쿨 6주차 02

반응형

1. 이번 주의 구성 (3.9 ~ 10.)

이번에는 머신러닝 책에서는 잘 다뤄지지는 않는 '모델 해석과 비즈니스 인사이트 제시' 주제였다. 공모전이나 데분 프로젝트를 생각해보면 '결국 이 모델이 뭘 설명하는건데?' 를 높으신 분들에게 설명해야 하는 니즈가 생기는데, 이를 해결할 수 있는 수업이었다.

 

2. Permutation Importance

이 녀석은 ADP를 준비하면서 처음 알게 된 지표인데, 에이블스쿨에서 다시 마주했다. 특정 피쳐에 대하여 여러번 섞고 나온 스코어의 평균을 계산한다는 발상인데, sklearn의 지도학습 모델에 모두 적용할 수 있다는 장점이 있었다. ADP 기출 문제 중에 SVM 모델의 변수 중요도를 제시하라고 해서 수험생들이 멘붕이었던 적이 있었다고 한다. 물론 linear svm을 이용하면 변수중요도를 뽑아낼 수도 있지만, Permutation importance를 알아뒀다면 이걸로도 풀 수 있었을 것 같다.

 

3. Shap Value

2차 미프땐가? 어느 조에서 이 지표를 사용해서 발표를 해서 '나중에 공부해야겠다' 체크해놓고 있었는데 강사님이 다뤄주셨다. 

 

배우면서 위의 Permutation Importance와 다르게 시각화가 예쁘게 가능해서 PPT에 써먹을 수 있을 것 같다는 생각을 했다. 수학적으로 어떤 게 더 엄밀한 측정방법인지는 모르겠지만 경영진에게 설명하기 위해서는 시각화가 가능한 shap value가 더 나을 것 같다는 생각을 했다.

 

 

4. 비즈니스 활용

이 부분은 정말 생각해본 적도 없고 배운적도 없는 파트였다. 위의 변수 중요도들은 트리계열 모델이 변수중요도를 제공하다보니 아예 새로운 개념은 아니었는데, 모델링을 비즈니스에서 어떻게 활용할지 고민해보는 수업은 처음이었다. 지금까지 에이블스쿨에서 인상적으로 배웠던 걸 적어보라면 해당 파트를 가장 위에 적을 것 같다.

 

모델 예측 결과 (모델링팀) & 비즈니스 가치 (도메인 현업자) 와 협력하여 모델의 기대가치를 계산한다는 발상이 어려운 것은 아닌데 학교 수업에서는 들어볼 일이 없었다. 학교 수업에서는 모델링의 수학적인 이론을 다루거나, 모델링 실습뿐이었는데 말이다. 에이블스쿨이 좋은점을 뽑으라면 계속 산업 현장과 어떻게든 연결시켜서 교육시키려는 것이 느껴진달까? 오늘 수업을 들으면서 다시 절감했다.