[서평] 캐글 메달리스트가 알려주는 캐글 노하우

반응형

1. 소개

7월에 길벗 출판사에서 캐글 관련 도서가 출판되었습니다. 예전에 출판된 길벗의 <쉽게 시작하는 캐글 데이터 분석>을 소장하고 있는데, 그 책의 다음 레벨이라고 보면 됩니다. <쉽게 시작하는 캐글 데이터 분석>의 타겟은 데이터 분석 초심자, 캐글 완전 처음이라면 <캐글 메달리스트가 알려주는 캐글 노하우>는 데이터 분석 경험자(정형, 비정형 모두), 캐글 경험자(들어보긴 한 수준 이상)인 느낌입니다. 데이터 분석 초심자시라면 <쉽게 시작하는 캐글 데이터 분석>를 먼저 읽고 <캐글 메달리스트가 알려주는 캐글 노하우>를 읽으시면 효과적이리라 생각합니다.

 

<쉽게 시작하는 캐글 데이터 분석> : https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=278905337

 

 

<캐글 메달리스트가 알려주는 캐글 노하우> : https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=321117891

 

 

2. 캐글 초심자에게 친절한 내용

데이터 분석에 대한 관심은 커졌지만 캐글에 대한 심리적 장벽은 높습니다. 1장에서 캐글 구조에 대한 자세한 설명과 캐글을 통한 학습 방법, 주의사항을 알려주고 있습니다. 8장에서는 노트북 작성 시에 대한 팁입니다. 캐글을 떠나서 데이터 분석 포트폴리오를 작성할 때에도 도움이 될 것 같습니다. 7장에서 TPU 사용 방법을 알려준 것도 특별하다고 느껴졌네요.

 

이 중에서 저는 1장의 '잘못된 필사'를 다룬 미니 칼럼 내용이 인상적이었습니다. 학창시절이나 ADP를 공부할 때, 지겹도록 캐글필사가 실력에 도움이 된다는 말을 들었습니다. 이에 학창시절 데이터 분석 프로세스를 담은 책을 필사하는 스터디를 참여한 적이 있는데, 결국 흥미가 떨어져 스터디를 포기한적이 있었는데요. '잘못된 필사' 내용을 보고 공감이 많이 되었습니다. 핵심은 1) 얻어가려는 목표 설정, 2) 의심. 캐글이나 데이콘에서 좋은 학습자료가 넘치고 있으니 이러한 전략을 적용해서 공부해봐야겠다고 생각했습니다.

LOL말고 캐글에도 티어가 있습니다. 저자분들은 모두 엑스퍼트 이상!

3. 저자의 빠른 피드백

책을 보면서 실습하던 중, 내용에 대해 궁금한 점이 있어 저자분에게 연락을 드렸습니다. 저자분들이 모두 현업자이시기 때문에 시간을 가지고 느긋하게 기다리자고 생각했습니다. 그런데 답장을 정말 빠르고 자세히 해주시더라구요. 저자분들께서 작성한 내용에 대해 애정과 전문성을 가지고 있음이 느껴졌습니다.

피드백 내용 : https://www.kaggle.com/competitions/original-instant-gratification/discussion/427130#2388172

 

 

4. 캐글 전문가들의 팁

성능을 높이고 문제를 해결하기 위한 전문가들의 팁이 쏟아졌습니다. 팁들과 함께 문제를 해결하기 위한 접근방법을 목표로 필사를 하다보면 얻는게 굉장히 많으리라 생각합니다. 책에는 지면 상 생략된 코드와 내용이 일부 존재하는데, 그런 부분의 코드를 직접 작성해보면 저자분들이 어떤 마음으로 이러한 솔루션에 도달하게 되었는지 공감하게 되는 효과도 있었습니다.

 

EDA를 통한 피쳐엔지니어링 전략부터 모델 구성 전략까지의 도식도를 제시하여 한 눈에 노트북 구조를 파악할 수 있도록 구성되어 있습니다.



 

또한 정형 데이터 뿐만 아니라 이미지, 텍스트까지 다루고 있습니다. 독자가 필요한 부분을 취사선택해서 읽어도 무방하겠으나, 데이터 형태가 다를 지라도 문제를 해결하는 방식이나 피쳐 엔지니어링 파트에서 배울 점이 있기 때문에 완독하시는걸 권해드립니다.

간단한 아이디어일 수 있으나, 성능이 향상되었던 다양한 팁들이 공유됩니다. 위 사례에서는 색 전환을 통해&nbsp;MNIST처럼 흑백배경으로 만들어 주었습니다.

 

이 책은 '한 번 읽고 책장에 넣어두기에는 아까운 책'이었습니다. 데이터 과학과 캐글을 공부하면서 저자분들의 팁을 체화하고, 캐글과 데이콘의 우수한 솔루션을 습득하기 위한 길잡이로서 활용할 생각입니다.

 

 

[출판사로부터 책을 제공받고 쓰여진 서평입니다.]