[리뷰★] 그림으로 배우는 StatQuest 머신러닝 강의



제이펍 출판사의 "그림으로 배우는 StatQuest 머신러닝 강의(조시 스타머 저/김태헌 역)"를 읽고 작성한 리뷰입니다.

표지


AI에서 가장 자주 활용되는 핵심 기술을 그림으로 이해할 수 있도록 구성된 책으로 내가 아는 한 AI에 활용되는 복잡한 개념들을 일상의 언어와 예제만으로 가장 쉽게 전달하는 책이라 생각한다.

이 책은 “The StatQuest Illustrated Guide To Machine Learning”라는 제목으로 이미 머신러닝 커뮤니티에서 화제를 끌었던 책이다. 비록 원서를 아직 접하지는 못했지만 워낙 그 인기가 대단하였기에 기회가 된다면 꼭 읽고 싶었던 책이었는데 이렇게 번역본으로 책을 접할 수 있어 다행이다.

이 책은 통계 분야에서는 확률분포, 베이즈, 회귀, p-value 등의 개념 그리고 머신러닝 분야에서는 신경망, SVM 등의 기초 개념들을 다루지만 무엇하나 등한시 할 수 없는 AI분야에서 가장 흔하게 활용되는 Core를 다루고 있다.

더불어 그림의 비중이 많은 다른 책들이 트리나 선형회귀 수준의 설명에 그치고 있는데 반해 이 책은 그보다 심화된 과정인 SVM과 신경망의 핵심 원리인 경사하강법이나 오차역전파법에 이르는 한 차원 뛰어넘은 고급 개념도 다룬다.

고작 300페이지 정도의 그림 책으로 이런 고급 지식들을 다룬다는 것은 저자의 자신감의 방증이기도 하다.

실력과 전달력이 항상 비례하는 것은 아니기에 이 짧은 분량으로 통계와 머신러닝에서 활용되는 주요 개념을 글자나 수식이 가득한 책보다 가독성과 전달력에 우위를 둘 수 있다는 것은 어느 저자도 쉽게 도전할 수 없을 것이다.

이 책이 얼마나 어이없는 책인지 또 얼마나 위대한 책인지 한장으로 요약하자면 이 책에 등장한 악보 한페이지를 예로 들 수 있겠다. 악보

민감도, 특이도, 정밀도, 재현율의 개념을 녹인 노래인데 친절하게도 QR코드도 수록되어있어 노래도 직접 들어볼 수 있다. 이름만큼이나 혼동스러운 이 혼동행렬의 개념을 나름 중독성있게 부르다 보면 의외로 혼동행렬을 다룰때 사고가 확장되는 느낌 그리고 이해의 폭이 넓어지는 경험이 가능하다.

그렇기 때문에 이 책은 AI분야 종사자라면 누구나 한 번 쯤 접했으면 하는 책이다.

이 책을 읽는 독자의 수준은 제각각이겠지만 다양한 위치에서 다양한 형태로 이 책은 분명 도움을 줄 수 있을거라 생각한다. AI분야에 문외한인 생초보들에게는 앞으로의 항해에 튼튼한 선박과 정확한 나침반을 준비할 기회를 얻을 수 있을 것이다.

AI의 입문자에게는 수식과 글자가 가득한 책으로도 한 단계 나아가 개념을 이해하고자 코딩 및 실험을 했음에도 여전히 개념이 이해되지 않는 내용이 이해되는 놀라운 경험을 할 것이다.

AI의 고수들도 다 자신만의 전문 영역은 세분화되기에 모든 개념을 확실히 알고 있다 장담하긴 어렵다. 설사 이 책이 전달하는 내용을 모두 다 알고 있는 고수들도 있겠지만 대부분 리더의 위치에 있을 가능성이 크기에 의사소통에 있어 곤욕을 치를 가능성이 크다.

자신이 알고 있는 것들을 모르는 이들에게 전달하는데 있어 발생하는 소음과 잡음을 해소하는데 그들을 이해시키는데 이 책은 큰 도움이 될 것이라 생각한다.

비록 AI 기술에 전문적인 학습을 원하지 않는 CEO나 기획자들도 이 책 정도의 개념만 익히고 있으면 보다 로우 레벨 의사소통에 진입하기 쉬워질 것이다.

AI와 전혀 무관한 일반인들도 요즘 핫한 AI 기술이 어떤 원리로 돌아가고 있는지 앞으로 AI를 활용하여 어떤 비즈니스 성과를 달성할지 이해하는데에도 큰 도움이 될 것이다. 허무맹랑한 상상을 펴는 것 보다는 현재 AI 기술이 어떤 원리에 근간을 두는지 파악함으로써 현실적으로 AI를 스스로를 위해 더욱 잘 활용할 수 있을 것이다.

AI와 무관한 진로나 꿈을 가진 학생들도 마찬가지이다. 자신들이 가진 학교에서 배운 것들을 무기삼아 어떻게 수익 혹은 진로에 적용할 수 있는지 고민하는데 이 책은 꽤 신선한 창의성을 불어 넣을 수 있을 것이다. 마치 책 말미에 수록된 미분의 연쇄과정을 잘 이해하여 AI의 오차역전파를 만드는 일과 같은 업적을 이룰 수 있을지도 모른다.

책의 한 장 한 장이 전부 주옥같지만 모두 다 소개할 순 없어 읽으면서 특히 느낌표가 많이 찍혔던 개념 몇가지만 소개해보고자 한다.

AI의 학습이라는 용어를 가장 잘 표현한 그림이다. 아래 그림에서 초록색 선은 머신러닝이 학습한 규칙이다. 파란색 새로운 점이 들어왔을 때 이를 얼마나 잘 예측하는지는 실제값과의 차이를 통해서 파악할 수 있다. 학습

초록색은 이른바 과적합이 된 상황으로 너무 학습데이터에 적합하게 모델을 생성한 나머지 새로운 데이터에 대한 성능의 정확성이 떨어지는 상태이다. 11번 그림처럼 오차를 모두 합하여 전체오차가 적은 모델이 좋은 모델로 평가할 수 있음을 알 수 있다. 즉, 검은색 직선이 보다 성능이 우수하다.

이를 바탕으로 교차검증을 쉽게 이해할 수 있다. 학습 데이터의 일부를 테스트 데이터로 활용함으로써 오차가 최소화하는 과정을 선택하는 방법을 단순히 그림 몇장으로 쉽게 이해할 수 있다. 교차검증

그동안 관련 개념은 수없이 많이 읽어왔지만 머릿속에 남은 핵심 개념은 이 책의 그림 몇장과 일치한다. 아직 학습, 과적합, 교차검증에 약간 혼선이 있는 입문자라면 이 책을 통해 확실히 이해할 수 있음에 놀랄 것이다.

또, 아무리 어려운 지식일지라도 이를 모두 이해한 고수의 머릿속에는 핵심 개념 몇가지만 자리잡고 있다. 모든 것을 이해할 수 있는 핵심 열쇠 개념이나 그림은 전체지식의 극히 일부인데 이 책은 그 극히 일부인 엑기스를 잘 담아내고 있는 책이라 볼 수 있다.

통계에서 다루는 기본 개념들도 마찬가지다. 확률분포를 저마다의 통계서적마다 주저리 주저리 정의하고 있지만 한번에 이해시켜주는 책은 아직 본 적이 없다. 정의는 대충 그런가보다 하고 넘어간 뒤 수많은 실험과 프로그래밍을 통해 아 결국 이거 하나 알려고 배운거구나라는 생각을 하게 되는데 그 이거 하나가 바로 아래 그림이다.

확률분포

결국은 확률 분포를 이용하여 이 히스토그램에서 측정값이 하나도 없음에도 대략 파란색 선에 위치하겠구나 정도를 파악하기 위함이다.

이를 분포 중 가장 기초 개념인 이항분포로 예를 들고 있는데 이 역시 수식이 가지는 기호 하나하나가 무엇인지 자세히 설명하고 직접 숫자까지 대입해본다면 그리 어렵지 않음을 알게 될 것이다. 고수 한 명이 알때까지 하나하나 작은 기호 하나 놓치지 않고 설명한다면 무엇이 크게 어려울까? 이항분포
이항분포예제

이렇게 이해하고 나면 나중에 N명 중 2명이 호박파이를 좋아할 확률이 궁금한 상황이 온다면 자연스레 이항분포가 떠오를 것이다.

P-value를 다룬 페이지 또한 마찬가지인데 이제껏 P-value를 이렇게 쉽게 설명한 이는 본 적이 없다. 고수님들 중에서도 P-value에 대한 설명을 부탁하면 잠시나마 난색을 표한다. 그나마 잘 설명을 해도 좋은 예제 하나가 있어야 한다. P-value

이 책은 부록의 질도 결코 무시할 수 없다. 부록 말미에는 미분이 등장한다. 수학 교과서도 이렇게 만든다면 이해 못하는 학생이 2배 이상은 줄어들지 않을까? 미분

미분은 결국 순간 변화율이다. x가 N만큼 변화할 때 y는 얼마만큼 변할지, 또 그 비율은 어떨지를 분석하기 위한 기법이다. 이 미분에는 연쇄법칙이 존재하는데 이를 활용하면 학습 결과의 수치를 자동으로 보정하는 오차역전파법에 적용할 수 있다. 연쇄법칙

수학 배워서 거스름돈 거스를 때나 쓰지 언제쓰냐고 비방할 것이 아니라 이 책의 이런 좋은 개념들을 바탕으로 진정 어디에 쓸지 고민해볼 수 있다면 세상에 등장하지 않았던 가치있고 두근거리는 일에 스스로의 에너지를 쏟으며 보람을 느껴볼 수 있지 않을까?







© 2019.04. by theorydb

Powered by theorydb