[리뷰] 빅데이터분석기사 필기(이패스코리아)



이패스코리아 출판사의 "빅데이터분석기사 필기(김계철 저)"를 읽고 작성한 리뷰입니다.

표지


빅데이터분석기사 필기 대비 수험서로 현존하는 수험서들의 장점이 모두 결합된 가장 추천하고 싶은 교재이다.

그동안 빅데이터분석기사 필기 도서를 꽤 여러권 읽고 블로그에도 10권에 가까운 리뷰를 올린 것 같다.

국내 자타공인 전문가들의 지식이 충돌되는 지점을 어떻게 저자마다 다르게 바라보는지에 주안점을 두다보면 같은 용어, 같은 해설일지라도 보다 정확한 이해가 가능하기에 빅데이터분석기사 리뷰는 언제나 적극적으로 매달리는 편이다.

결론적으로 본 도서를 평하라면 현존하는 가장 완벽한 도서라 평하고 싶다. 이기적 수험서의 통계 기법 파트의 다양한 계산과 예제, 이지패스 수험서의 깔끔한 도식화와 가독성 높은 해설, 배움 출판사의 깔끔한 정리, 와이즈인컴퍼니의 실기와의 연계성, 예문사의 꼼꼼한 정리 및 뛰어난 기출 복원력 등 각 수험서의 장점이 모두 녹아있는 책이다.

또 저자가 황소걸음 ADP 시리즈의 저자라 소개되고 있는데 ADP 수험서로 황소걸음 시리즈가 좋다는 평을 많이 들었다. 비록 직접 책을 읽어본 것은 아니기에 함부로 평할 수는 없지만 적어도 ADP 수험서의 저자인만큼 보다 적중률 높고 정제된 이론 및 문제가 등장할 거라는 기대감도 든다.

장점이 너무 많아 정리하기 어려워 그림을 위주로 몇가지 장점을 짧게 소개해보고자 한다.

먼저 도식화가 잘되어있어 가독성과 암기에 도움이 된다. 아래 그림은 다양성, 익명성, 근접성 등 데이터 3법 중 일부 내용인데 이 부분은 서술형 글보다는 그림으로 보여주는 것이 직관적으로 이해할 수 있어 도움이 된다. 도식화

군집분석 파트의 도식화도 마찬가지이다. 거의 모든 군집간 척도 법이 잘 정리된 것은 물론 계층화하여 입체적으로 배치함으로써 깔끔한 정리가 가능하다. 지금까지 내가 읽은 수험서 중 가장 자세하게 잘 정리되어 있다. 도식화2

이처럼 독자가 그림으로 접해야 할지, 기출로 접해야 할지, 서술형 글로 접해야 이해에 도움이 될지 고민한 흔적이 보인다.

이어서 개인적으로 가장 관심 많은 통계 기법에 관한 풍부한 예제와 상세한 계산법이 자주 등장하는 것도 마음에 든다. 계산문제

2과목 끝 부분에 해당하는 통계 기법은 문제 재활용이 얼마든지 가능하며 마음먹기에 따라 변별력 조절하기에 가장 좋은 파트라 생각한다. 아마 기출이 많이 쌓이게 되는 시점에 이 부분과 딥러닝 파트로 변별력을 조절해 나가지 않을까 싶다.

다른 수험서들을 보면 이 부분을 대충 설명하고 넘어가는 경우가 많았는데 그간 이기적 수험서 시리즈에서 이 부분을 상세하게 잡아주고 있어 마음에 들었다. 이 수험서도 마찬가지로 이기적 못지 않게 다양한 계산 문제에 적응할 수 있게 구성되어 있어 이 부분에서도 높은 점수를 주고 싶다.

딥러닝과 관련된 영역의 꼼꼼함도 마음에 드는 부분 중 하나이다. 딥러닝을 처음 접할 때 코세라 앤드류 응 교수님이 Deep Learning Specialization 강의에서 CNN 모델의 Feature Map 크기를 계산하는 부분을 깔끔하게 정리해주는 것을 보고 감탄했던 기억이 난다. 딥러닝

빅데이터 분석기사라 하면 딥러닝과 통계 그리고 엔지니어링 고루 출제가 되어야 공평하다고 생각되는데 솔직히 통계 기사 시험이라는 생각이 들었고 출제 위원들의 전문성에 의심이 간 적이 한 두번이 아니다.

어쨌든 출제 수준이 차차 발전되길 바라는 바 본 수험서는 미래에 발전할 출제 경향에도 잘 대응할 수 있게 구성된 책이라는 점이 인상적이었다.

마지막으로 이 책의 가장 큰 장점은 기출 문제의 복원력 그리고 기출 문제가 동떨어 진 것이 아닌 이론 설명에 포함되어 있다는 점을 최고의 장점으로 꼽고 싶다. 기출

기출의 복원력이야 그렇다치고 기출 문제가 내용에 포함된 것이 왜 장점이냐고 물을 수 있겠다. 위 그림과 같이 이론이 서술된 부분마다 기출 문제가 등장한다.

이것은 두가지로 해석할 수 있다. 하나는 위 그림과 같이 정밀도 설명 파트에서 기출이 엄청나게 출제되고 있으니 이 부분은 확실히 암기해야겠다 혹은 어떤 파트는 기출이 하나도 등장하지 않았으니 앞으로 출제될 가능성이 높겠구나 등 다양한 차원의 전략을 구사할 수 있는 셈이다.

이런 방식의 구성은 적어도 지금까지 본 수험서에서는 찾을 수 없는 구성이기도 하다. 개인적으로 가장 인상적이었던 부분이다.

그 외에도 p-value, 귀무가설에 대한 설명이나 로지스틱 회귀 등 늘 즐겨보고 대표적으로 수험서를 검증하는 부분인 가설검정 및 모델링 파트도 설명의 오류에 문제가 없었을 뿐더러 가독성이 좋았다.

예상문제의 질이 매우 좋은 것도 특징이다. 어떤 책은 그저 암기식 문제로 도배되거나 성의없이 계산 문제 하나 없는 경우 또는 경향에서 완전히 벗어난 R언어의 결과물 등이 등장되어 어이가 없었는데 이 책의 예제들은 정성들여 만들어져 있다.

책을 읽으며 오탈자를 거의 발견하지 못했으며 직접 수강한 적은 없지만 동영상 강의도 제공된다고 하니 연계 학습도 가능할 것 같다. 책의 질을 보니 강의도 기대가 된다.

너무 칭찬 일색인 것이 무안하여 한가지 단점을 꼽으라면 시각화파트의 정리 정도를 들 수 있겠다. 예를 들면 히트맵의 경우 주로 비교 시각화 유형으로 분류되지만 특정한 경우 관계 시각화 유형으로 분류될 수 있고, 버블차트는 관계 시각화로 주로 사용되지만 공간 시각화로도 활용되기도 한다.

왜 모든 수험서들이 관계 시각화 유형을 먼저 소개한 후 버블차트나 히트맵을 소개하는지 의문이다. 거꾸로 산점도가 어떤 유형인지 접근해야 실전 문제에서 실수하는 일이 생기지 않을것이다.

하지만 이 부분은 앞서 소개된 장점들에 비해 극히 미약한 부분이니 무시해도 좋을 수준이다.

아무튼 앞서 언급한 바와 같이 이 책은 현존하는 수험서 중 가장 추천하고 싶은 수험서이다. 2회를 합격한 독자로써 수험생들을 위해 양질의 수험서를 집필한 저자님께 감사의 말씀을 드리고 싶다.

각각 저자님들의 강의 관점을 종합적으로 살피고 어려운 개념을 정리해보고 싶어 빅데이터분석기사 수험서가 등장하면 늘 서평단에 지원하고 있다. 비록 서적을 제공받은 서평이지만 편파적이지 않도록 철저하게 수험생 입장에서 분석했음을 밝히는 바이다.

YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.






© 2019.04. by theorydb

Powered by theorydb