[리뷰] 2022 데이터에듀 빅데이터 분석기사 필기
in Review on Review, Book, 빅데이터분석기사, 데이터에듀, 필기, 기출, 수험서, Dl, Ml, 통계, 데이터, 탐색, Eda, 정제, 알고리즘
데이터에듀
출판사의"2022 데이터에듀 빅데이터 분석기사 필기(윤종식, 최유정, 한정희 저)"
를 읽고 작성한 리뷰입니다.
빅데이터분석기사 필기 대비 수험서로 973개 문제를 통한 합격 적합성을 높일 수 있음은 물론 ADP와의 연계 학습이 가능한 현 시점
가장 추천하고 싶은
교재 중 하나다.
그동안 10권 정도의 빅데이터분석기사 필기 도서를 읽고 블로그에 리뷰를 올렸다. 반가운 것은 세월이 흐르면서 점점 좋은 도서들이 나오기 시작했다는 것이다. 수험생 입장에서는 반가운 일이다.
결론부터 말하자면 현 시점 가장 추천하고 싶은 교재는 2개의 출판사인데 그 중 하나가 바로 본 도서이다.
시대고시 수험서의 엄청난 양의 문제, 이기적 수험서의 통계 기법 파트의 다양한 계산과 예제, 이지패스 수험서의 깔끔한 도식화와 가독성 높은 해설, 배움 출판사의 깔끔한 정리, 와이즈인컴퍼니의 실기와의 연계성, 예문사의 꼼꼼한 정리 및 뛰어난 기출 복원력 등 각 수험서의 장점
이 모두 녹아있는 책이다.
ADP 시험을 준비하진 않았지만 예전부터 주위에서 ADP 도서로 가장 유명한 출판사라는 말을 듣긴 했는데 역시 ADP 수험서를 만들며 다져진 탄탄한 내공이 본 수험서에도 녹아있는 느낌이 들었다.
ADP 수험서를 한 번 겨쳐서인지 문제의 양
이 상당하다. 게다가 문제의 질
도 뛰어나다. 긴 세월 가다듬어진 탄탄한 문제은행에서 뽑아낸 우수한 문제에 빅데이터분석기사의 경향을 잘 입힌 느낌이다.
가장 뛰어난 장점은 역시 문제의 양과 질이다. 책 겉표지에 소개되기론 972문제
가 수록되어 있다고 한다. 가히 문제만 잘 풀어도 수험 적합성을 쉽게 올릴 수 있을 것 같다.
특히 기출문제의 복원력
에는 감탄을 금치 못했다. 거의 완벽하다. 2회 필기시험을 합격하고 시간이 꽤 지났음에도 거의 모든 내용이 떠오를 정도로 익숙한 문제가 많다. 그동안 읽은 10권의 빅분기 수험서 중 가장 높은 복원력이라 확신한다.
특히 아래 문제는 어떻게 복원한건지 정말 의문이다.
이미 문제를 풀어본 입장에서 추천하고 싶은 학습법으로 문제를 먼저 풀어보라고 권하고 싶다. 이어서 문제를 먼저 풀고 해설을 읽고 그래도 이해가 안가면 이론 부분을 읽고 이론 부분도 다 읽었으면 책에 등장하는 R코드로 실습을 해본다거나 부록으로 제공되는 실습코드로 실제 눈으로 개념을 확인할 수 있다면 이보다 좋은 학습법도 없겠다라는 생각이 들었다.
합격한 이후로는 최근 경향은 잘 모르겠지만 빅데이터 관련 언어로 주로 Python과 R이 사용되기에 빅분기 시험에서 특정 언어를 선호하는 문제는 나오지 않는 것으로 알고 있다.
그럼에도 아래 그림과 같이 R언어와 관련된 내용이 수록되곤 한다.
R이 최소로 수록되어 있어 시험에 적합하게 구성되어 있으면서도 R이 가지는 장점을 십분 활용
하여 개념을 빠르게 이해할 수록 도와주는 것이 장점이다. 이는 추후 실기에도 많은 도움이 될 것 같다는 생각이 들었고 나아가 실무에서 꽤 도움이 되는 내용도 많다. Reshape만큼 초보 실무 시절 햇갈리는 개념도 흔치 않기 때문이다.
또 경향
을 반영한 구성도 마음에 들었다. 예를 들면 1과목 3장 데이터 수집 및 저장 계획 파트의 경우 문제가 별로 출제되지 않는다. 이 시험 성격이 통계기사에 가깝지 빅데이터랑은 거리가 좀 멀다.
게다가 하둡 등의 제품군이 소개되곤 하는데 1년만 지나도 제품이 우르르 쏟아지는 현 상황에서 제품과 관련된 문제를 출제하기도 쉽지 않은 일이다. 문제 출제 가능성이 낮아 보인다. 그래서인지 이 책도 설명을 최소화하고 있는데 경향에 입각한 구성이 마음에 들었다.
그 외에도 저자들의 내공
이 든든한 부분이 많다. 축적된 실무와 경험이 어느정도인지 가늠할 만한 뛰어난 수준을 자랑하는 설명이 자주 등장한다. 예를 들면 아래 계층적 군집분석에 관한 내용은 실제자료와 시각화를 통해 확실한 이해를 돕는데 이런 구성은 다른 서적에서는 보기 힘든 부분이다.
다항 분포에 관한 설명 역시 시각화 설명이 마음에 든다. 이어 관련된 예제도 등장한다. 확률분포만큼 이 수험서에서 까다로운 내용도 많지 않은데 이런 고난이도 부분을 확실하게 이해하고 넘어갈 수 있도록 정면돌파한 구성에서 저자들의 진정성이 느껴졌다.
그 외 시각적으로 이해를 돕는 도식이나 깔끔한 정리
도 마음에 들었다.
너무 칭찬 일색이었으니 반대로 아쉬운 부분도 몇가지 언급하려 한다.
첫번째는 딥러닝 파트의 설명이 약간 부족하다. 특히 CNN 모델의 Feature Map 크기에 대한 공식은 패딩이나 입력 크기를 정확히 반영하고 있지 않은 채 축약된 공식만 등장하여 난이도 있는 문제에 적합하지 않다고 생각했다.
두번째는 시각화 부분이다. 이건 다른 수험서 모두 공통적으로 개선이 되지 않는 부분인데 중복된 유형의 시각화 도구에 대한 깔끔한 설명이 부족하다는 점이다.
예를 들면 히트맵의 경우 주로 비교 시각화 유형으로 분류되지만 특정한 경우 관계 시각화 유형으로 분류될 수 있고, 버블차트는 관계 시각화로 주로 사용되지만 공간 시각화로도 활용되기도 한다.
하지만 모든 수험서들은 관계 시각화 유형을 먼저 소개한 후 버블차트나 히트맵을 소개하는 형식이다. 반대로 히트맵 그림이 등장한 후 어떤 유형인지 고르라는 문제가 출제될 경우 한가지 유형만 알고 있는 수험생 입장에선 당황할 수 밖에 없다.
이 정도의 단점은 앞서 언급한 장점에 비하면 극히 미약한 것들인지라 무시할 정도의 아쉬움이다.
한편 이 책은 구성과 서비스
도 알차다. 의외로 수험서 첫장에 시험에 대한 소개가 등장하지 않는 수험서들이 많아 황당했던 적이 있는데 이런 디테일한 부분도 수험생을 잘 고려하고 있다.
뿐만 아니라 동영상 풀이 영상이 무료로 제공된다는 점이 또 다른 장점이다. 어떤 수험서는 유료로 동영상을 제공했는데 수험생들이 동영상 품질이 너무 좋지 않다고 투덜거리는 게시글도 자주 보았는데 이 책의 동영상은 무료인데다 들어보니 내용도 상당히 괜찮았다.
또 유튜브나 카톡 채널로 수험생과의 상담이 이뤄진다는 점이나 R 무료 실습 코드가 제공된다는 점은 확실히 ADP 시절부터 다져진 내공의 축적력을 보여주는 흔적이라는 생각이 들었다.
아무튼 본 도서로 빅분기 시험을 준비한다면 후회없는 선택이 될 것이라는 생각이 들어 추천하며 리뷰를 마친다.