[리뷰] 2022 이기적 빅데이터분석기사 필기 기본서
in Review on Review, Book, 빅데이터분석기사, 이기적, 2022, 필기, 수험서, Dl, Ml, 통계, 분석
영진닷컴
출판사의"2022 이기적 빅데이터분석기사 필기 기본서(나홍석, 배원성, 이건길, 이혜영, 고려사이버대학교 AI·빅데이터 연구소 저)"
를 읽고 작성한 리뷰입니다.
시험도 합격하였고, 이전판 2021 이기적 빅데이터분석기사 필기 기본서도 학습했기에 책을 조금 더 객관적인 시각에서 리뷰해 볼 수 있다는 생각이 들어 금번 2022 개정판의 서평단으로 지원하게 되었다.
이제 빅데이터 분석기사 책도 시중에 많이 등장했다. 내가 알기로만 7종인데 대부분 비슷한 주제와 범위를 다루고 있음에도 디테일하게 다루는 내용들에는 약간 차이가 있으며 특히 관점이나 서술방식에 차이가 있어 비교하며 읽다보면 기본적인 내용임에도 색다르게 읽히는 재미가 있어 빅데이터 분석기사 서적을 여러권 읽고 있다.
금번 도서는 2021 버전의 개정판으로 2021 버전에 비해 많은 부분이 보강되었다. 페이지 수만 봐도 100 페이지 이상 늘어나 제법 두꺼워졌다. 기본 뼈대는 2021 버전의 장점을 잘 가져왔고 그 외에 뒤에서 소개할 업그레이드 된 내용들이 있다.
2021 대비 어떤점이 개선되었는지에 초점을 맞춰 리뷰를 작성해보려한다. 먼저 2021 버전의 장점이자 이번판에도 고스란히 계승된
뼈대 장점들을 아래와 같이 정리해 본다.
2과목 통계 계산 파트에 대비하기 쉬운 꼼꼼한
예제
암기식 위주의 학습을 필요로하는 파트 1, 4에 비해 파트 2, 3은 난이도에 따라 충분히 어려운 계산 문제가 등장할 수 있는 파트이다.최초로 시행된 2회차 시험에서도 대부분의 예상을 깨고 파트2의 통계 계산 문제가 생각보다 어렵게 출제되어 확실한 통계 개념을 잡고 있지 않은 수험생들이 카페 게시판에 어려움을 토했던 기억이 난다.
이번 3회차가 어떻게 출제될지는 모르겠지만 앞으로 시간이 지날수록 파트2의 통계 계산문제로 회차별 난이도 조정이 이뤄질것 같다는 생각이 든다. 암기식은 새로운 지식이 등장하지 않는 이상 해마다 수험서의 내용이 업그레이드되면서 변별력을 가지기 힘들 것이기 때문이다.
반면 파트 2의 계산 문제는 기본형 문제에서 숫자나 데이터 혹은 약간의 전제조건만 바꿔도 문제의 품질을 보존하면서도(수험생들의 이의 제기에서 안전하다는 의미) 수준있는 문제를 출제할 수 있기 때문이다.
예를 들어 이번 2회차 때 이 책의 문제와 거의 유사한 문제가 기출로 나왔다. t-검정으로 기억나는 단측검정 문제가 나왔는데 양측 검정으로 혼동하여 문제를 푼 수험생도 있을 거라 생각한다.
이처럼 검정과 같은 통계문제를 바탕으로 데이터 혹은 검정 방식 등의 옵션을 조정하면
난이도로 변별력
을 만들기 좋은 파트라는 생각에 난 앞으로 파트2 과목이 가장 중요하다는 생각이 든다.구구 절절하게 2과목을 길게 설명한 이유는 이 책에 소개되는 2과목 파트가 꼼꼼하게 정리되어 있음은 물론 각 개념별
대표성을 띄는 예제
가 상세하고 풍부하다는 장점이 있기 때문이다.통계학과 전공이 아닌 이상 다른 수험서는 2과목에 해당하는 계산 문제가 나왔을 때 대응하기 약간 부족한 부분이 있을거라 생각한다. 반면 이 책이라면
2과목의 통계 계산 유형이 어떻게 출제되더라도
상당 부분 방어할 수 있을거라는 생각이 들었고 이 점을 이 책의 가장 큰 장점으로 꼽고 싶다.집필진의 전문성
내 주제에 면면이 훌륭한 분들을 평가한다는 것은 주제넘지만 집필진이 고려사이버대학교 AI, 빅데이터 연구소 소속이라는 네임 밸류에 걸맞는 전문가 분들이라는 점과 책의 가독성이나 전달력 좋다는 평을 내리고 싶다.먼저 계층형으로 복잡한 개념들을 이해하기 쉽게 Top-Down 방식으로 잘 정리하고 있어 지금 학습하는 내용이 전체 구성의
어느 부분에 해당하는지
파악하기가 쉽다.또 앞서 언급했지만 좋은 예제들, 특히
고등학생들의 용돈 수준 조사나 두집단의 사료가 젖소의 우유생산량에 미치는 영향의 차이
와 같은 일상에서 쉽게 이해할 수 있는 예제를 들어 어려운 통계 개념 예제를 만들 수 있다는 것이 전문성을 입증하는 부분이라 생각한다.모의고사 해설 동영상 서비스
내가 아는 7종의 수험서 중무료
동영상 강의가 제공되는 유일한 수험서이다. 영진출판사는 특히 수험생에게 유리한 플랫폼이 기존 부터 존재해 왔기에 이를 활용할 수 있다는 점이 차별화된 점이라 생각한다.핵심만 요약한 분량
2021 버전의 총 분량은약 370p
정도에 지나지 않았다. 최단 시간 내 가장 적은 시간과 노력으로 합격을 계획했던 깔끔한 요약 형태가 개인적으로 마음에 들었는데 이는 개인의 지식 정도와 선호에 따라 호불호가 갈릴만한 부분인 듯 하다.
위의 장점은 이번 2022 개정판 버전에도 잘 계승된 장점들이다. 그렇다면 이번 2022 버전은 기존 버전 대비
어떤 점이 좋아진 걸까? 아래와 같이 간단하게 요약해 본다.
- 구성상의 변화
확인 문제
라는 코너가 새로 등장하였다. 각 단원별 연습문제가 등장하는데 그 중에서도 개념을 혼동하기 쉽거나 가장 중요한 개념을 다루거나 계산이 필요한 문제가 확인 문제에 등장한다. 꼭 알아야 하는 필수 문제가 등장하기에 시간이 없는 수험생은 이 코너를 먼저 접근해보는 것도 효율성 측면에서 괜찮겠다는 생각이 든다.모의고사가 기존 1회분에서
3회분
으로 증가했다. 아직 기출이 1회분밖에 존재하지 않는 시험이기에 양질의 문제를 많이 풀어보는 것이 학습 적합성을 높이는데 중요하다 생각한다.기존 2021 버전은 문제량이 적은 것이 좀 마음에 들지 않았는데 이번에 전반적으로 모의고사는 물론 연습문제 등의 문제량이 상당히 늘어 만족스러운 부분이다.
또 각 회차별 문제를 풀어보니 2회차
기출문제
가 상당부분 수록되어 있다는 것을 확인할 수 있었다. 시험장에서 직접 풀었던 문제들이 고루 섞여 있다.동영상 강의 품질 개선
도 마음에 드는 부분이다. 2021 버전의 경우 어떤 동영상은 연습문제의 해설을 그냥 읽다시피 한 동영상도 있어 실망이 컸는데 이번에는 달랐다. 과목별로 접근 전략을 어떻게 취해야 하는지 소개하는 것 부터 종이 책에 수록된 해설이 빈약한 경우 보충 설명을 해주고 있어 상당한 도움이 될 듯 하다.다만, 문제 풀이 강의만 존재하고 이론에 대한 해설 강의가 없다는 점은 여전히 불만이다. 동영상이 아직 계속 업로드되고 있는 중이기에 어디까지 올라올지 모르겠지만 이론에 대한 강의도 올라왔으면 하는 바램이다.
- 내용상의 변화
2021버전의 장점을 계승하여 2, 3과목을 중심으로 한 어려운 통계 계산 파트의
예제가 더욱 업그레이드
되었다. 조금이라도 어려운 개념이라 생각하면 반드시 일상의 쉬운 계산 예제 문제가 하나 꼭 등장한다. 2021 버전에서 굳이 예제를 수록하지 않았던 개념에도 이번에 예제가 새롭게 추가되어 저자의 꼼꼼함과 친절함에 놀랐다.1, 4과목 암기파트의
깔끔한 정리
도 돋보였다. 기존 2021 버전의 분량이 적고 함축이 심한 부분은 장점이자 단점이기도 했는데 이번에 분량이 대폭 늘어났다. 늘어난 분량의 주 요소는 크게 세 부분이 차지한다.첫번째는 앞서 언급했듯 문제의 양이 늘었다는 것이 이유이다.
두번째는 따분한 이론만 등장하는 경우 실무에서 다루는 구체적인 기법이 소개되어
추상적인 개념을 구체적으로
이해할 수 있게 도와준다는 점인데 이로 인해 다소 분량이 늘어난 듯 하다.세번째는
도표나 시각화 자료
를 이용해 깔끔하게 정리된 파트가 늘어났다는 점이다. 이전 버전에서 딱딱하게 줄 글로만 늘어져있어 입체적으로 보이지 않고 가독성이 떨어지거나 지루한 부분이 있었는데 그런 부분들 마다 깔끔하게 정리되어 인상적이었다.이전 버전의 기술적인 부분의
오류가 잘 보완
되었고 혼동을 유발하는 설명들이 깔끔해졌다.예를 들면 Confusion Matrix 같은 경우 크게 예측과 사실로 나뉘는데 기존 버전에서 사실에 해당하는 부분이 결과라고 표현되어 있어 초보자들이 보면 오해하기 쉽겠다는 생각이 들었는데 이번엔 잘 보정이 되었다.
또, 난이도-시급성 사분면 같은 경우도 우선순위에 논란이 될 부분이 있었는데 그 순서도 여타 다른 수험서와 마찬가지로 동일한 내용으로 잘 정리되었다.
더불어 이전 버전에서는 데이터 시각화 유사개념 파트는 솔직히 읽고도 잘 이해가 되지 않았고 내 판단이 맞다면 잘못 설명된 부분들도 더러 있었다. 그런 부분도 이번에는 깔끔하게 새롭게 쓰여져 이해가 잘 되고 인포그래픽, 정보디자인 등 혼동할 수 있는 개념들을 잘 구분하여 정리하였다.
거버넌스, 수준진단, 적정성 평가, 품질 검증, 데이터 처리
등의 파트가 기존 버전에는 누락되어 있었었는데 이 부분이 잘 정리되어 포함되었다. 물론 개인적으로는 출제율이 낮은 파트들이라 생각되어 기존 버전 처럼 과감히 누락시키는 편이 나을거라는 생각이 들긴 하지만, 대부분의 수험생들이 원해서 반영된 사항이 아닐까 한다. 아직 시행 회차가 적은 만큼 나올 가능성이 충분한 부분이기에 이번 버전에서 포함된 것은 바람직한 방향이라고 본다.2회차 시험에서
딥러닝
부분은 출제 비중이 높지 않았다. 하지만 이 시험이 통계 기사시험이 아닌 빅데이터 시험이고 최근 AI 트렌드의 주류를 딥러닝이 차지하고 있기에 점차 출제 비중이 높아질 것으로 생각하는데 그런점이 또 이 책의 장점이다.여타 다른 수험서 대비 딥러닝 파트의 정리가 꽤 깔끔하고 실무에서 활용하는 깊이있는 개념도 잘 정리된 편이다. 특히 이전편에는 딥러닝 학습 단계에 있어 반드시 알아야 할 개념들이 불충분했었는데 이번에는 이터레이션과 같은 필수 개념들이 잘 정리되어 더욱 탄탄한 기본기를 다질 수 있다.
마지막으로 총평을 내리자면 이번 개정판은 구판의 단점이 상당 부분 보완된 완성도 높은 수험서
라는 평을 내리고 싶다. 만약 출제 경향이 2회차와 동일한 기조로 이어진다면 이 책은 합격율을 높이는데 많은 도움이 될 것이다.
특히 향후 난이도 변별력 조정에 활용되기 좋은 과목2의 통계 개념, 계산 유형 예제들이 잘 정리되어있고 연습문제, 모의고사 등 문제가 풍부한 부분은 왠만한 난이도의 문제는 방어할 수 있을만큼 알찬 구성이라는 생각이 들었다.
큰 단점은 내 기준에서는 발견하지 못했고, 작은 단점이라면 위에서 언급했듯 동영상 강의를 이론 강의까지 확대 적용하여 서비스했으면 하는 바램 정도 외에 전반적으로 장점이 가득한 책이다.
서평단 이벤트에 당첨되었다는 이유로 편파적으로 리뷰를 작성하지 않고자 매우 노력했음을 밝힌다. 철저히 수험생의 입장에서 합격을 목표로 분석했음을 알린다.
도서를 제공받아 작성된 글입니다.