[리뷰] 2021 이기적 빅데이터분석기사 필기 기본서



영진닷컴 출판사의 "2021 이기적 빅데이터분석기사 필기 기본서(나홍석, 배원성, 이건길, 이혜영, 고려사이버대학교 AI·빅데이터 연구소 저)"를 읽고 작성한 리뷰입니다.

표지


아쉽게도 코로나로 인해 제1회 빅데이터분석기사 1차 시험이 취소되었다. 2차 시험이 내년 4월 17일 시행 예정이므로 그동안 준비를 철저하게 해 온 분께는 슬픈소식이겠지만, 준비가 부족한 분께는 기회가 될 수 있을 듯 하다.

국가 기사 시험이기 때문에 인재를 얼마나 적합하게 가려내는지와는 별도의 문제로 AI, 빅데이터 관련 분야에 종사하고 싶은 이라면 기본으로 갖춰야 할 자격증으로 자리매김될 것 같다.

올해 처음으로 치뤄지기 때문에 대략적인 출제기준, 범위 외 난이도와 내용, 출제경향이 어떨지 예측이 어렵다. 때문에 시종에 나와있는 5종의 교재 중 어떤 수험서가 가장 우수한지 판단하기 어렵다.

개인적으로 꼭 취득하겠다는 마음을 먹고 있는 시험인지라 앞서 시중에 발간된 4종의 도서를 비교 분석한 리뷰를 올렸으니 관심있는 분들은 [리뷰] 이지패스 2021 빅데이터분석기사 필기를 참고하시기 바란다.

본 포스팅에서는 지난번 리뷰에서 다루지 못한 나머지 1종의 수험서 2021 이기적 빅데이터분석기사 필기 기본서에 대한 리뷰를 다뤄보려 한다. 먼저 구체적인 장점과 단점을 알아보자.


  • 장점
    • 집필진의 전문성. 그리고 계산을 필요로 하는 예제의 우수함.
      상대적으로 암기식 위주의 학습을 필요로하는 파트 1, 4에 비해 파트 2, 3은 난이도에 따라 충분히 어려운 계산 문제가 등장할 수 있는 파트이다.

      때문에 개인적으로 빅데이터분석기사 수험서를 고를 때 가장 먼저 보는 부분이 “파트2 3절 통계기법 부분”과 “파트3 2절 분석기법” 부분이다.

      빅데이터 분석의 핵심이 되는 부분이자 실무에서 가장 중요하게 활용되는 부분이기에 실제 배워야 하는 가장 중요한 부분이라고 생각하며 난이도에 따라 당락을 좌지우지할 부분이 될 수 있기에 해당 부분을 저자가 얼마나 잘 알고 전달할 수 있는지 파악하는 것이 중요하다.

      “파트2 3절 통계기법 부분”에서 다루는 추정과 검정은 사실 빅데이터 시대에 중요성이 많이 퇴색했다고 생각한다. 표본과 모집단의 관계를 파악하는 것이 쑥쓰러울 정도로 많은 데이터가 쌓이고 있는 시대이기 때문이다.

      하지만 그럼에도 추정과 검정은 통계 핵심을 담당하는 한 축이며 무엇보다 논문이나 연구 결과에 중요하게 활용되고 있어 이를 모르고는 타인의 연구 결과에서 인사이트를 추출하기 어렵거나, 스스로의 연구 결과의 전달에 실패할 가능성이 크다.

      그렇기에 빅데이터분석기사의 출제 기준에도 해당 범위만큼은 반드시 알아야 할 부분으로 여겨 범위가 포함된것이 아닐까 추측한다. 더 깊은 연구결과를 이해하기 위해 p-value, 유의수준, 기각역, 귀무가설, 대립가설, 독립표본 간 평균차이 검정, 모수, 점추정, 구간추정 등의 핵심개념은 최소한으로 알아두어야 할 펀더멘탈이기 때문이다.

      문제는 위의 개념들이 펀더멘탈임에도 이를 쉽게 전달하는 책을 거의 본 적이 없다. 귀무가설이나 유의수준이라는 용어들이 이미 직관적이지 않다. 개인적으로 번역의 역사에서 가장 실패한 번역 용어가 아닐까 싶을 정도이다. 개념 자체가 결코 쉽지 않은데 not의 not이라는 개념이 연속으로 엮이는 불확실한 용어들을 충분한 개념 정립이 되지 않은 상태에서 시간에 쫓기듯 비직관적으로 대체 용어를 선택한 느낌이다.

      만약 해당 파트를 이해하기 쉽게 전달할 수 있다면 이 책의 저자는 자타공인 전문가임을 의심할 여지가 없으며, 나아가 훌륭한 선생님임을 의심할 여지가 없기에 다른 파트를 보지 않아도 책을 전반적으로 평가할 수 있다는 생각이 든다.

      면면이 훌륭한 분들을 평가한다는 것은 주제넘지만 심도있게 읽은 결론을 먼저 말씀드리자면 집필진이 고려사이버대학교 AI, 빅데이터 연구소 소속이라는 네임 밸류에 걸맞는 전문가 분들이라는 점과 전달력도 어느정도 괜찮다는 평을 내리고 싶다.

      해당 개념들을 상당부분 이해하고 있는 나로써는 난해한 부분을 깔끔하게 전달하고자 한 저자분들의 시도와 노력이 잘 전달된 느낌을 받았다.

      특히 고등학생들의 용돈 수준 조사나 두집단의 사료가 젖소의 우유생산량에 미치는 영향의 차이와 같은 일상에서 쉽게 이해할 수 있는 예제로 어려운 개념들을 설명한 부분이 책의 백미라고 생각한다.

      이런 예제 박스들은 좋은 연습문제를 만들고자 저자들의 노력한 흔적이 본문에 깔끔하게 정리된 형태가 아닐까 추측되는데 그렇기에 계산을 필요로 하는 연습문제의 질이 좋다. 실무에서 필요로 하는 계산은 물론 알고리즘을 이해할 수 있음은 물론이고, 이면에 숨은 개념을 확실히 이해할 수 있는 좋은 수단이기 때문이다.

      다른 파트들을 차치하고서라도 이 장점 하나만으로도 충분히 합격점을 주고 싶은 실무서라는 생각이 들었다.

    • 동영상, CBT 온라인 모의고사 차별화
      5종의 수험서 통틀어 무료 동영상 강의가 제공되는 유일한 수험서이다. 내가 알기로는 다른 수험서 1종도 동영상이 제공되긴 하는데 유료로 제공되는 것으로 알고 있다. 나머지는 없는 것으로 알고 있다.

      출판사 영진닷컴은 1990년대 부터 이미 수험서와 관련된 유명 출판사이고 그 외 우리나라 IT 지식 정보 전달에 지속적인 기여를 한 훌륭한 출판사라고 생각한다. 나 역시도 대학 시절부터 현재 사회 생활에 이르기까지 영진 수험서로 학습한 적이 많다.

      이런 플랫폼을 꾸준히 가꿔온 출판사답게 동영상, CBT, 홈페이지 등 부가적인 학습 수단이 제공되는 점은 이 수험서의 차별화된 장점이다. 장기적으로 바라봤을 때 빅데이터분석기사의 시행 횟수가 늘어날수록 이런 플랫폼이 빛을 발할것 같다는 생각이 든다. 이기적으로 대표되는 이 출판사의 브랜드가 과거에서 이어져 온 경향으로 지속적으로 성장했기에 장기적인 믿음이 든다.

    • 핵심만 요약한 분량
      교재의 총 분량이 약 370p 정도에 지나지 않는다. 아마도 책의 제목에 “이기적”이라는 표현이 들어간 이유일 것이다. 최단 시간 내 가장 적은 시간과 노력으로 합격을 겨냥한 구성을 채택했기에 분량이 최소화 된 듯 하다.


  • 단점
    • 동영상 강의의 2% 부족함
      동영상이 타 수험서 대비 차별화 된 장점임이 틀림없음에도 급하게 출간된 감이 없지 않다. 무료로 제공되긴 하나 기본 강의는 없고 연습 문제 해설 동영상만 제공된다는 점, 해설 강의의 수준이 계산 유형의 해설은 탁월하나 개념 문제의 해설은 빈약하다는 점이 단점이다. 예를 들면 정답에 대한 설명은 있는데 오답에 대한 보충 설명이 누락된 건들이 많다.

    • 분량을 줄이기 위해 희생된 전달력
      분량이 깔끔한 것은 장점이자 단점으로 작용하는 것 같다. 확실히 파트 1, 4는 암기식 위주의 학습이 필요한 부분이라 간결한 핵심 요약 내용이 도움이 된다.

      물론 파트 2,3도 지식이 어느정도 있는 나에게는 깔끔한 요약이 마음에 들긴 했다. 다만, 본 기사 시험을 처음으로 준비하는 초보 수험생의 경우는 무슨 내용인지 이해하기 매우 어려울 수 있겠다는 생각이 든다.

    • 일부 연습문제의 빈약함
      앞서 언급했듯 계산 및 매커니즘을 이해하는 연습문제의 질은 매우 훌륭하다. 다만, 암기식 혹은 일반적인 개념을 묻는 서술형 문제는 창작에 있어 고심의 흔적이 덜 보인다. 단순히 설명을 열거하고 단어 한 두개 누락 혹은 교체를 통해 연습문제를 쉽게 만든 흔적이 보인다. 이런 문제들은 충분한 이해 없이도 당장 맞출 수 있는 문제들이기에 실전에서의 일반화에 좋지 못한 효과로 작용하진 않을지 다소 우려가 된다.

    • 출제기준 불일치 파트
      이건 사실 단점이라기 보다는 어느 수험서나 안고 있는 문제이긴하다. 물론 출제기준 자체가 명확하지 않고 1회도 시행되지 않은 기사에서 흔히 발견되는 공통점이다.

      특히 파트1, 4는 해석 여하에 따라 범위가 굉장히 가변적일 수 있다 생각한다. 때문에 각 수험서마다 상당히 내용이 달라진다. 아무래도 저자들이 몸담았던 연구 및 실무 분야의 지식들 위주로 구성된 경우가 흔하다.

      본 도서 또한 파트1의 경우 출제 기준 이상으로 불필요한 내용이 과하게 들어있다는 생각이 들었고, 파트4의 경우 모수 유의성 검정이나 비즈니스 기여도 평가, 활용 시나리오 개발 등 일부 파트가 누락된 느낌이 들었다.

      물론 시중 다른 수험서에서도 공통적으로 발견되는 양상으로 일부 누락 혹은 과함이 존재한다. 때문에 가장 마음에 드는 수험서 2종을 상호 비교해가며 교차 검증하며 읽는 편이 안전할 것으로 보인다.

    • 기타
      그 외 각 연습문제마다 문제에 정답과 해설이 같이 붙어있는 점, 파트3의 설명이 다소 빈약한 점은 개인적으로 약간 마음에 안드는 부분이다. 다만, 해당 부분이 실전에 어느정도 영향을 미칠지 몰라 무조건 단점이라고 치부하긴 어려울 것 같다. 실전이 아닌 내 스스로의 기준에 미치지 못해 적어본다.


본 도서의 총평을 하자면 일단 앞서 언급한대로 수준있는 전문가가 잘 알고 기술한 책이므로 좋은 책이라는 점에는 의심할 여지가 없다. 다만, 독자의 현재 학습 수준, 여건 등에 따라 호불호가 확실히 갈릴 것 같다는 생각이 든다.

이미 관련 전공자나 실무 경험이 있거나 혹은 다른 수험서로 준비가 탄탄한 수험생 들에게는 핵심 요약 내용이 메타지식을 재정립 시켜주고 시간대비 능률을 올려주기에 좋은 평을 얻을 수 있을 것 같다는 생각이 든다.

반면 초보 수험생의 경우 파트 2,3의 경우 굉장히 난해할 수도 있겠다는 생각이 든다. 따라서 본 도서는 다른 수험서와 병행하여 크로스 체크 용도로 학습한다면 효과를 충분히 얻을 수 있지 않을까 생각이 들었다.

결론적으로 아직 무엇하나 정해지지도 않고 투명하게 공개된 것이 없는 1회도 시행하지 않은 본 시험을 대비하는데 있어 현 시점 가장 확실한 전략은 책 2권 정도는 병행해가며 정리하는 것도 괜찮은 전략이 아닐까 싶다.

마지막으로 본 시험을 대비하는데 있어 전체적인 전략을 요약해볼까 한다. 먼저 작성한 리뷰에서 밝혔듯 기본서로는 이지패스 수험서가 굉장히 전달력이 좋고 이해하기 쉽다. 대신 분량이 많기에 스스로 메타지식을 잘 정리해 나가야 한다.

개인적으로는 이지패스 수험서를 기본서로 삼고 본 리뷰에서 다룬 이기적 수험서를 크로스 체크 및 보완서로 두면 좋은 효과가 나올 수 있는 구성으로 보인다. 경우에 따라서 초보 수험생의 경우 수제비 수험서를 처음으로 접하고 취향에 따라 한 권을 더 병행으로 봐도 괜찮겠다는 생각이 든다.

물론 수험서 구매 예산이 충분하지 않거나 기본 실력에 어느정도 자신이 있는 분들은 본 포스팅과 이전 리뷰를 참고하여 스스로에게 부족한 부분을 잘 채워줄 수 있는 교재 한 권을 잘 선택하는 것이 좋을 듯 하다.

끝으로 두편의 리뷰를 작성하기까지 1권은 개인 비용으로, 2권은 출판사 이벤트를 활용하였지만 이벤트에 당첨되었다는 이유로 편파적으로 리뷰를 작성하지 않고자 매우 노력했음을 밝힌다. 철저히 수험생의 입장에서 합격을 목표로 분석했음을 알린다.

도서를 제공받아 작성된 글입니다.






© 2019.04. by theorydb

Powered by theorydb