[리뷰] 쉽고 빠르게 익히는 실전 LLM



한빛미디어 출판사의 "쉽고 빠르게 익히는 실전 LLM(시난 오즈데미르 저/신병훈 역)"를 읽고 작성한 리뷰입니다.

표지


LLM이라는 망망대해를 직관적인 도식 자료를 활용해 실용적 관점에서 핵심 원리와 본질만 전달하고자 노력한 점이 인상적이다. 특히, 다양한 예제 실습을 통해 머릿속의 반짝이는 창의력을 제품화 할 수 있도록 가이드한다.

LLM이라는 거대하고 복잡한 바다를 이렇게 간결하게 설명하는 책이 등장할 줄은 몰랐다. LLM이라는 주제에 대한 확실한 이해와 남다른 통찰을 수십년 간의 경험으로 다져온 전달력으로 표현한 것 같다. 다른 책들과 달리 서문에 이 책에 대한 저자의 자신감이 느껴졌는데 이 조차도 읽는 내내 겸손의 표현임을 깨달았다.

단순히 1장만 읽어도 LLM을 구성하는 망망대해가 얼마나 거대한지는 초보자도 느낄 수 있다. 현재 가장 유명한 LLM 모델인 BERT, GPT-4, T5에서 LLM을 가능케한 사전훈련, 전이학습, 파인튜닝, 어텐션 등 하나하나의 주제도 그 깊이가 어마어마하기에 사실 이 모든 것을 전달하는 책은 등장할 수 없다는 생각을 했다.

하지만 천재들은 늘 나같이 흔한 범인들의 선입견의 박살내는 매력이 있는 듯 하다. 이 망망대해로 직접 뛰어들지 않고 실용적인 관점에서 기본원리와 본질이 무엇인지 축척 높은 지도를 만들어 나간다. 본질

이를 설명하는데 있어 핵심은 알기쉽게 설명한 직관적인 도식으로 대체하고 추상적인 개념은 예제 실습을 통해 눈으로 보게 만든다. 예를 들어 어텐션이 무엇인지 모르는 NLP 초보자도 아래 그림을 보면 대략적으로 어떤 의미인지는 파악할 수 있을 것이다. 어텐션

예제의 경우도 LLM을 가능케 한 주류 기술 특히 파인튜닝을 중심으로 짧은 코딩으로 엄청난 결과물을 얻을 수 있는 형태로 구성되어있으니 각 개념들의 내부에 집중하느라 길을 잃지않도록 본질을 알고 원하는 문제를 해결할 수 있도록 정보 전달의 수급을 조절한다. 아래 시각적 질문 답변 시스템을 만드는 과정이 대표적인 예시이다. VAQ

이 책에 등장하는 예제들은 굉장히 다양한데 클로즈드 소스를 활용하는 방법부터 오픈소스를 파인튜닝하는 방법에 이르기까지 저변이 상당히 다양하기에 좋은 아이디어만 있다면 이들을 참조하여 빠르게 원하는 제품을 얻을 수 있을 듯 하다. 예제도 재밌는 주제가 많다. 예를 들어 아래 자연어를 레이텍으로 변환하는 예제가 그렇다. LaTex

3장이나 5장에서 프롬프트 엔지니어링을 다루는 것도 이색적이다. ChatGPT를 곁에 두고 사는 독자들이라면 이미 3장 정도의 기법은 잘 알고 있겠지만 5장에 등장하는 프롬프트 인젝션이나 스터핑과 같은 기법은 생소할지도 모른다.

다른 이들이 올린 질문 자체 혹은 방식 또는 사용한 데이터를 가져오는 기술을 자연어 세계에서도 적용할 수 있다는 것 자체가 LLM에 얼마만큼의 창의성을 적용시킬 수 있는 것인지 그 거대함에 자주 위압을 느낀다.

마지막 단원에는 실습한 모델이나 예제들을 프로덕션 환경에서 활용할 수 있는 방법도 소개된다. Hugging Face 모델 허브에 올리는 것을 마지막으로 이 책의 여정은 끝이 난다.
Hugging Face

이러한 거대한 망망대해를 읽는데 있어 시종일관 재미를 줄 수 있는 책은 결코 흔치 않을 것이다. LLM을 시작하는 사람 혹은 이 분야에 도전하는 이에게 특히 큰 용기를 복돋게 해줄 명작이다. 물론 AI 대격변 시대에 살고 있는 누구나 한 번 쯤 읽으며 실습해본다면 막연한 미래를 대비하는데 큰 도움이 될 것이다.







© 2019.04. by theorydb

Powered by theorydb