APACHE KAFKA 표지

 

이번 달에 보게된 책은

"실전 아파치 카프카(APACHE KAFKA) - 애플리케이션 개발부터 파이프라인, 사물인터넷 데이터 허브 구축까지"

 

개인적으로 KAFKA를 알게된 계기는 MLOps를 처음 공부할 때에

Streaming Data를 수집 및 배포하는 용도의 도구로 처음 접하게 되었었다.

 

Machine Learning에서 대용량의 데이터 특히 지속적으로 제공되는 straming data를 처리할 때,

앞단에 구축하게 되는 시스템으로 가장 추천하는 도구가 바로 Kafka였었다.

 

Apache Kafka

 

책에서 제일 처음 보여주는 그림을 보면, KAFKA의 용도를 정확히 알 수 있다.

 

Kafka는 대량의 데이터를 높은 처리량과 실시간으로 처리하기 위한 도구로써 다음의 4가지 특징이 있다.

 

  - 확장성 : 여러 대의 서버 구성 가능

  - 영속성 : 수신한 데이터를 디스크에 유지 가능

  - 유연성 : 다양한 도구와 연계 가능

  - 신뢰성 : 메시지 전달 보증

 

https://kafka.apache.org/

 

 

Apache Kafka 사이트에 가면, 위와 같은 홍보 문구(?)를 볼 수 있다.

Fortune 100대 기업의 80% 이상에서 사용될 정도로 신뢰성 있고 인기 있는 잘나가는 도구라는 의미이다.

 

 

이렇게 멋진 도구에 대해서 멋지게 잘 소개해주고 있는 책이 바로 이 책이다.

 

실전 아파치 카프카 - 10점
사사키 도루 외 지음, 정인식 옮김, 시모가키 도루 외 감수/한빛미디어

 

 

조금 아쉬운 점은 이 책은 2018년도에 출시된 2.0 버전을 바탕으로 작성되었다는 것인데,

현재 시점 최신 버전은 아직 2.7 이다.

 

초판 1쇄

 

책이 출간된 것도 20년 2월이니까.... 1년이 조금 넘게 된 시점에서 이 책을 보게 되었지만...

Kafka라는 도구 특성상 엄청난 변화가 있는 것은 아니기에 Kafka에 대해서 공부하기에 별 무리는 없을 것으로 본다.

 

 

목차

 

Kafka에 대한 hitstory에 대해서도 친절히 설명해주고 있다.

 

목차

설치나 애플리케이션 구성 등에 대해서도 자세하게 친절하게 잘 되어있다.

 

사례

 

실제 사례에 대해서도 보기 좋게 재미있게 잘 정리되어 있다.

 

 

실무에서 Kafka를 사용해야하는 분들에게 많은 도움이 될 수 있는 책이다.

 

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

반응형

[ GAN is ... ]

 

AI가 만든 얼굴이라던지, 오바마 전미국대통령의 fake 영상이라던지 하는 뉴스를 들어보았을 것이다.

이런 것들을 만들어낼 수 있는 가장 대표적인 기술적 배경이 바로 GAN 이다.

 

아래 영상을 보면 바로 어떤 것인지 알 수 있다.

 

 

GAN은 "Generative Adversarial Network"의 줄임말인데, 풀어보면 아래와 같이 말할 수 있다.

  • Generative: 생성(Generation) 모델을 이용하여, 진짜 데이터와 같이
  • Adversarial: 두 개의 모델을 적대적(Adversarial)으로 경쟁시키며 발전 시키는
  • Network: 인공신경망(Artificial Neural Network)

 

"GAN"은 라벨(정답)이 없는 데이터를 가지고 학습을 하는 비지도학습의 한 유형이다.

GAN에 대한 가장 대표적인 설명은 "위조지폐범"과 "경찰"이다.

 

GAN

 

위조지폐범(생성모델)은 진짜와 구분이 어렵도록 위조지폐(가짜 데이터)를 계속 생성하고,

경찰(분류모델)은 진짜와 가짜를 계속 분류하면서 50%의 확률 정도가 될 때까지 계속 진행을 하는 방식이다.

 

 

 

[ This book is ... ]

 

서두가 길었다 ^^

 

GAN에 대해서 알려주는 괜찮은 책이 이번에 한빛미디어에서 출간되었다.

책의 제목은 "GAN 첫걸음" !!!

 

GAN 첫걸음 - 표지

 

예쁜 보라색으로 깔끔한 폰트로 제목이 적혀있는 표지를 갖고 있는 조금 작은 크기(신국판 규격 정도?!)의 책이다.

거기에다가 지금 이 글을 적고 있는 시점에서보면 나온지 얼마 안되는 따끈따끈한 책이다.

 

GAN 첫걸음 - 초판

 

이 책의 지은이는 "타리크 라시드"이다.

 

GAN 첫걸음 - 지은이

 

"타리크 라시드"는 이 책에 앞서서 다른 책을 출간했었다.

 

신경망 첫걸음 - 10점
타리크 라시드 지음, 송교석 옮김/한빛미디어

 

어떻게 보면 위 책의 다음 2권과 같은 위치에 있는 것이 바로 이 책 "GAN 첫걸음"인 것 같다.

물론, "신경망 첫걸음"을 보지 않고 바로 "GAN 첫걸음"을 본다고 하여 문제가 되지는 않는다.

 

GAN 첫걸음 - 대상 독자

 

책에 쓰여져 있는 것처럼, 기초부터 알고 싶은 사람을 배려해서 쓰여져 있기 때문이다.

 

하지만, 아무리 그래도 최소한 Machine Learning에 대한 기초적인 지식이 있으면 조금 더 읽기 수월할 것이고

"신경망 첫걸음"을 먼저 읽었다면 더더욱 읽고 이해하기 좋을 것이다.

 

 

[ Prerequisite ]

 

이 책은 기본적으로

"구글 코랩(Google Colab)" 환경에서 "파이토치(PyTorch)" 라이브러리를 이용하여 GAN을 구현한다.

 

친절하게도 이 책에서는 "Chapter1 파이토치 기본"에서

기본적인 실습 환경과 배경 지식에 대해서 친절하게 설명을 해주고 있다.

 

그러다가 PyTorch의 기본 데이터 형태인 텐서(tensor)에 대해서까지 Part1에서 설명을 해준다.

 

 

[ practice ]

 

"Chapter2 파이토치로 만드는 첫 번째 신경망"에서는

유명한 MNIST 데이터셋을 이용해 PyTorch로 신경망을 만드는 과정을 꼼곰히 설명해주고 있다.

 

"Chapter3 성능 향상 기법"에서는 조금 더 성능을 높이기 위한

손실함수, 활성화 함수, 옵티마이저, 정규화 등에 대해서 설명한다.

 

"Chapter4 CUDA 기초"에서는 AI 하면 떠오르는 GPU를

어떻게 사용할 수 있는지에 대해서 친절하게 설명해준다.

 

여기까지가 "Part1 파이토치와 신경망 기초"에 해당한다.

 

 

[ lesson ]

 

본격적인 GAN에 대한 학습은 "Part2 튼튼한 GAN 만들기"로 분류되어 있는

"Chapter5 GAN 개념"부터 "Chapter8 얼굴 이미지"까지로 이루어져 있고,

 

"Part3 흥미로운 GAN 기법"에서는 조금 더 고급스러운(?)

'Chapter9 합성곱 GAN', 'Chapter10 조건부 GAN'에 대해서 설명해주고 있다.

 

 

 

[ My Opinion is ... ]

 

아직 이 책의 끝까지 공부해보지는 못했지만 지금까지 공부하면서 느낀 점을 적어보면...

 

책이 나름 친절하고 쉽게 설명해주고자 노력했지만,

그렇다고 해서 Machine Learning이 뭔지도 공부하지 않은 상태에서 접하기에는 어려울 수 밖에 없다.

 

또한 책에서 심심찮게 보이는 "신경망 첫걸음에서 뭐뭐를 해봤었다"와 같이

이 책을 보기 전에 "신경망 철걸음"을 보고와야 되는 것처럼 되어 있는 점은 조금 아쉬웠다.

 

하지만,

최소한 "Machine Learning"에 대해서 조금이라도 공부를 해보신 분이라면

GAN에 대해서 공부하기 위해 이 책을 추천할 수 있을 것 같다.

 

어려운 수학 공식에 대한 설명 보다는

구글 코랩에서 PyTorch를 직접 구현해보며 공부할 수 있다는 점은 정말 좋았다.

 

직접 해보면서 공부하는 것을 좋아하시는 분에게는 정말 정말 적극 추천한다!!!

 

 

※ 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.

반응형

 

머신러닝에 대한 이론 공부만 해서는 실무에서 적용할 때 무쓸모가 될 수도 있기에 😥

실무에 적용을 어떻게 해야하는지에 대해서 살펴보고자 찾던 중 찾게 된 도서 !! 😍

 

"Machine Learning for Business"

 

책 표지

 

왠지 멋지게 생긴 선장 같은 아저씨가 더욱 더 눈길을 잡아끌었다.

 

하지만, 보험약관 처럼 놓친 것이 있었으니...

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"

 

어쩐지 추천의 글에 있는 2분 모두 AWS코리아 소속이시더라니... 😁

 

 

뭐 하지만, 회사에서도 퍼블릭 클라우드 사용량을 보면 대부분 AWS를 쓰고 있고,

글로벌 트렌드를 봐도 뭐 AWS가 대세이기는하니 ...

이번 기회에 말로만 듣던 세이지메이커 한 번 써보지 뭐 !!! 😑

 

 

우선 AWS 가입부터 해야하는데,

친절하게도 책의 뒷 부분에 있는 '부록'에

"AWS 가입"부터 파일 저장을 위한 S3 설정 및 사용방법, 세이지메이커 설정 등에 대해서 친절히 알려준다.

 

Amazon SageMaker

 

그런데, AWS 서비스 쓰려면 돈드는 것 아닌가!?

본래 처음 가입하면 1년간 어느 정도 사용할 수 있는 무료 정책이 있다지만

나는 이미 무료 1년이 지났는데... 그래서 홈페이지 찾아가봤다.

 

SageMaker 요금제

리전을 서울로 바꾸지는 말자.

시간당 요금이 여기보다 비싸다.

 

그런데, 실제 사용하면 얼마쯤 나온다는 것일까?

 

SageMaker 요금 예제

 

2시간 정도 쓰면 500원쯤 지불한다는거네... 음... 나의 똑똑해짐을 위해 이 정도는 투자해줘도 될 것 같다. 😎

 

뭐, 기본 환경 구축은 이 정도로 하고...

 

 

 

책의 내용을 살펴보자.

 

도서 구성

 

일반적인 회사의 운영 영역을 시나리오로 해서 구성이 되어있다.

 

각 시나리오에 따라 데이터가 제공되고

그 데이터를 모델에 적합한 형태로 가공도 하고

학습/검증/테스트 용도에 맞게 데이터셋 분리도 해보고

시나리오와 데이터에 맞는 머신러닝 알고리즘을 선택해서 학습도 한다.

심지어 AWS 비용 절감을 위한 관리 방법까지도 알려준다.

 

 

다만, 이렇게 실제 머신러닝을 비즈니스에 적용하기 위한 과정을

AWS SageMaker를 이용해서 적용하는 과정에 대해서 설명을 하다보니

머신러닝에 대해서는 많은 분량으로 설명해주지는 않는다.

 

하지만 이 부분은 절대 이 책의 단점이 아니다!!!

 

이 책은 분명히 타이틀에 적어놓은 것 처럼

"비즈니스 머신러닝"에 대한 책이다!!!

 

또한,

"아마존 세이지메이커와 주피터를 활용한 빠르고 효과적인 머신러닝 활용법"에 대해서 알려주는 책이다.

 

 

그리고, 이 책의 경우 원서에는 없는 설명도 포함되어 있다.

 

한국어판 부록

 

IT 서적의 안타까운 부분인데... 대상 시스템이 업그레이드가 되어버려 버전이 맞지 않게 되는 것이다.

하지만, 친절하게도 버전을 맞출 수 있는 방법을 가이드해주고 있다.

 

 

머신러닝에 대해서 기본적인 사항들을 공부하신 분들에게 추천하고픈 책이다.

전체적으로 어떤 흐름으로 비즈니스에 적용하는지 살펴보기에 충분히 괜찮은 책이다.

 

 

※ 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.

반응형

요즘에는 새로운 언어가 너무 쏟아져서 굳이 R까지 배워야 하나 싶은 마음에 지금까지 R 언어와 관련된 것은 피해왔다.
Machine Learning 초창기에는 R이 유행하였지만, 지금은 솔직히 Python으로 못할게 없기에 더더욱... 😁

그래서 "R을 이용한"이라는 말이 붙어있어서 이 책 또한 살짝 피하고 싶었지만,
퀀트 투자를 위해 중요한 요소인 데이터 수집에 대해서 자세히 나온 책이라 하여 나름 과감하게 도전해보기로 하였다.

 

책 표지

 

전체적으로 13개의 Chapter가 있는데,
거의 반을 차지하는 6개의 Chapter가 데이터 수집과 관련된 내용이고
2개 챕터가 데이터 정리 및 분석과 관련한 내용이다.
그 다음 9장부터 본격적으로 종목 선정하고 포트폴리오 구성하고 평가하는 것들을 설명해주고 있다.

이 책은 R 언어를 기본적으로 사용할 줄 아는 사람들을 대상으로 하고 있다.
그래서 안타깝게도 실습 환경 구축을 위한 과정 등을 설명해주지 않는다. 😥

 

 

저자는 독자들을 위해서 다음과 같은 온라인 지원을 해주고 있다.

 

- 웹페이지: hyunyulhenry.github.io/quant_cookbook

 

R을 이용한 퀀트 투자 포트폴리오 만들기(개정판)

본 페이지는 R을 이용한 퀀트 투자 포트폴리오 만들기의 웹사이트 입니다. 책의 수정 사항이 있을시 즉시 반영할 예정이며, 책에서 다루지 못했던 추가적인 내용도 지속적으로 업데이트 할 예정

hyunyulhenry.github.io

- GitHub: github.com/hyunyulhenry/quant_cookbook

 

hyunyulhenry/quant_cookbook

R을 이용한 퀀트 투자 포트폴리오 만들기. Contribute to hyunyulhenry/quant_cookbook development by creating an account on GitHub.

github.com

- Blog: henryquant.blogspot.com

 

Henry's Quantopia

금융, 주식, 퀀트 투자에 대한 블로그입니다. 연구 결과 및 투자 결과를 정기적으로 업로드 합니다.

henryquant.blogspot.com

 

 

특히, 웹페이지의 경우에는 (책이 안팔리지 않을까 우려되어 알려드리기가 좀 조심스럽지만 ^^)

책 내용을 그대로 제공해주고 있다. 우와아~~~~ 😻

 

심지어, 책의 경우 2색 인쇄이지만, 웹페이지는 풀컬러로 제공이 된다 👍

 

 

뭐 일단 웹페이지를 통해서 공부하여도 좋지만,

개인적인 경험으로는 책을 사서 공부하는 것이 조금이라도 더 공부를 하게 되더라는 ... 👩‍🚀

 

 

퀀트 투자를 하기 위해서는 다양한 데이터가 필요하기에

이 책에서는 그러한 데이터를 수집하는 방법을 알려주고 있다.

 

물론 비싼 비용을 지불하면 손쉽게 데이터를 얻을 수 있지만... 우리가 좋아하는 것은 Free !!! 💛

 

이 책에서는 API를 이용해 데이터를 수집하는 방법을 시작으로 해서

HTML을 파싱하는 방법을 통해 공시를 받아오기도 하고 주식티커를 통해 데이터를 얻어오기도 한다.

 

또한 시각화를 통해 데이터를 분석하는 방법도 구체적으로 설명해주고 있으며,

종목을 선정하는 방법들에 대해서도 구체적으로 설명해주고 있다.

 

다만, R 언어를 이용한 프로그래밍적인 부분에 대해서 힘을 주다보니

퀀트 투자에 대한 설명 부분이 많지 않은 것은 조금 아쉽다.

 

 

그래서, 저자가 앞서 출간했던 책을 같이 살펴보면 더 좋을 것 같다.

    - www.yes24.com/Product/Goods/56018775?Acode=101

 

SMART BETA (스마트 베타)

주식투자의 새로운 흐름, 스마트베타현명한 베타를 통해 알파를 추구하라!오래 두고 볼 수 있는 퀀트 투자 교과서 쉬지 않고 변화하는 주식시장에서, 스마트베타는 `장기적으로 주가지수 이상

www.yes24.com

 

기존에 다른 퀀트 투자 책을 보면서 실제 구현에 대한 부분이 아쉬웠는데,

이 책에서는 실제 데이터들을 수집해서 구현하는 내용들을 자세히 설명해주고 있어서 너무 좋았다.

 

 

※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형



최근 주력으로 공부하고 있는 것은 Kubernetes와 Machine-Learning이다.

특히 현재 업무와도 관련이 있어서 더 깊이 보고 있는 것이 바로 Kubernetes인데, 이와 관련된 새로운 책 하나를 살펴보게 되었다.



취향 저격!


요즘 IT 서적들은 표지도 너무 잘 만들고, 타이포그라피도 너무 잘 하는 것 같다.

그리고, 왠지 모르게 레벨업 욕구를 불러일으키게 "15단계"라니...




희한하게 요즘 보는 책들의 지은이가 계속 일본인이네...

지은이가 IBM 클라우드 소속이라서, 책에서도 IBM 클라우드를 소개했구나 ... ^^



15단계로 구성되었다고 하지만,

1장은 단계에 속하지 않은 사전 학습 내용으로 되어있다.



2장부터 1단계 시작이다.



그런데, 살펴보면 다른 책에서는 잘 보지 못하는 재미있는 항목이 보인다.



각 Step의 뒷 부분을 보면, "참고 자료"를 하나의 섹션으로 넣어 놓았다.


실제 내용을 보면 아래와 같이 되어있다.



추가적으로 공부를 더 해보고 싶은 경우, 이 내용을 참조하면 많은 도움이 될 것 같다.



책 내용은 깔끔하다.

다만, Why 에 대한 설명을 해주는 책은 아니고, How 위주로 설명을 해주는 책으로 보인다.




설명도 잘 되어 있고, 실행 예도 잘 보여주고 있다.


다만, 15단계에 따라 하나씩 직접 해보면서 어떤 명령어들을 사용하는지 배우기에는 적합하지만,

왜 이런 구성을 가지고 있는지 등에 대해서 파악하려면 다른 책을 보는 것이 나을 것 같다.


직접 몸으로 부딪히면서 배우는 것을 좋아하시는 분들에게 추천할 수 있는 책이다.




※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형


최근 회사에서 업무로도 파이썬을 자주 사용하게 되고, 개인적으로 하는 작업에서도 파이썬을 자주 사용한다.

하지만, 대부분 CLI 환경으로만 사용해왔지, GUI 환경이 필요한 경우에는 다른 언어를 사용하곤 했다.


더구나, 게임 개발을 할 때 파이썬을 사용한다고는 더더욱 생각하지 못했다.


그런데, 이렇게 파이썬으로 게임 개발을 알려준다는 책이 등장했다 !!



아니, 그런데 표지에 저런 캐릭터를 ... ?



친절하게 학습을 도와준다니~ 고마워요 !!!




역시나, 일본 출신의 저자다! ^^

거기에다가 남코, 닌텐도, 코나미 등에서 근무를 했다니... 와우~!!




게임 개발이 주요 컨텐츠이지만,

파이썬이라는 언어에 대해서도 충실한 책이다.



Chapter1 에서부터 Chapter4 까지 기본적인 문법들을 설명하고,

Chapter5 에서는 CLI로 간단하게 게임 비슷한 것을 만들어 본 다음에

Chapter6 부터 본격적으로 GUI 환경으로 게임 개발을 설명해 주고 있다.



입문편이긴 하지만,

그래도 그럴듯한 모습의 게임도 설명해준다.



게임 개발을 한다고 하면 어떤 것들을 해야 하는지 파악할 정도는 된다.





이 책의 특징은 앞에서도 말했지만,

예쁜 2D 캐릭터들을 사용해서 친근한 분위기를 만들어준다는 것이다.



캐릭터 설명도 이렇게 해준다.

각 캐릭터의 배경 설정도 존재 한다.



각 챕터의 앞에서는 이렇게 요약 설명도 해주고,



챕터 중간에 알면 좋은 내용들을 설명도 해준다.




단순하게 2D 캐릭터만 있다고 좋은 것이 아니라

설명에 필요한 이미지들이 colorful 하면서도 너무나 보기 좋게 삽입되어 있다.



이미지나 색상이 너무나 멋들어지게 들어있어서 책을 보면서 계속 기분이 좋았다.







이런 책을 공부할 때 중요한 것 中 하나가 바로 개발 환경을 갖추는 것이다.

책에서는 Windows & Mac 에서 필요한 환경 설치하는 것을 설명해주고 있다.




Ubuntu(우분투)와 같은 리눅스 환경에서는 해볼 수 없는 것일까?


아니다~!! 할 수 있다~!! ^^



Ubuntu Desktop 18.04 환경을 기준으로 설명을 하면 아래와 같다.



표준 사항으로 Ubuntu Desktop 18.04 버전을 설치했다면 Python 2.x 버전이 설치되어 있을 것이다.

하지만, 이 책에서는 Python 3.x 버전으로 되어 있기 때문에, Python 버전부터 맞춰야 한다.



1. Python 버전 변경하기 ( 2.x → 3.x )


    - python3 설치 및 update-alternatives 이용한 기본 실행 버전 설정해주기

    - https://www.whatwant.com/entry/Python3-환경-만들기-버전-변경하기-in-Ubuntu



2. GUI library 설치하기


    - 이 책에서 기본으로 사용하는 GUI library는 tkinter 이다.


    - $ sudo apt install python3-tk



3. VSCode (Visual Studio Code) 설치하기


    - 이 책에서는 IDLE를 이용해서 python을 사용하지만, 최근 트렌드에 맞춰서 VSCode를 사용해보자.


    - $ wget https://code.visualstudio.com/sha/download\?build\=stable\&os\=linux-deb-x64 -o vscode.deb

    - $ sudo dpkg --install vscode


    - VSCode 실행 후 "Python Extension" 인스톨




이 책에서 사용하는 예제 코드는 아래 주소에서 확인해볼 수 있다.


    - https://github.com/Jpub/PythonGame_1




해당 소스 코드를 내려 받아서 실행하면 아래와 같은 화면을 볼 수 있다.





개인적으로 이 책은

가볍게 살펴보기에 너무 너무 좋았다.


설명도 친절하게 너무나 잘되어 있었고

책 구성도 보기 편하게 너무나 잘 되어 있어서 인지 책을 살펴보는데 별 부담이 없었다.

그리고 소스 코드도 그냥 바로 실행만 하면 테스트해볼 수 있게 되어 있어서 너무 좋았다.




이 책을 추천하고 싶은 경우는,

가벼운 게임 개발을 경험해 보고 싶거나 파이썬을 이용해서 GUI 결과물을 만들어 보고 싶은 경우 기꺼이 추천할 수 있을 것 같다.




아쉬운 부분을 찾아보고 싶은데....

사실 개인적으로 아쉬운 부분을 찾아볼 수가 없었다 ^^ (개취 존중!! ^^)

음... 굳이 꼽아보자면, 파이썬 기본에 대한 소개를 굳이 4개 챕터에 걸쳐서 해야했는지... 정도!?




※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형


재미있는 이미지와 폰트로 호기심을 확 잡아 끌었던 책을 이번 기회에 보게 되어 너무 좋았다.


같은 부서에 있는 신입 사원의 책상 위에 있던 이 책을 보면서 재미있겠다라고 생각만 하다가

드디어 책을 받아서 보는데... 기존에 봤던 표지와 조금 달라서 이상하다 여겨졌는데,

이번에 받은 책은 "개정판"이란다.



이제 한 달 조금 넘은 따끈따끈한 책이다 !!!


IT 도서 중에서 그림으로 쉽게 설명한 책들을 보면 일본에서 만들어진 책들이 많았는데,

역시나 이 책도 지은이를 보니 made in japan 이었다.



여러 명이 각각의 챕터를 쓰고 그것을 엮어서 만들어졌다.

지은이들 간의 기본적인 인맥은 '일본 오라클'에서 같이 일했던 동료 사이인 것으로 보인다.



옮긴이의 이력을 보면... 네덜란드, 일본, SK, 싱가포르... 부럽다. 나도 글로벌하고 싶은데... ^^



이 책에서 설명해주고 있는 전체 아키텍처에 대한 그림이다. (http://bit.ly/2J6lH22)

일반적인 웹서비스에서 필요로 하는 서버 구성(Front-end, Back-end, DB)을 기본으로 설명을 해주고 있다.



단순한 서버 HW에 대한 설명에서 그치는 것이 아니라

이러한 인프라를 운영할 때 알아야 할 다양한 요소에 대해서도 알차게 설명을 해준다.



내가 있는 팀에 신입 사원이 온다고 하면

여기 이 책에 있는 내용들을 최소한 한 번 즈음 읽고,

내용을 자세히 알지는 못한다고 하여도 대략적인 전체적인 흐름은 익히고 왔으면 좋겠다.



위에 써 있는 내용들을 보면서 대강이라도 어떤 말인지 이해할 수 있는 수준이면 좋겠다.


신입 개발자들에게만 추천하고픈 책은 아니다.

나름 이 바닥에서 적지 않은 기간 동안 일하고 있는 나에게도 많은 도움이 되는 책이다.


주로 어떤 상황에 접하게 되어 주먹구구식으로 알게 된 내용들을 체계적으로 살펴보고 익히기에 정말 괜찮은 책인 것 같다.

말 그대로 어설프게 또는 잘못 알고 있었던 내용들을 바로 잡을 수 있는 좋은 교재이기도 한 것 같다.


"IT에 종사하는 사람이라면 반드시 읽어야 할 책!

 IT 인프라 전반에 대한 상식을 그림으로 쉽게 이해한다!"


책에도 쓰여져 있는 문구이지만, 정말 말 그대로 "IT 상식"을 알려주는 기본서라는 느낌이다.


지금 부서에 있는 신입 사원에게도 꼭 개정판으로 읽어보도록 추천할 것이고,

앞으로 오게 될 신입 개발자에게는 이 책을 공부해서 세미나 발표하도록 시킬 작정이다.



다만, 몇 가지 아쉬운 점도 있었다.


최근 IT 인프라 관련하여 주 트렌드가 되고 있는 가상화나 클라우드에 관련된 내용들도 있으면 좋겠는데

가상화에 대한 내용이 없는 것은 아니지만, 고작 6페이지 분량밖에 없었고,

클라우드와 관련된 사항은 다른 것들을 설명하면서 언급되는 정도이다.

클라우드 환경을 중심으로 하는 서버 구성이나 네트워크, 인증 등에 대한 내용으로 2권이 나왔으면 좋겠다.


그리고,

이왕 그림으로 공부하는 책인데... 그림이 좀 더 colorful 했으면 더더욱 좋지 않았을까 하는 생각을 해본다.

검은색과 파란색을 가지고 표현된 그림을 보면 쪼오오오끔 아쉬웠다.



※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형


이번 달에 리뷰 도서로 당첨된 책은 "데이터 전처리 대전"이다.



데이터 전처리 대전 - 10점
모토하시 도모미쓰 지음, 윤준 옮김/한빛미디어


AI/ML 관련 분야 中 "데이터"에 대한 내용을 담고 있는 책이다.



아직까지도 AI/ML 공부한다고 하면

대뜸 TensorFlow 또는 PyTorch와 같은 것으로

어떻게 Training을 해서 모델을 만들 것인지에 대해서 파고든다.


경사하강법(gradient descent)이 어찌고

오버핏이 어찌고 등등등...



하지만, 제대로된 결과물이 나오기 위해서는

제대로된 입력물이 있어야 한다!!!



즉, 데이터가 중요하다는 말이다 !!!



그러한 데이터를 미리 예쁘고 똑똑하게 처리하는 것이 바로

"데이터 전처리" 이다.






제목도 직관적이고

표지 디자인도 예쁘고

색상도 주황색으로 트랜디 하다!


즉, 책을 딱 보면 괜찮을 것 같다는 기대감을 준다 !!!







원서의 경우 2018년도에 작성이 되었고

번역본은 2019년 11월에 출간이 되었다.

아직 개정판은 없는 것 같다.


음... 시시각각 새로운 것들이 쏟아지는 AI/ML 바닥에서

지금 (20년 11월) 이 책을 봐도 되는 것인지

우려가 되기도 하지만...


데이터를 다루는 부분에 있어서는

책에서 설명하고 있는 내용들이 안될일은 없을 것 같다.


즉, 지금 구매해서 봐도 괜찮다.






이 책은 크게 4개의 파트로 구성되어 있다.


정말 직관적이다.


전처리가 무엇인지 설명해주고 (1부)

구조를 어떻게 손봐야 하는지 알려주고 (2부)

내용도 손봐야 하는 경우 어떻게 할지 알려준 다음에 (3부)

실전에 적용하기 위해 필요한 사항들을 알려준다 (4부)





화려한 것을 좋아하는 개인적인 취향에서 조금 아쉽게도

흑백 인쇄이지만

깔끔한 편집으로

보기 편하게 잘 되어 있다.







번역도 술술 읽힐 정도는 아니지만

그냥 보기에 크게 어색하지 않게 잘 되어 있다.







책 내용은

표지에 명시되어 있는 것처럼


파이썬

SQL

R


3가지 방법으로 설명을 해주고 있다.



즉, 현재 주로 사용하고 있는 언어(도구?)가

저 3가지에 속한다고 하면 아무 부담없이

이 책을 구매해도 될 것 같다.



각 도구(언어?)에 대한 설명은 별도로 없기 때문에

셋 중 하나는 다룰줄 아는 사람에게만

이 책을 권장한다.






이 책에서 사용하는 데이터는 한빛미디어 홈페이지에서 다운로드 받을 수 있다.


http://hanbit.co.kr/support/supplement_survey.html?pcode=B1543811360




역자가 예제 환경 설정 등에 대해서 포스팅을 해준다고 했는데,

1년이 지난 지금까지도 포스팅 안해줬다.


https://junyun0516.github.io/




그냥 데이터나 예제를 github를 통해서 공유해주지....




결론은 ...

1년이 지난 책이지만, 지금 봐도 괜찮은 데이터 전처리 관련 도서이다.






* 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.



반응형

+ Recent posts