파이썬으로 자연어 처리를 하고 싶다면

공부해볼만한 책 한 권을 소개하고자 한다.

 

표지

 

원서 제목은 다음과 같다.

"Blueprints for Text Analytics Using Python"

 

초판

 

발행한지 얼마 안된 따끈따끈한 책이다.

 

원서는 2020년 12월에 출간되었으니

약 2년의 시차가 있어서 조금 아쉽기는 하지만

지금 공부하기 해서 활용하는데에는 부족함이 없다.

 

독자

 

이 책은 텍스트 분석에 대해서 처음 접하는 분들이 아니라

텍스트 분석을 실제 구현하고자 하는 분들을 위한 책이다.

 

제약

 

다만, 기본적으로 영어를 기반으로 하기 때문에

한글 텍스트 분석을 위해서는

추가적인 학습이 필요하긴 하다.

 

원서와 2년의 차이가 있는데,

이왕이면 실습 코드만이라도 한글 지원을 추가해줬으면

훨씬 더 좋았을 것 같다.

 

챕터 개요

 

각 챕터(장)에서 어떤 데이터셋을 사용하고

어떤 라이브러리를 이용했는지

깔끔하게 정리를 해줘서

필요할 때 손쉽게 찾아볼 수 있다.

 

추천 도서

 

이 책에서는 기본적인 이론 등에 대해서 설명해주지 않기 때문에

추가적으로 공부하면 좋을 책들을 추천해주고 있다.

 

심지어 한빛미디어 출판이 아닌 책도 추천을 해준다 ^^

 

본문

 

책은 아쉽게도 흑백이다.

컬러 추종자로써 조금 아쉽다 ^^

 

원서 eBook을 보면 컬러로 나오던데...

 

구성

 

각 챕터(장)별로

학습목표와 데이터셋에 대한 설명을 해준다.

 

해당 챕터에서 뭘 하고자 하는 것인지

어떤 데이터를 가지고 하는 것인지

설명을 해주기에 공부할 때 많은 도움이 된다.

 

 

그리고, 중요한 실습 코드 !!!

 

https://github.com/blueprints-for-text-analytics-python/blueprints-text

 

실습 코드

각 챕터별로

README.md

내용을 너무나 예쁘게 잘 작성해줘서 기분이 좋았다.

 

JupyterNotebook

 

JupyterNotebook 파일도 깔끔하게 작성되어 있다.

 

사실 책 내용을 보면 책에서 설명하고 있는 내용이

JupyterNotebook 파일에 작성되어 있으면

공부할 때 훨씬 더 손쉽게 접근할 수 있을 것 같지만...

그것까지 바라는 것은 욕심인 것 같기도 하고...

 

 

NLP에 대해서 기본적인 사항을 공부한 다음

실제 코드로 만져보고 싶은 분들에게는

엄청 유용한 도움이 될 책이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형

 

표지

 

최근 전세계적인 어려운 경제 상황에

운명처럼 만나게 된 책

 

"파이썬 기반 금융 인공지능 (Artificial Intelligence in Finance)"

 

초판 1쇄

 

받아본 책은

이제 태어난지 갖 1달 된 따끈따끈한 책이지만...

원서는 2020년에 첫 출간되었었다.

 

First Edition

 

2년이 지난 책이라 조금 아쉬움은 있지만,

그래도 이렇게 번역서가 나온 것만으로도 정말 고마운 일이다.

 


예전에 퀀트 투자 관련된 책을 살짝 살펴본 적이 있었는데

그래서인지 이 책 제목을 보고

제일 먼저 든 생각은

"이 책도 퀀트 투자 관련된 것이겠구나!"

였다.

 

 

그래서 살펴본 목차는 다음과 같다.


[PART I 기계지능]

CHAPTER 1 인공지능
CHAPTER 2 초지능

[PART II 금융과 머신러닝]

CHAPTER 3 규범적 금융
CHAPTER 4 데이터 기반 금융
CHAPTER 5 머신러닝
CHAPTER 6 인공지능 우선 금융

[PART III 통계적 비효율성]

CHAPTER 7 밀집 신경망
CHAPTER 8 재귀 신경망
CHAPTER 9 강화 학습

[PART Ⅳ 알고리즘 트레이딩]

CHAPTER 10 벡터화된 백테스팅
CHAPTER 11 리스크 관리
CHAPTER 12 집행 및 배포

[PART Ⅴ 전망]

CHAPTER 13 인공지능 경쟁
CHAPTER 14 금융 특이점

[PART Ⅵ 부록]

APPENDIX A 상호작용형 신경망
APPENDIX B 신경망 클래스
APPENDIX C 합성곱 신경망

 

 

퀀트 투자 책인 것은 맞지만,

금융 데이터들을 어떻게 AI를 활용하면 좋을지에 대해서

포커스가 맞춰진 책이다.

 

목차 설명

각 목차 앞에서는 어떤 의도로 작성되었는지,

어떤 내용인지에 대해서 설명을 먼저 해주고 있다.


정말 친절하게도 학습 플랫폼도 제공을 해주고 있다.

 

https://aiif.pqp.io/

 

학습 플랫폼

 

이메일 주소를 가지고 계정을 등록해야하는 불편함은 있다.

이메일 인증 후 로그인 하면 다음과 같은 플랫폼을 사용할 수 있다.

 

Jupyter Notebook

 

커널도 제공을 하고 있는 것 같지만,

뭔가 설정을 필요로 하는 것인지...

실제 실행을 하면 에러가 발생했다.

 

커널 에러

 

다운로드 받아서 colab에서 실행을 해보니

잘 된다.

 

colab


금융데이터를 가지고 어떻게 인공지능(AI/ML)을 이용해서

다뤄야 할지 공부할 수 있는 좋은 책이다.

 

이 책에서 다루는 라이브러리는 다음과 같은데,

 

python / scikit-learn / tensorflow / keras

 

일반적으로 많이 사용되는 라이브러리들이기에

많은 분들에게 쉽게 다가설 수 있을 것이다.

 

다만, 소스코드를 제공하는 방식이

사실 조금 불편하긴 하다.

 

본래 플랫폼까지 제공해주려는 의도인 것 같기는 하지만

그냥 GitHub로 제공을 해주고

Colab을 사용하도록 가이드하는 것이

훨씬 더 접근성이 좋지 않았을까 한다.

 

소스코드가 업데이트 된지도 2년이 되었던데,

독자적인 플랫폼 제공이 어떤 의미가 있는지는....

 

언젠가 퀀트 투자를 이용해서 용돈벌이를 할 수 있기를 꿈꾸며

여기까지 서평을 마치겠다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형

 

오랜 시간 Software Engineer로써 살고 있는 고인물이

새로운 세상에 적응하기 위해 딥러닝이라는 것을 공부하려고 할 때

가장 큰 장벽으로 다가오는 것이 바로 수학이다.

 

고등학교 시절 이과를 선택하고 공대에 입학해서 공돌이 생활을 했지만

수학을 정말 싫어하고 못했던 나인데, 이 나이 먹고 다시 수학 공부를 해야하다니!!!

 

하지만, 딥러닝에 대해서 파고들기 위해서는 수학 공부는 필수다.

어쩔 수 없다.

 

그렇지만, 수학 정석부터 시작할 수는 없고, 필요한 내용만 공부를 하려면... ?!

 

표지

 

나온지 얼마 안되는 정말 따끈따끈한 책이다.

원서도 2021년 10월에 출간되었다.

 

1쇄

 

책 제목에 "딥러닝"이 적혀 있다고 해서 알고리즘이나 코드를 설명해주는 책은 절대 아니다.

 

역전파(Backpropagation)와 경사하강법(Gradient Descent)을 이해하기 위한

수학적 배경 지식을 공부하기 위한 수학책이다.

 

"옮긴이의 말"에서도 분명히 이 부분을 말해주고 있다.

 

옮긴이의 말

 

그렇다고 해서 정말 수학 공식만 설명해주고 있는 책은 아니다.

실제 Python 코드를 이용한 구현 방법도 알려주고 있기에 실습을 하면서 공부를 할 수 있다.

 

책의 구성을 살펴보면 다음과 같다.

 

구성 1
구성 2

 

"옮긴이의 말"에서도 언급한 것 처럼

이 책은 `10장 역전파`와 `11장 경사하강법`을 설명하기 위한 책이다.

 

실습환경 구축을 설명해주고 있는 1장을 빼고

2장부터 9장까지는 본론을 말하기 위한 수학적 개념과 공식을 설명해주는 내용으로 채워져 있다.

 

 

책 인쇄는 조금 아쉽게도 풀 컬러는 아니고 (개인적인 취향으로 풀컬러 러버~)

자주색+검은색의 조합이다.

 

샘플

 

책에서 사용된 소스코드는 다음 링크에서 내려 받을 수 있다.

  - https://github.com/rkneusel9/MathForDeepLearning

 

쥬피터노트북(.ipynb)은 아니고, 파이썬(.py) 파일로 제공해주고 있다.

 

 

책의 정오표는 다음 링크의 제일 하단에 있는 `View the latest errata`에서 확인하라고 하는데, 원서 기준이다.

  - https://nostarch.com/math-deep-learning

 

한글판에 대한 정오표가 업데이트 되면 아래 링크에서 확인할 수 있을 것이다.

  - https://jpub.tistory.com/category/오탈자%20정보 

 

 

※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형

 

나의 로컬 환경에서 Jupyter Notebook을 사용하고 싶어서 살펴봤다.

 

0. 실행 환경

  - Ubuntu 18.04 환경에서 진행했지만, 20.04 등 다른 버전에서도 잘 될 것 같다.

 

1. 설치

  - 가장 편한 "pip"를 이용해서 설치해봤다.

$ pip install jupyter

 

pip install jupyter

 

2. 설치 내역

  - Jupyter Notebook은 여러 패키지의 조합이다. 확인해보자.

$ jupyter --version

 

jupyter --version

 

3. 실행

  - Jupyter Notebook을 실행해보자.

$ jupyter notebook

 

jupyter notebook

 

  - 자동으로 브라우저가 실행되며 Jupyter Notebook을 볼 수 있다.

 

jupyter notebook

 

  - 오른쪽 중간에 보이는 "New" 버튼을 통해 새로운 Notebook을 생성하고, 간단한 실행을 해보자.

 

jupyter notebook

 

정말 간단히 Jupyter Notebook 환경을 만들 수 있다.

서버로 구동하거나 비밀번호를 등록하는 등의 추가 설정은 별도의 포스팅으로 작성해보도록 하겠다.

 

반응형

 

사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서

Introduction to Machine Learning with Python

파이썬 라이브러리를 활용한 머신러닝 (번역개정2판)

 

표지

 

C / C++ / Java 등의 프로그래밍 언어를 공부하고

Linux, Server, Network 등에 대해서 경험을 쌓아오며 지금까지 밥벌이를 해온 나에게

머신러닝 / 딥러닝 이라는 신문물이 등장하면서 상당한 당혹감을 느낄 수 밖에 없었다.

 

그래서 먹고 살기 위해 머신러닝에 대해 공부를 시작할 수 밖에 없었는데,

벡터, 행렬, 접선, 미분 ... 나를 괴롭히는 수학 !

이과생이지만 사실 수포자인 나에게 정말 가혹한 현실이 아닐 수 없다.

 

지금까지 Software Engineer로 먹고살아온 나로써는

이러한 수학적인 접근 보다는

라이브러리를 이용한 활용 중심으로도 접근해보고 싶다는 생각이 있었다.

 

이에 걸맞는 책이 바로 이 책이 아닐가 싶다.

 

번역개정2판 1쇄

 

나와 같은 Needs가 있는 사람이 적지 않았던 것 같다.

2017년 초판에 이어 개정판을 한 번도 아니고 두 번째나 발행 한 것을 보면 말이다.

 

번역개정2판 특징

 

그런데, 개정을 해주는 것만으로도 감지덕지인데, 그냥 그저 그런 수정판이 아니다.

scikit-learn 1.x 버전에 맞춰 업데이트 된 것 뿐만 아니라 내용도 더 추가가 되었다.

 

구성

 

오래된 이미 검증된 책이라 그런지

책의 전체적인 구성도 너무나 잘 요약해서 설명해주고 있다.

 

저자 인터뷰

 

한국어판을 위한 저자 인터뷰도 실려있다.

형식적인 인터뷰가 아니라 독자들의 질문에 대한 답까지 포함된

저자의 솔직한 심경도 그대로 담겨진 그런 인터뷰다.

 

한국어판 부록

 

목차를 보면 한국어판에서 추가된 항목을 볼 수 있다.

Chapter 한 개당 하나 정도씩 추가 되어 있고, 그 내용도 정말 충실하다.

 

술술

 

개조식 서술 방식이 아니라 이야기 하는 방식으로 풀어나가는 책 내용도 정말 마음에 든다.

말 그대로 술술 읽어나가며 공부할 수 있기에 책에 대한 부담감이 훨씬 적게 느껴지기 때문이다.

 

 

그리고 이 책의 가장 큰 장점 중 하나라고 꼽고 싶은 예제 파일 !!!

  - https://github.com/rickiepark/intro_ml_with_python_2nd_revised

 

옮긴이 박해선님이 훨씬 더 좋게 업그레이드 해준 내용을 담고 있다.

 

 

최근 딥러닝의 인기에 조금 버림받은 것 같은 느낌이 들긴하지만

사실 대부분의 문제는

scikit-learn으로 구현되는 머신러닝으로 해결하는 것이 훨씬 더 효율적이지 않을까 한다.

 

머신러닝 또한 수학적인 배경을 갖고 깊이 공부하는 것이 중요하긴 하지만

활용을 중심으로 scikit-learn 라이브러리 활용에 대해 공부하는 것도 괜찮은 접근일 것이다.

 

 

요즘 공부할 것이 너무 많아 걱정이긴 하지만

꼭 공부해야할 책 목록에 이 책을 꼭 포함시킬 것이다 !!!

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형

개발자들에게 가장 유명한 사이트 中 하나인 GitHub.com에서는

매년 Octoverse라는 이름으로 1년간의 성과와 통계를 공개한다.

- https://octoverse.github.com/

 

Octoverse

 

그러면 Python은 2021년에 몇 번째로 사랑받았을까?!

 

Top Language

 

JavaScript에 이어 2번째로 인기있는 언어가 바로 Python이다.

 

 

그러면 Python을 공부하기에 좋은 책은 어떤 것이 있을까?!

 

혼자 공부하는 파이썬

 

책 표지에도 딱! 나와있듯이 "파이썬 분야 1위" 책이다 !!!

 

10쇄

 

그렇다! 무려 10쇄 !!!

 

많이 팔리는 책에는 분명히 이유가 있을 것이다.

 

학습가이드

 

혼공학습단

 

책 제목에 분명히 써 있듯이 "혼자 공부"하기에 정말 최적의 Python 서적인 것이다.

 

실제 해당 사이트에 가보면 정말 많은 것을 제공해주고 있다.

- https://hongong.hanbit.co.kr/%ed%8c%8c%ec%9d%b4%ec%8d%ac/

 

공식사이트

 

정말 고맙게도 동영상 강의도 무료로 제공해주고 있다.

 

동영상

 

혼자서 공부하자니 동기부여가 잘 안된다면

한빛미디어에서 정기적으로 모집하는 "혼공학습단"과 같은 이벤트에 참여하면 경품까지고 노릴 수 있다.

 

 

책 내용도 보면 정말 친절하기 그지없다.

줄 간격도 여유있게 되어 있어서 보기에 부담스럽지 않다.

 

샘플

 

얼마나 친절하냐면,

코딩 전용 폰트 설치하는 것까지 책은 물론이고 동영상으로도 설명을 해준다.

 

코딩 전용 폰트

 

조금 아쉬운 점은 예제소스를 다운로드 받아서 사용해야 한다는 점인데...

사실 github.com에서 검색하면 누군가 올려놓은 소스코드들을 쉽게 찾아볼 수는 있다.

 

예제소스

 

총평하자면,

혼자서 Python을 공부하기에는 가장 최적의 선택

무료 동영상 및 많은 커뮤니티를 통한 다양한 자료 활용 가능

다만, 정말 처음으로 Python을 공부하는 사람에게 적합

중급 이상에게는 너무 쉬운 책

반응형

Hacker News Digest 메일을 보다가 자극적인 문구를 보고 살펴보게 된 article이다.

 

 

WTF Python: Exploring and understanding Python through surprising snippets

번역해보면 "빌어먹을 파이썬: 놀라운 코드 조각을 통해 파이썬을 탐험하고 이해해보자" 라고 하면 될라나?!

 

 

# 링크 : github.com/satwikkansal/wtfpython

 

satwikkansal/wtfpython

What the f*ck Python? Contribute to satwikkansal/wtfpython development by creating an account on GitHub.

github.com

 

실제 사이트에 가보면 아래와 같은 문구가 반긴다.

 

 

What the f\*ck Python! 😱

 

 

아무래도 Python 공부하면서 고생을 많이 하신 분인가 보다.

 

 

중국어와 특이하게도 베트남어 번역이 있다.

자동 번역기로라도 한국어를 PR 해볼까?!라는 생각이 들었다. 음... 고민중...

 

 

Python 왕초보에게는 별 도움이 되지 않을 것 같고, (괜히 햇갈릴 수 있을 내용이 많다!)

어느정도 다룰줄 아는 분이라면 여기에 있는 내용을 살펴보면 재미있을 것 같다.

 

 


>>> a = "wtf"
>>> b = "wtf"
>>> a is b
True

>>> a = "wtf!"
>>> b = "wtf!"
>>> a is b
False

 

 

위와 같은 상황이 이해가 되나?! ^^

반응형


최근 회사에서 업무로도 파이썬을 자주 사용하게 되고, 개인적으로 하는 작업에서도 파이썬을 자주 사용한다.

하지만, 대부분 CLI 환경으로만 사용해왔지, GUI 환경이 필요한 경우에는 다른 언어를 사용하곤 했다.


더구나, 게임 개발을 할 때 파이썬을 사용한다고는 더더욱 생각하지 못했다.


그런데, 이렇게 파이썬으로 게임 개발을 알려준다는 책이 등장했다 !!



아니, 그런데 표지에 저런 캐릭터를 ... ?



친절하게 학습을 도와준다니~ 고마워요 !!!




역시나, 일본 출신의 저자다! ^^

거기에다가 남코, 닌텐도, 코나미 등에서 근무를 했다니... 와우~!!




게임 개발이 주요 컨텐츠이지만,

파이썬이라는 언어에 대해서도 충실한 책이다.



Chapter1 에서부터 Chapter4 까지 기본적인 문법들을 설명하고,

Chapter5 에서는 CLI로 간단하게 게임 비슷한 것을 만들어 본 다음에

Chapter6 부터 본격적으로 GUI 환경으로 게임 개발을 설명해 주고 있다.



입문편이긴 하지만,

그래도 그럴듯한 모습의 게임도 설명해준다.



게임 개발을 한다고 하면 어떤 것들을 해야 하는지 파악할 정도는 된다.





이 책의 특징은 앞에서도 말했지만,

예쁜 2D 캐릭터들을 사용해서 친근한 분위기를 만들어준다는 것이다.



캐릭터 설명도 이렇게 해준다.

각 캐릭터의 배경 설정도 존재 한다.



각 챕터의 앞에서는 이렇게 요약 설명도 해주고,



챕터 중간에 알면 좋은 내용들을 설명도 해준다.




단순하게 2D 캐릭터만 있다고 좋은 것이 아니라

설명에 필요한 이미지들이 colorful 하면서도 너무나 보기 좋게 삽입되어 있다.



이미지나 색상이 너무나 멋들어지게 들어있어서 책을 보면서 계속 기분이 좋았다.







이런 책을 공부할 때 중요한 것 中 하나가 바로 개발 환경을 갖추는 것이다.

책에서는 Windows & Mac 에서 필요한 환경 설치하는 것을 설명해주고 있다.




Ubuntu(우분투)와 같은 리눅스 환경에서는 해볼 수 없는 것일까?


아니다~!! 할 수 있다~!! ^^



Ubuntu Desktop 18.04 환경을 기준으로 설명을 하면 아래와 같다.



표준 사항으로 Ubuntu Desktop 18.04 버전을 설치했다면 Python 2.x 버전이 설치되어 있을 것이다.

하지만, 이 책에서는 Python 3.x 버전으로 되어 있기 때문에, Python 버전부터 맞춰야 한다.



1. Python 버전 변경하기 ( 2.x → 3.x )


    - python3 설치 및 update-alternatives 이용한 기본 실행 버전 설정해주기

    - https://www.whatwant.com/entry/Python3-환경-만들기-버전-변경하기-in-Ubuntu



2. GUI library 설치하기


    - 이 책에서 기본으로 사용하는 GUI library는 tkinter 이다.


    - $ sudo apt install python3-tk



3. VSCode (Visual Studio Code) 설치하기


    - 이 책에서는 IDLE를 이용해서 python을 사용하지만, 최근 트렌드에 맞춰서 VSCode를 사용해보자.


    - $ wget https://code.visualstudio.com/sha/download\?build\=stable\&os\=linux-deb-x64 -o vscode.deb

    - $ sudo dpkg --install vscode


    - VSCode 실행 후 "Python Extension" 인스톨




이 책에서 사용하는 예제 코드는 아래 주소에서 확인해볼 수 있다.


    - https://github.com/Jpub/PythonGame_1




해당 소스 코드를 내려 받아서 실행하면 아래와 같은 화면을 볼 수 있다.





개인적으로 이 책은

가볍게 살펴보기에 너무 너무 좋았다.


설명도 친절하게 너무나 잘되어 있었고

책 구성도 보기 편하게 너무나 잘 되어 있어서 인지 책을 살펴보는데 별 부담이 없었다.

그리고 소스 코드도 그냥 바로 실행만 하면 테스트해볼 수 있게 되어 있어서 너무 좋았다.




이 책을 추천하고 싶은 경우는,

가벼운 게임 개발을 경험해 보고 싶거나 파이썬을 이용해서 GUI 결과물을 만들어 보고 싶은 경우 기꺼이 추천할 수 있을 것 같다.




아쉬운 부분을 찾아보고 싶은데....

사실 개인적으로 아쉬운 부분을 찾아볼 수가 없었다 ^^ (개취 존중!! ^^)

음... 굳이 꼽아보자면, 파이썬 기본에 대한 소개를 굳이 4개 챕터에 걸쳐서 해야했는지... 정도!?




※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형

+ Recent posts