파이썬으로 자연어 처리를 하고 싶다면

공부해볼만한 책 한 권을 소개하고자 한다.

 

표지

 

원서 제목은 다음과 같다.

"Blueprints for Text Analytics Using Python"

 

초판

 

발행한지 얼마 안된 따끈따끈한 책이다.

 

원서는 2020년 12월에 출간되었으니

약 2년의 시차가 있어서 조금 아쉽기는 하지만

지금 공부하기 해서 활용하는데에는 부족함이 없다.

 

독자

 

이 책은 텍스트 분석에 대해서 처음 접하는 분들이 아니라

텍스트 분석을 실제 구현하고자 하는 분들을 위한 책이다.

 

제약

 

다만, 기본적으로 영어를 기반으로 하기 때문에

한글 텍스트 분석을 위해서는

추가적인 학습이 필요하긴 하다.

 

원서와 2년의 차이가 있는데,

이왕이면 실습 코드만이라도 한글 지원을 추가해줬으면

훨씬 더 좋았을 것 같다.

 

챕터 개요

 

각 챕터(장)에서 어떤 데이터셋을 사용하고

어떤 라이브러리를 이용했는지

깔끔하게 정리를 해줘서

필요할 때 손쉽게 찾아볼 수 있다.

 

추천 도서

 

이 책에서는 기본적인 이론 등에 대해서 설명해주지 않기 때문에

추가적으로 공부하면 좋을 책들을 추천해주고 있다.

 

심지어 한빛미디어 출판이 아닌 책도 추천을 해준다 ^^

 

본문

 

책은 아쉽게도 흑백이다.

컬러 추종자로써 조금 아쉽다 ^^

 

원서 eBook을 보면 컬러로 나오던데...

 

구성

 

각 챕터(장)별로

학습목표와 데이터셋에 대한 설명을 해준다.

 

해당 챕터에서 뭘 하고자 하는 것인지

어떤 데이터를 가지고 하는 것인지

설명을 해주기에 공부할 때 많은 도움이 된다.

 

 

그리고, 중요한 실습 코드 !!!

 

https://github.com/blueprints-for-text-analytics-python/blueprints-text

 

실습 코드

각 챕터별로

README.md

내용을 너무나 예쁘게 잘 작성해줘서 기분이 좋았다.

 

JupyterNotebook

 

JupyterNotebook 파일도 깔끔하게 작성되어 있다.

 

사실 책 내용을 보면 책에서 설명하고 있는 내용이

JupyterNotebook 파일에 작성되어 있으면

공부할 때 훨씬 더 손쉽게 접근할 수 있을 것 같지만...

그것까지 바라는 것은 욕심인 것 같기도 하고...

 

 

NLP에 대해서 기본적인 사항을 공부한 다음

실제 코드로 만져보고 싶은 분들에게는

엄청 유용한 도움이 될 책이다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형


최근 가장 인기있는 직업


"유튜브 크리에이터"



해당 직업을 갖기 위해서는

유튜브에

자신만의 동영상을

촬영하고 편집해서

업로드를 해야한다.



이렇게

동영상만 업로드하면

엄청난 조회수의

유명 크리에이터가

될 수 있을까?





유명 유튜버가 되기 위한

비법이 담긴

"유튜브 정석"



허팝은 

"허팝과 함께하는 유튜브 크리에이터 되기"

라는 책을

이미 2017년에 출간했었다.






최근 바뀐 트랜드를 반영하고

추가적인 노하우까지 담아서

새로 출간한 책이다.


아직 따끈 따끈~







단순한 영상 편집 기법만 다루는 책이 아니다.


많은 유튜버들이 저작권 이슈로 인해

어려움을 겪었었다.


그러한 저작권 관련한 내용도 설명해주고 있다.






업로드만 했다고

사람들이 봐주지 않는다.


어떻게 업로드를 해야

많은 사람들이 찾아와주는지

구독을 눌러주는지를

설명해주고 있다.







알면 좋은 것들을

정말 꼼꼼하게 넣어주었다.







심지어 캡처 보드의 동작 원리까지~





책 전체가 컬러판이다.

종이질도 고급스럽다는...





솔직히, 큰 기대를 하지 않았었다.


어떤 분야에서 성공한 사람들이 낸 책들을 보면

본인 자랑만 잔뜩 있고


도덕책에 나올만한 내용들로 가득하고


네이버 검색 또는 구글링을 하면

손쉽게 볼 수 있는 내용들로 가득한

그런 쓸모 없는 책들이 대부분이기 때문에...



하지만, 이 책을 살펴보면서

저자가 신경을 많이 쓴 책이라는

생각이 확~ 들었다.



유튜버가 되기 전에 살펴보면

정말 정말 좋은 책이다!


이미 유튜버일지라도

이 책을 통해

많은 것을 배울 수 있을 것이다.




이 책을 택배로 받았을 때

초등 6학년인 딸이 먼저 열어보았는데

재미있다고

책을 가져가버렸었다.


초등학생도 재미있게 볼만한 책인 것은 분명하다.




허팝만 따라 해봐! 유튜브 정석 - 10점
허재원(허팝).안정기 지음/한빛미디어


* 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.


반응형


최근 업무를 하면서 Python을 종종 사용하고 있다.


자료 취합하고, 가공하는 업무에서도 유용하고,

API를 이용한 자동화를 구성하기에도 유용하고,

AI/ML을 할 때에는 거의 de-facto 이다보니...



이와는 별도로 software engineer라는 간판을 달고있다보니

회사에서는 알고리즘 평가에 대한 인증을 요구하고 있다.



python 공부와 함께 알고리즘 공부를

동시에 할 수 있는 방법은 없을까?!




여기에 그 정답이 있다!!!



고전 컴퓨터 알고리즘 인 파이썬

(Classic Computer Science Problems in Python)



표지에 있는 인물 그림이 강력하다!!! ^^

'중국 신부 또는 사제'라고 한다.





최근에 Python 2.x 버전은 공식적으로 지원 종료되었으니

당연하긴 하지만...


이 책에서는 Python 3.7 버전을 기준으로 작성되었다고 한다.





이제는 기억나지도 않는 까마득한 꼬꼬마 시절에

프로그래밍 공부를 막 시작하던 시절이 생각나게 하는 주제들이다.


Pascal 또는 Borland C++, 아니면 Turbo C 등으로 공부했었는데...


공부를 한다고 하긴 했었지만,

체계적인 공부가 아닌 구현에만 급급한 주먹구구 방식이었다.





수포자에게는 낯선 단어일 수도 있는 "피보나치 수열"

하지만, 이 책에서는 친절하게 모두 설명해준다 !!!






이러한 공부를 위한 실습환경은 정말 중요하다 !!!


예전에 C언어 책 소개를 하면서 셋팅했던 구름IDE를 이용하면 편하다.

아래 링크 참고~!!


https://www.whatwant.com/entry/한빛미디어-알쏭달쏭-C언어-180제






솔직히 Python 공부 역시 주먹구구식으로 해왔고,

Python 2.x를 주로 사용해왔기에

이 책에서 제시하는 코드들을 보고 처음에는 조금 당황했다.


function에서의 문법이나, 변수 선언할 때의 문법 등이 새로웠다!!!

뭔가 멋져보여서 배워야겠다고 마음먹었다 ^^






고전 컴퓨터 알고리즘 인 파이썬

(Classic Computer Science Problems in Python)


이 책을 한 문장으로 설명하자면,

고전적인 알고리즘 문제를 Python을 이용해서 공부할 수 있도록 설명해주는 책이다.


고전적인 알고리즘 문제라고 해서

요즘 배울필요가 없는 오래된, 유효기간이 지난 내용이라는 말은 절대 아니다!!!


이 책의 특징은

알고리즘 문제에 대해서 상당히 친절하게 설명을 하고 있고

단순히 그 결과만 도출하는 것이 아니라

성능 좋은 결과를 얻기 위해 풀이해 나가는 과정에 대해서도 차근차근 잘 설명을 해주고 있다.


또한 Python을 이용하여 구현을 하고 있기에

타이핑 후 즉시 결과를 확인하기에도 편리하고

변수의 사용에 있어서도 보다 자유롭다.


또한, Python 3.x의 문법 공부에도 도움을 준다.





욕심 같아서는 하루에 한 문제씩 풀어나가며 공부해봐야겠다!

(솔직히 하루에 한 문제는 무리고... 일주일에 한 문제 정도는... ^^)





고전 컴퓨터 알고리즘 인 파이썬 - 10점
데이비드 코펙 지음, 최길우 옮김/한빛미디어



* 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.

반응형

+ Recent posts