요즘에는 새로운 언어가 너무 쏟아져서 굳이 R까지 배워야 하나 싶은 마음에 지금까지 R 언어와 관련된 것은 피해왔다.
Machine Learning 초창기에는 R이 유행하였지만, 지금은 솔직히 Python으로 못할게 없기에 더더욱... 😁

그래서 "R을 이용한"이라는 말이 붙어있어서 이 책 또한 살짝 피하고 싶었지만,
퀀트 투자를 위해 중요한 요소인 데이터 수집에 대해서 자세히 나온 책이라 하여 나름 과감하게 도전해보기로 하였다.

 

책 표지

 

전체적으로 13개의 Chapter가 있는데,
거의 반을 차지하는 6개의 Chapter가 데이터 수집과 관련된 내용이고
2개 챕터가 데이터 정리 및 분석과 관련한 내용이다.
그 다음 9장부터 본격적으로 종목 선정하고 포트폴리오 구성하고 평가하는 것들을 설명해주고 있다.

이 책은 R 언어를 기본적으로 사용할 줄 아는 사람들을 대상으로 하고 있다.
그래서 안타깝게도 실습 환경 구축을 위한 과정 등을 설명해주지 않는다. 😥

 

 

저자는 독자들을 위해서 다음과 같은 온라인 지원을 해주고 있다.

 

- 웹페이지: hyunyulhenry.github.io/quant_cookbook

 

R을 이용한 퀀트 투자 포트폴리오 만들기(개정판)

본 페이지는 R을 이용한 퀀트 투자 포트폴리오 만들기의 웹사이트 입니다. 책의 수정 사항이 있을시 즉시 반영할 예정이며, 책에서 다루지 못했던 추가적인 내용도 지속적으로 업데이트 할 예정

hyunyulhenry.github.io

- GitHub: github.com/hyunyulhenry/quant_cookbook

 

hyunyulhenry/quant_cookbook

R을 이용한 퀀트 투자 포트폴리오 만들기. Contribute to hyunyulhenry/quant_cookbook development by creating an account on GitHub.

github.com

- Blog: henryquant.blogspot.com

 

Henry's Quantopia

금융, 주식, 퀀트 투자에 대한 블로그입니다. 연구 결과 및 투자 결과를 정기적으로 업로드 합니다.

henryquant.blogspot.com

 

 

특히, 웹페이지의 경우에는 (책이 안팔리지 않을까 우려되어 알려드리기가 좀 조심스럽지만 ^^)

책 내용을 그대로 제공해주고 있다. 우와아~~~~ 😻

 

심지어, 책의 경우 2색 인쇄이지만, 웹페이지는 풀컬러로 제공이 된다 👍

 

 

뭐 일단 웹페이지를 통해서 공부하여도 좋지만,

개인적인 경험으로는 책을 사서 공부하는 것이 조금이라도 더 공부를 하게 되더라는 ... 👩‍🚀

 

 

퀀트 투자를 하기 위해서는 다양한 데이터가 필요하기에

이 책에서는 그러한 데이터를 수집하는 방법을 알려주고 있다.

 

물론 비싼 비용을 지불하면 손쉽게 데이터를 얻을 수 있지만... 우리가 좋아하는 것은 Free !!! 💛

 

이 책에서는 API를 이용해 데이터를 수집하는 방법을 시작으로 해서

HTML을 파싱하는 방법을 통해 공시를 받아오기도 하고 주식티커를 통해 데이터를 얻어오기도 한다.

 

또한 시각화를 통해 데이터를 분석하는 방법도 구체적으로 설명해주고 있으며,

종목을 선정하는 방법들에 대해서도 구체적으로 설명해주고 있다.

 

다만, R 언어를 이용한 프로그래밍적인 부분에 대해서 힘을 주다보니

퀀트 투자에 대한 설명 부분이 많지 않은 것은 조금 아쉽다.

 

 

그래서, 저자가 앞서 출간했던 책을 같이 살펴보면 더 좋을 것 같다.

    - www.yes24.com/Product/Goods/56018775?Acode=101

 

SMART BETA (스마트 베타)

주식투자의 새로운 흐름, 스마트베타현명한 베타를 통해 알파를 추구하라!오래 두고 볼 수 있는 퀀트 투자 교과서 쉬지 않고 변화하는 주식시장에서, 스마트베타는 `장기적으로 주가지수 이상

www.yes24.com

 

기존에 다른 퀀트 투자 책을 보면서 실제 구현에 대한 부분이 아쉬웠는데,

이 책에서는 실제 데이터들을 수집해서 구현하는 내용들을 자세히 설명해주고 있어서 너무 좋았다.

 

 

※ 제이펍 서평단 활동을 위해 지급 받은 도서에 대한 리뷰입니다.

반응형


이번 달에 리뷰 도서로 당첨된 책은 "데이터 전처리 대전"이다.



데이터 전처리 대전 - 10점
모토하시 도모미쓰 지음, 윤준 옮김/한빛미디어


AI/ML 관련 분야 中 "데이터"에 대한 내용을 담고 있는 책이다.



아직까지도 AI/ML 공부한다고 하면

대뜸 TensorFlow 또는 PyTorch와 같은 것으로

어떻게 Training을 해서 모델을 만들 것인지에 대해서 파고든다.


경사하강법(gradient descent)이 어찌고

오버핏이 어찌고 등등등...



하지만, 제대로된 결과물이 나오기 위해서는

제대로된 입력물이 있어야 한다!!!



즉, 데이터가 중요하다는 말이다 !!!



그러한 데이터를 미리 예쁘고 똑똑하게 처리하는 것이 바로

"데이터 전처리" 이다.






제목도 직관적이고

표지 디자인도 예쁘고

색상도 주황색으로 트랜디 하다!


즉, 책을 딱 보면 괜찮을 것 같다는 기대감을 준다 !!!







원서의 경우 2018년도에 작성이 되었고

번역본은 2019년 11월에 출간이 되었다.

아직 개정판은 없는 것 같다.


음... 시시각각 새로운 것들이 쏟아지는 AI/ML 바닥에서

지금 (20년 11월) 이 책을 봐도 되는 것인지

우려가 되기도 하지만...


데이터를 다루는 부분에 있어서는

책에서 설명하고 있는 내용들이 안될일은 없을 것 같다.


즉, 지금 구매해서 봐도 괜찮다.






이 책은 크게 4개의 파트로 구성되어 있다.


정말 직관적이다.


전처리가 무엇인지 설명해주고 (1부)

구조를 어떻게 손봐야 하는지 알려주고 (2부)

내용도 손봐야 하는 경우 어떻게 할지 알려준 다음에 (3부)

실전에 적용하기 위해 필요한 사항들을 알려준다 (4부)





화려한 것을 좋아하는 개인적인 취향에서 조금 아쉽게도

흑백 인쇄이지만

깔끔한 편집으로

보기 편하게 잘 되어 있다.







번역도 술술 읽힐 정도는 아니지만

그냥 보기에 크게 어색하지 않게 잘 되어 있다.







책 내용은

표지에 명시되어 있는 것처럼


파이썬

SQL

R


3가지 방법으로 설명을 해주고 있다.



즉, 현재 주로 사용하고 있는 언어(도구?)가

저 3가지에 속한다고 하면 아무 부담없이

이 책을 구매해도 될 것 같다.



각 도구(언어?)에 대한 설명은 별도로 없기 때문에

셋 중 하나는 다룰줄 아는 사람에게만

이 책을 권장한다.






이 책에서 사용하는 데이터는 한빛미디어 홈페이지에서 다운로드 받을 수 있다.


http://hanbit.co.kr/support/supplement_survey.html?pcode=B1543811360




역자가 예제 환경 설정 등에 대해서 포스팅을 해준다고 했는데,

1년이 지난 지금까지도 포스팅 안해줬다.


https://junyun0516.github.io/




그냥 데이터나 예제를 github를 통해서 공유해주지....




결론은 ...

1년이 지난 책이지만, 지금 봐도 괜찮은 데이터 전처리 관련 도서이다.






* 이 책은 한빛출판네트워크의 '나는 리뷰어다' 이벤트를 통해 제공 받은 도서입니다.



반응형

+ Recent posts