'혼공학습단' 태그의 글 목록 (2 Page)

혼공학습단

[혼공머신] 4주차 - CH05. 트리 알고리즘 2024.07.30
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 2024.07.22
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 2024.07.07
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 2024.07.07

[혼공머신] 4주차 - CH05. 트리 알고리즘

2024. 7. 30. 01:14

가족 여행 및 대학원 MT로 인해... 엄청난 지각 공부를 한다.

미리 하지 못했음에 대해 반성 !!!! 무릎 꿇고 반성 !!!

05-1 결정 트리 (Decision Tree)

- 로지스틱 회귀 (Logistic Regression)

- 결정 트리 (Decision Tree Classifier), 가지 치기(Prunning)

05-2 교차 검증과 그리드 서치

- 검증 세트 (validation)

- 교차 검증 (Cross Validation)

. 분할기(Splitter)를 사용한 교차 검증 : StratifiedKFold

- 하이퍼파라미터 튜닝 (Hyperparameter Optimization)

. 그리드 서치 (GridSearchCV)

. 확률 분포 선택 : uniform, randint

. 랜덤 서치 (RandomizedSearchCV)

05-3 트리의 앙상블 (Ensemble)

- 정형 데이터와 비정형 데이터

. 텍스트/오디오/이미지/영상 등의 비정형 데이터는 주로 DL 에서 취급

- 랜덤 포레스트 (RandomForest)

- 엑스트라 트리 (ExtraTrees)

- 그래디언트 부스팅 (Gradient Boosting)

- 히스토그램 기반 그래디언트 부스팅 (Histogram Gradient Boosting)

- XGBoost vs LightGBM

기본 숙제 : 교차 검증을 그림으로 설명하기

추가 숙제 : 앙상블 모델 손 코딩

- 전체를 캡처하는 것은 무의미한 것 같아, 하단부 부분만 캡처 !!!

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 6주차 - CH.07 딥러닝을 시작합니다 (3)	2024.08.25
[혼공머신] 5주차 - CH.06 비지도 학습 (0)	2024.08.16
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 (0)	2024.07.22
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07

[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘

2024. 7. 22. 03:07

어느덧 벌써 4장을 공부하고 있는 3주차가 되었다.

만날 일요일 밤에 벼락치기하고 있는 불량한 참가자 신세이지만....

이렇게라도 공부하려하는 스스로를 기특해 해야지 !!!!! 쓰담~ 쓰담~

04-1 로지스틱 회귀 (Logistic Regression)

- 분류 (Classifier) 모델

- vs. KNeighborClassifier

- 이진 분류 : 시그모이드(Sigmoid)

- 다중 분류 : 소프트맥스(Softmax), parameter C

04-2 확률적 경사 하강법 (Stochastic Gradient Descent)

- 점진적 학습 → 확률적 경사 하강법

- 손실함수 (loss function)

- 로지스틱 손실 함수 (logistic loss function, Binary Cross-Entropy loss function)

- partial_fit()

가제트 형사를 그려주신 것 같은데... MZ(GenZ?) 분들은 아시려나!? ㅋㅋㅋ

Homework

[기본 숙제]

- ① 시그모이드 함수(Sigmoid Function)

→ 기본적으로 선형 함수만 사용하는 경우 결과값이 너무 커지거나 너무 작아질 수 있으므로

비선형 함수를 이용하여 값을 수렴하게 만드는 것이 계산하기에 용이해진다.

이 때, 로지스틱 회귀에서 이진 분류를 사용하는 경우 시그모이드 함수를 이용하면

0에서 1사이의 값으로 변환이 되며, 0.5를 기준으로 0과 1로 결과를 판단하기에 적합하다.

[추가 숙제]

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 5주차 - CH.06 비지도 학습 (0)	2024.08.16
[혼공머신] 4주차 - CH05. 트리 알고리즘 (0)	2024.07.30
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 (0)	2024.07.07

[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제

2024. 7. 14. 23:55

고작 2주차인데, 뭔가 많다!

그런데, 여기서 끝이 아니라 뒤에 좀 더 있다!!!

다시 한 번 느꼈지만, 이 책은 절대 초보자를 위한 책이 아니다 !!!

03-1. K-최근접 이웃 회귀 (K-NN Regression)

- n_neighbors 파라미터를 이용하여 최근접 이웃과의 거리 평균을 이용하여 회귀

- 과대적합 vs. 과소적합

- n_neighbors 값 변경을 통해 과대적합, 과소적합 이슈 해결

03-2. 선형 회귀 (Linear Regression)

- coef_, intercept_

- 과대/과소 적합 이슈 → 다항 회귀

03-3. 특성공학과 규제

- 다항 특성 만들기 : PolynomialFeatures

- 규제 전에 표준화 : StadardScaler

- Ridge & Lasso

기본 숙제

동영상 강의에 얼추 나와있는 내용이라 어렵지 않다 ^^

n_neioghbors 값을 바꿔가면서 예측하고, 이것을 그래프로 표현하면 된다.

눈으로 봐도 얼추 5값이 적당하지 싶다~

추가 숙제

[ 모델 파라미터에 대해 설명하기 ]

파라미터는 머신러닝 및 딥러닝 모델의 핵심 요소로써,

모델이 데이터를 통해 학습하고 예측을 수행하는 데 필요한 내부 변수들을 의미한다.

이 값들을 적절히 조정하게 되면 모델은 주어진 문제를 효과적으로 해결할 수 있게 된다.

K-최근접 이웃 회귀(K-NN Regression) 챕터에서 n_neighbors 값을 조정하면서

과대적합이나 과소적합 문제를 완화하는 과정을 앞에서 살펴보았는데

여기에서 n_neighbors가 바로 모델 파라미터 중 하나이다.

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 4주차 - CH05. 트리 알고리즘 (0)	2024.07.30
[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 (0)	2024.07.22
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 (0)	2024.07.07
[혼공데분] 6주차_복잡한 데이터 표현하기 (0)	2024.02.09

[혼공머신] 1주차 - CH02. 데이터 다루기

2024. 7. 7. 23:22

첫 주는 조금 여유로울줄 알았는데, 공부할게 많다.

02-1. 훈련 세트와 테스트 세트

확인 문제를 통해 이 부분을 공부해보자.

1. 머신러닝 알고리즘의 한 종유로서 샘플의 입력과 타깃(정답)을 알고 있을 때 사용할 수 있는 학습방법은 무엇인가요?

- 머신러닝은 크게 지도학습과 비지도학습으로 구분할 수 있고, 정답을 알고 있는 경우 지도학습을 적용한다.

→ ① 지도학습

2. 훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상을 무엇이라고 부르나요?

- 훈련 세트와 테스트 세트를 만들 때 전체적인 데이터 분포를 유지하는 것이 중요하며 그렇지 못한 경우 편향을 보인다.

→ ④ 샘플링 편향

3. 사이킷런은 입력 데이터(배열)가 어떻게 구성되어 있을 것으로 기대하나요?

- 문제 해석이 조금 오해의 여지가 있어 보이지만, 특성은 열(column)로 나열되어 있고 데이터의 구분은 행으로 된다.

→ ② 행: 샘플, 열: 특성

02-2. 데이터 전처리

이 책은 초보자를 위한 수준은 아닌 것 같고, 기본 지식이 좀 있어야 따라갈만한 것 같다.

어쩐지 처음 이 책으로 공부할 때 왠지 자괴감이 좀 들더라니..... ㅠㅠ

분산 = 기대값(평균)으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자

표준편차 = 분산의 제곱근

표준화(Standardization) = 평균을 0, 분산을 1로 만들어주는 스케일링 기법 (Z-Score 활용)

기본이 될만한 것들을 같이 정리하면서 공부해봐야겠다.

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 3주차 - CH04. 다양한 분류 알고리즘 (0)	2024.07.22
[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH01. 나의 첫 머신러닝 (0)	2024.07.07
[혼공데분] 6주차_복잡한 데이터 표현하기 (0)	2024.02.09
[혼공데분] 5주차_데이터 시각화하기 (0)	2024.02.01

[혼공머신] 1주차 - CH01. 나의 첫 머신러닝

2024. 7. 7. 22:31

새해를 맞이하여 야심찬 목표를 세우고 힘차게 달리다가 ... 살짝 지치기도 하고 ... 번아웃도 오고 ...

그러던 와중 또 다시 심장을 뛰게 해주는 혼공학습단 12기 모집 공지를 발견했다 !!!

그리고, 정말 고맙게도 지원을 받아주셔서 12기로 활동(공부?)하게 되었다 !!!

이번에 공부할 책은 바로~ 바로~

"혼자 공부하는 머신러닝+딥러닝"

책을 구매한지는 정말 오래되었는데, 사실 완독하지는 못했었다.

예전에 무심코 지나갔던 책 안의 중요한 정보~!!!

이제서야 함께 합니다 !!!

6주 코스, 열심히 완주해야지 !!!

https://hongong.hanbit.co.kr/혼공-게시판/?uid=162&mod=document&pageid=1

개인적으로 너무나 존경하고 애정하는 "박해선"님의 서적인만큼,

책 자체의 퀄리티도 너무나 훌륭하고 예제 및 동영상 등 부수적인 부분들도 너무나 훌륭하다.

https://www.youtube.com/playlist?list=PLVsNizTWUw7HpqmdphX9hgyWl15nobgQX

저 동영상 녹화할 때 몇 번 라이브에 참여도 했었는데 ^^

우리를 공부시키기 위해 박해선님은 정말 많은 고민을 하시는 것 같다 ^^

챕터 구성에 대해서도 많은 고민의 흔적이 엿보인다.

뭔가 서론이 길었다!

이제 시작해보자.

Chapter 01. 나의 첫 머신러닝

01-1. 인공지능과 머신러닝, 딥러닝

박해선님은 직접 그린 그림과 글씨를 좋아하시는 것 같다 ^^

https://www.youtube.com/watch?v=J6wehCO_c58

01-2. 코랩과 주피터 노트북

이제는 이 책이 나온지도 조금 시간이 지나서

사용한 도구/패키지들의 버전들이 좀 옛날 것들이다.

Colab에 들어가서 기본적으로 설치된 Python 버전만 확인해봐도 좀 차이가 발생한다.

직접 실습들을 해보면서 버전 차이로 발생하는 것들이 있는지 확인해보면 재미있을 것 같다.

01-3. 마켓과 머신러닝

타이틀이 조금 웃기는데, 저런 제목이 나온이유는 다음과 같다.

https://www.youtube.com/watch?v=GOCVVSMeIf8

머신러닝을 공부하기 위해서 문제 상황을 다음과 같이 가정해보자.

- 생선을 파는 마켓이 있다.

- 생선의 크기나 무게를 가지고 그 생선이 무엇인지 맞추고 싶다.

동영상 강의 듣다보면 소음(?) 이슈가 있는데,

라이브로 참여했었을 때 마이크 켜 놓은 참석자가 한 명 있어서 조금 짜증났던 기억이 있다.

메시지로 그 사람한테 계속 뭐라했는데 강의를 듣지도 않았던 것 같고 메시지도 보지도 않았던 나쁜 사람 !!! ㅋㅋㅋ

첫 실습 내용인데,

첫번째 실습 내용부터 이렇게 쭉~ 진도를 나간다는 것이 조금 당황스럽기는 한데 ...

일단 Chapter01 진도는 여기까지!

저작자표시 비영리 변경금지 (새창열림)

'Books' 카테고리의 다른 글

[혼공머신] 2주차 - CH03. 회귀 알고리즘과 모델 규제 (0)	2024.07.14
[혼공머신] 1주차 - CH02. 데이터 다루기 (0)	2024.07.07
[혼공데분] 6주차_복잡한 데이터 표현하기 (0)	2024.02.09
[혼공데분] 5주차_데이터 시각화하기 (0)	2024.02.01
[혼공데분] 4주차_데이터 요약하기 (0)	2024.01.28

PREV 1 2 NEXT

머가필요해