Skip to content

Commit

Permalink
weeek5 first commit
Browse files Browse the repository at this point in the history
  • Loading branch information
jgzkan committed Aug 20, 2024
1 parent b3899ef commit f5ef51d
Showing 1 changed file with 30 additions and 0 deletions.
30 changes: 30 additions & 0 deletions _posts/2024-08-14-[ML기초세션]_5주차.md
Original file line number Diff line number Diff line change
Expand Up @@ -706,3 +706,33 @@ print(np.mean(scores['train_score']), np.mean(scores['test_score']))
# 0.935828414851749 0.8801251203079884
```

### 핵심 패키지와 함수 ###

> scikit-learn
- **RandomForestClassifier**: 랜덤 포레스트 분류 클래스.
- n_estimators 매개변수: 앙상블 구성 트리의 개수를 지정한다.
- criterion 매개변수: 불순도 지정, 기본값은 'gini'고, 'entropy'를 선택하여 엔트로피 불순도를 사용할 수 있다.
- max_depth: 트리 성장 최대 깊이 지정. 기본값은 None으로, 지정하면 리프 노드가 순수하거나 min_samples_split보다 샘플 개수가 적을 때까지 성장한다.
- max_samples_split: 노드를 나누기 위한 최소 샘플 개수고 기본값은 2다.
- max_features: 최적의 분할을 위해 탐색할 특성의 개수를 지정한다. 기본값은 auto로 특성 개수의 제곱근이다.
- bootstrap 매개변수: 부트스트랩 샘플의 사용 유무를 지정. 기본값은 True.
- oob_score: OOB 샘플을 사용하여 훈련한 모델을 평가할지 지정. 기본값은 False.
- n_jobs: 병렬 실행에 사용할 CPU 코어 수를 지정.
- **ExtraTreesClassifier**: 엑스트라 트리 분류 클래스
- n_estimators, criterion, max_depth, min_samples_split, max_features: 랜덤 포레스트와 동일
- bootstrap: 부트스트랩 샘플 사용 유무 지정. 기본값은 False
- oob_score: OOB샘플을 사용하여 훈련한 모델을 평가할지 지정한다. 기본값은 False.
- n_jobs: 병렬 실행에 사용할 CPU 코어 수 지정.
- **GradientBoostingClassifier**: 그레이디언트 부스팅 분류 클래스
- loss: 손실함수 지정. 기본값은 'deviance'로, 로지스틱 손실 함수 의미.
- learning_rate: 트리가 앙상블에 기여하는 정도를 조절, 기본값은 0.1
- n_estimators: 부스팅 단계를 수행하는 트리의 개수, 기본값은 100
- subsample: 사용할 훈련 세트의 샘플 비율 지정, 기본값은 1.0
- max_depth: 개별 회귀 트리의 최대 깊이. 기본값은 3.
- **HistGradientBoostingClassifier**: 히스토그램 기반 그레이디언트 부스팅 분류 클래스.
- learning_rate: 학습률 또는 감쇠율이라 한다. 기본값은 0.1이며 1.0이면 감쇠 x
- max_iter: 부스팅 단계를 수행하는 트리의 개수다. 기본값은 100
- max_bins: 입력 데이터를 나눌 구간의 개수. 기본값은 255이며 최대치다. 여기에 1개의 구간이 누락된 값을 위해 추가된다.



0 comments on commit f5ef51d

Please sign in to comment.