Decision Tree가 어떻게 Regression을 수행하는 지에 대해서 알아보겠습니다.
<루트노드 선택하기>
1. 각 독립변수와 독립변수간의 평균을 구합니다.
2. 구해진 평균을 기준으로 데이터를 분기합니다.
3. 나누어진 데이터의 종속변수의 평균과 실제 종속변수들의 residual을 계산합니다.
4. squared error, absolute error, friedmann_mse, poisson 중 하나를 사용해 계산합니다.
5. 가장 잔차가 작은 분기가 루트노드가 됩니다.
<자식노드 만들기>
1. 분기된 데이터의 좌, 우 공간을 루트노트를 선택했던 것 처럼 잔차를 계산하여 다시 분기
합니다.
2. 만약 max_depth 같은 제한에 도달했다 거나 더 이상 나눌 수 없을 때는 분기 하지 않습니
다.
<Decision Tree Regressor는 어떻게 예측하는가? >
1. 분기된 구간의 평균값을 예측에 사용합니다.
0 comments:
댓글 쓰기