Gradient Boosting Classifier์ ์ฒซ๋ฒ์งธ ํธ๋ฆฌ๋ฅผ ์ ๊ฑฐํ๋ฉด ๋ฌด์จ ์ผ์ด ๋ฐ์ํ๋๊ฐ?
Gradient Boosting ๐
Gradient Boosted Tree๋ ํ๋์ ํธ๋ฆฌ์ ๋ํด์ ํ์ตํ๊ณ ์ค๋ถ๋ฅ๊ฐ ์ผ์ด๋ ๋ถ๋ถ์ ์ง์ค์ ์ผ๋ก ํ์ตํจ์ผ๋ก์จ ์์ธก์จ์ ๋์ด๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ๊ทธ๋์ Gradient Boosted Tree์ ํ์ดํผํ๋ผ๋ฏธํฐ ์ค์๋ n_estimator : ํธ๋ฆฌ์ ๊ฐ์๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด์ n_estimator๊ฐ 5000์ด๋ผ๋ฉด 5000๊ฐ์ ํธ๋ฆฌ์ ๋ํด์ ์์ฐจ์ ์ธ ๋ถ๋ฅ๋ฅผ ์งํํ๊ฒ ๋ฉ๋๋ค.
Number of Trees ๐ฒ
๋ง์ผ ์ถฉ๋ถํ ์์ ํธ๋ฆฌ๋ฅผ ์ฐพ์๋ค๋ฉด ํธ๋ฆฌ๊ฐ ๋ ๋ง๋ค๊ณ ํด์ ์์ธก์ด ๋ ์ ์ผ์ด๋์ง ์์ผ๋ฉฐ, ์์ธก ์ฑ๋ฅ์ ๋์ฑ ํฅ์์ํค์ง ์์ต๋๋ค. Random Forest๊ฐ ๋ณ๋ ฌ์ ์ผ๋ก ํธ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๋ค๋ฅด๊ฒ Gradient Boosting Tree๋ ์์ฐจ์ ์ผ๋ก ๊ณ์ฐ์ด ์ผ์ด๋ฉ๋๋ค. ๋ฐ๋ผ์ ํธ๋ฆฌ์ ์์์ ์ฑ๋ฅ์ ๊ด๊ณ๋ฅผ ํ์ ํด ๋ณด๊ฒ ์ต๋๋ค.
์ฌ๊ธฐ์๋ ์คํ ๊ฒฐ๊ณผ๋ง ์ฌ๋ ค๋๊ฒ ์ต๋๋ค.
์คํ ์์ค์ฝ๋๋ ๊นํ๋ธ์์ ํ์ธํ ์ ์์ต๋๋ค.
(1) Logloss using all trees: 0.0003138062408693649
(2) Logloss using all trees but last: 0.0003138062408693649
(3) Logloss using all trees but first: 0.00032031490565337053
Logloss๋ ๊ฐ์ด ๋ฎ์์๋ก ์ข์ต๋๋ค.
์ ์ฒดํธ๋ฆฌ๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ(1)์ ๋ง์ง๋ง ํธ๋ฆฌ๋ฅผ ์ ๊ฑฐํ ๊ฒฝ์ฐ(2)์ ์ฑ๋ฅ์ฐจ์ด๋ ์์ต๋๋ค.
์ ์ฒดํธ๋ฆฌ๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ(1)์ ์ฒซ๋ฒ์งธ ํธ๋ฆฌ๋ฅผ ์ ๊ฑฐํ ๊ฒฝ์ฐ(3)์ ์ฑ๋ฅ์ฐจ์ด๋ ๋์ผ๋ก ํ์ธ ๊ฐ๋ฅํ ์ ๋ ์ ๋๋ค.
# With higher learning rate
Logloss using all trees: 3.0493086180356206e-06
Logloss using all trees but last: 3.054629157905757e-06
Logloss using all trees but first: 2.097409130044673
๋ง์ผ ํ์ต์จ์ ๋์ด๊ฒ ๋๋ค๋ฉด ์ฑ๋ฅ์ฐจ์ด๋ ๋์ผ๋ก ํ์ธ ๊ฐ๋ฅํ ์์ค์ ๋๋ค.
Conclusion
Decision Tree๋ ๋จ ํ๋์ ํธ๋ฆฌ๋ง ์ฌ์ฉํฉ๋๋ค.
Random Forest๋ ๋ณ๋ ฌ๋ก ํธ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ฏ๋ก ๊ฐ๊ฐ์ ํธ๋ฆฌ์ ์ค์์ฑ์ ๋์ผํฉ๋๋ค.
Gradient Boosted Tree๋ ์์ฐจ์ ์ผ๋ก ํ์ต์ด ์ผ์ด๋๋ฉฐ ์์ชฝ์ ํธ๋ฆฌ๊ฐ ์์ธก์ ์์ด์ ์ค์ํฉ๋๋ค.
Ref.