์ ์ฒด ๊ธ73 #7 ์์ ๋ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com ์์ ๋(degrees of freedom)๋ ๋ณธ์ง์ ์ผ๋ก ์ํธ๋ ๋ฆฝ์ธ ํ๋ณธ์ ํฌ๊ธฐ๋ฅผ ๋ปํ๋ค. ์๋ฅผ ๋ค์ด, ํต๊ณํ์์ ๊ฐ๋จํ ํํ์ ํธ์ฐจ(deviation)๋ฅผ ๊ณ์ฐํ๋ ์ํฉ์ ๊ฐ์ ํด๋ณด์. ๊ฐ์ฅ ์ฌ์ด ์๋ $(Y_i - \bar{Y})$์ด๋ค. ํ๋ณธ์ ํฌ๊ธฐ๋ฅผ n์ด๋ผ๊ณ ํ๋ฉด, $n$ ๊ฐ์ ํธ์ฐจ๋ค ๊ฐ์ ํธ์ฐจํญ๋ค์ ๋ชจ๋ ๋ํ๋ฉด 0์ด ๋๋ ์ข ์์ฑ์ด ์กด์ฌํ๋ค. ์ฆ $\sum(Y_i - \bar{Y}) = 0$์ด๋ค. ๋ฐ.. 2020. 4. 16. CRD with subsampling โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โป prerequisite ์คํ์ค๊ณ ๊ฐ์ ๋ฐ ์ฉ์ด ์ ๋ฆฌ ์ผ์๋ฐฐ์น ๋ถ์ฐ๋ถ์(One-way Anova)์ ์๋ฆฌ ์ค์ฐจํญ์ ๋ถ์ฐ ์ถ์ ๊ณผ EMS ์ง๊ธ๊น์ง๋ ์คํ๋จ์(EU : experimental unit)์ ๊ด์ฐฐ๋จ์(obsevational unit)๊ฐ ๋์ผํ ์๋ฃ๋ค๋ง ์ดํด๋ณด์๋ค. ์คํ๋จ์์ ๊ด์ฐฐ๋จ์๊ฐ ๋์ผํ์ง ์์ ๊ฒฝ์ฐ๊ฐ ์์ผ๋ฉฐ, ์ด๋ฐ ๊ฒฝ์ฐ๋ฅผ ์ผ์ปฌ์ด CRD with subsampling(๋ถํ์ง์ ํ ์์ ๋.. 2020. 4. 16. ์ง๊ต๋คํญ์๊ณผ ๋ฐ์๊ณก์ ์ ์ ํฉ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โป prerequisite ๋๋น์ ์ง๊ต๋๋น์ ๋ํด ๋จ๋ฐฑ์ง(์ฒ๋ฆฌ)๊ณผ ์ฒด์ค(๋ฐ์๊ฐ, $y$)์ ๊ดํ ๋ฐ์ดํฐ๋ฅผ ์ฐ์ ๋๋ก ๋ํ๋์ผ๋ฉฐ, ๊ฐ ๊ทธ๋ฃน์ ๋ฐ๋ณต์๋ 5ํ์ด๋ค(๋์ผํ ์ธก์ ๊ฐ์ด ์กด์ฌํด์ ์ค๋ณต๋ ์ ์กด์ฌ). ๊ทธ๋ฆฌ๊ณ ์ฐ์ ๋์ ๊ทธ์ด์ ธ์๋ ๊ณก์ ์ ๋ฐ์ดํฐ์ 3์ฐจ ํ๊ท์ ์ ์ ํฉ์ํจ ๊ฒฐ๊ณผ์ด๋ค. ํนํ ์ด๋ฌํ ํ๊ท์ ์ ๋ฐ์๊ณก์ (response curve)์ด๋ผ ๋ถ๋ฅธ๋ค. ์ง๊ต๋คํญ์(orthogonal polynomial)์ .. 2020. 4. 14. Ridge regression โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โป prerequisite ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์์ ๊ณ ์ ์ ์ธ ํ๊ท ๋ถ์์ด ๊ฐ์ง๋ ๋ฌธ์ ์ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ๋ํ ํ๊ท๋ถ์์์ $\boldsymbol{\beta}$์ ๋ํ ML ์ถ์ ๋(OLS ์ถ์ ๋)์ ๋ง์ ๊ฒฐ์ ์ด ๋ฐ์ํ๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ๋ณ์์ ํ(variable selection ๋๋ model selection)์ ํตํ ์ฐจ์์ ์ถ์๊ฐ ํ์๋ก ๋๋๋ฐ, ๋ณ์์ ํ๊ณผ ์ถ๋ก ์ ๊ฐ์ ๋ฐ์ดํฐ๋ก ์ํํ๋ Post-.. 2020. 4. 10. #6 ์ ํ๋์๋ฅผ ์ด์ฉํ ์ฃผ์ฑ๋ถ ์ ๋ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com ๋น์ง๋ ํ์ต์ค ํ๋์ธ ๊ฐ๋จํ ์๊ณ ๋ฆฌ์ฆ ์ฃผ์ฑ๋ถ ๋ถ์(PCA : principal components analysis)์ ์ ํ๋์์ ๊ธฐ๋ณธ์ ์ธ ๊ฐ๋ ๋ค์ ์ด์ฉํ์ฌ ์ ๋ํ ์๋ ์๋ค. $\mathbb{R}^n$์ ๊ณต๊ฐ์ m๊ฐ์ ์ ๋ค(points) $\left \{ \boldsymbol{x}^{(1)}, \cdots, \boldsymbol{x}^{(m)} \right \}$์ด ์๊ณ , ์ด ์ ๋ค์ ๋ํด ์์ค ์์ถ(.. 2020. 4. 10. Trace ์ฐ์ฐ์์ ํ๋ ฌ์ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com 1. Trace ์ฐ์ฐ์ ํ๋ ฌ ๋๊ฐ์ฑ๋ถ์ ํฉ์ ๋ฐํํ๋ ์ฐ์ฐ์์ด๋ค. ์๋นํ ์ ์ฉํ๋ค! $\textrm{Tr}\left ( \boldsymbol{A} \right ) = \sum_i \boldsymbol{A}_{i,i}$ ์ด ์ฐ์ฐ์์ ์ ์ฉํ ์ ๋ค์ ํ๋ํ๋ ์ดํด๋ณด์. (1) summation ๊ธฐํธ $\sum $์ ์๋ตํ ์ ์๊ฒ ํด์ค๋ค. ์๋ฅผ ๋ค๋ฉด, ํ๋ ฌ์ ํฌ๊ธฐ๋ฅผ ์ฌ๋ Frobenius norm์ ๋ค์๊ณผ.. 2020. 4. 10. ์ด์ 1 ยทยทยท 4 5 6 7 8 9 10 ยทยทยท 13 ๋ค์