์ ์ฒด ๊ธ73 ํ๋ ฌ์ ์ ์น์ ๋ธ๋ก๋์บ์คํ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com ํ๋ ฌ์ ์ค์ํ ์ฐ์ฐ์ค ํ๋๋ ์ ์น(transpose)์ด๋ค. ํ๋ ฌ $\boldsymbol{A}$์ ์ ์น๋ $\boldsymbol{A}^\textrm{T}$๋ก ๋ํ๋ด๊ณ , ์์์ผ๋ก๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค. $\left(\boldsymbol{A}^\textrm{T}\right)_{i,j} = A_{j, i}$ ๋ฒกํฐ๋ ํ๋์ ์ด๋ง ๊ฐ์ง๋ ํ๋ ฌ๋ก ์๊ฐ๋ ์ ์๋ค. ๊ทธ๋ฌ๋ฏ๋ก ๋ฒกํฐ์ ์ ์น๋ ํ๋์ ํ๋ง์ ๊ฐ์ง ํ๋ ฌ.. 2020. 4. 10. ์ ํ๋์์ ์ฌ๋ฌ ๊ฐ์ฒด ์๊ฐ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โ ๋ฒกํฐ(Vectors) : ์๋ค์ ๋ฐฐ์ด(array)์ด๋ค. ์ซ์๋ค์ ์์๋๋ก ๋ฐฐ์ด๋๋ค. ๋ฒกํฐ์ ์์๋ค์ ๋ช ์์ ์ผ๋ก ํ์ํ ํ์๊ฐ ์์๋๋, ๋ค์๊ณผ ๊ฐ์ด ์ด ๋ฒกํฐ๋ก ๋ํ๋ธ๋ค. $x = \begin{bmatrix}x_1 \\ x_2 \\ \cdots \\ x_n \end{bmatrix}$ ๋ํ ๋ฒกํฐ๋ฅผ ๊ฐ ์์๋ค์ด ๋ค๋ฅธ ์ถ๋ค์ ๋ฐ๋ผ์ ์ฃผ์ด์ง๋ ๊ณต๊ฐ์์ ์ ์ผ๋ก๋ ์๊ฐํ ์ ์๋ค. โ ํ๋ ฌ(Matrices) .. 2020. 4. 10. #5 ๋จธ์ ๋ฌ๋ ์ฉ์ด ์ ๋ฆฌ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com ๋จธ์ ๋ฌ๋์์ ์์ฃผ ๋ฑ์ฅํ๋ ์ฉ์ด์์๋ ๋ถ๊ตฌํ๊ณ , ์๋ฏธ๊ฐ ๋ถ๋ช ํํ๊ฑฐ๋ ํผ๋ํด์ ์ฐ์ด๋ ๊ฒ๋ค์ ๋ํด ์ ๋ฆฌํ๋ค. design matrix ๋ฐ์ดํฐ์ ์ ๋ฌ์ฌํ๋ ๋ฐฉ๋ฒ์ค ํ๋๋ผ๊ณ ์๊ฐํ๋ฉด๋๋ค. ํ์ ๊ด์ธก์น๋ฅผ ๋ํ๋ด๊ณ , ์ด์ feature๋ฅผ ๋ํ๋ธ๋ค. ์๋ฅผ ๋ค์ด, R์ iris ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ design matrix $\boldsymbol{X} \in \mathbb{R}^{150\times4}$์ ๊ฐ์ด ์ฐ์ฌ์ง ๊ฒ.. 2020. 4. 9. ๊ณ ์ฐจ์ ์๋ฃ์ ๋ํ ๊ณ ์ ์ ์ธ ํ๊ท๋ถ์์ ๋ฌธ์ ์ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com ์ฐ๋ฆฌ๊ฐ ์๊ณ ์๋ ๊ณ ์ ์ ์ธ ํ๊ท๋ถ์์ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ์ ์ ์ฉํ ๊ฒฝ์ฐ ๋ฐ์ํ๋ ๋ฌธ์ ์ ๋ค์ ๋ํด ์์๋ณธ๋ค. ์ฌ๊ธฐ์ ๊ณ ์ ์ ์ธ ํ๊ท ๋ถ์์ด๋, ํํ๋ค ํ๊ท๋ถ์์ ์ฒ์ ์ ํ ๋ ๋ฐฐ์ฐ๋ ์ค์ฐจํญ์ ๋ํ ๋ถํฌ๋ฅผ ์ ๊ท๋ถํฌ๋ก ๊ฐ์ ํ๋ ๋จ์ ์ ํํ๊ท, ๋ค์ค ์ ํํ๊ท ๋ฑ์ ๋งํ๋ค. ์ด๋ป๊ฒ ๋ณด๋ฉด Penalized regression(๋ฒ์ ํ๊ท i.e. Ridge, Lasso)์ ๋ชจํฐ๋ฒ ์ด์ ์ ๊ดํ ๊ธ์ด๋ผ๊ณ ๋ ํ ์ ์๋ค. ๊ทธ ์ฒซ .. 2020. 4. 8. #4 ๊ตฌ๊ฐ์ถ์ ํด์์ ๋ํ ๊ณ ์ ์ ๊ด์ ๊ณผ ๋ฒ ์ด์ง์ ๊ด์ โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โ Prerequisite ๊ธฐ๋๊ฐ E(X)์ ํ๋ณธํ๊ท ์ ๋ํด ์ ๋ขฐ๊ตฌ๊ฐ(confidence interval)์ ํด์์ ์์ด์ ๊ณ ์ ์ ์ธ ๊ด์ ๊ณผ ๋ฒ ์ด์ง์ ๊ด์ (bayesian Inference)์ ์ฐจ์ด์ ๋ํด ์์๋ณด์. ํต๊ณํ์ ์ถ๋ก ์๋ ์ ์ถ์ (point estimation)๊ณผ ๊ตฌ๊ฐ ์ถ์ (interval estimation)์ด ์๋ค. ์ ์ถ์ ์ ๋ชจ์ง๋จ์ ๋ชจ์๋ฅผ ํ๋์ ๊ฐ์ผ๋ก ์ถ์ ํ๋ฉฐ, ๊ตฌ๊ฐ ์ถ์ ์ ๋ชจ์๋ฅผ ๊ตฌ.. 2020. 4. 7. FDR โ๏ธ๋ธ๋ก๊ทธ ์ฎ๊น: https://www.taemobang.com ๋ฐฉํ๋ชจ ์๋ ํ์ธ์, ์ ๋ธ๋ก๊ทธ์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค. ํต๊ณํ์ ์ ๊ณต์ผ๋ก ํ๋ถ, ์์ฌ๋ฅผ ์กธ์ ํ์ต๋๋ค. ํ์ฌ๋ ๊ฐ์ฒ๋ ๊ธธ๋ณ์ G-ABC์์ Data Science๋ฅผ ํ๊ณ ์์ต๋๋ค. ํต๊ณํ, ์๊ณ์ด, ํต๊ณ์ ํ์ต๊ณผ ๊ธฐ๊ณ www.taemobang.com โป prerequisite ๋ค์ค ๊ฒ์ FWER (์ฐธ๊ณ ) ํ์ ์ค๋ช ์์ ๋์ฌ ๊ฐ์ค๊ฒ์ ์ True positive(Discovery) ๋ฑ๊ณผ ๊ฐ์ ์ฉ์ด๋ ๋ค์์ ํ ์ด๋ธ์ ๋ณด๊ณ ์ดํดํ๋ฉด ๋๋ค. ์๋ฅผ ๋ค์ด True positive๋ ์ ํ์์ True Discovery($A$)๋ก ํํํ ์ ์๊ณ , ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐ์์ผฐ๋๋ฐ ๊ทธ ๊ฒฐ์ ์ด ์ณ์ ํ๋จ์์ ์๋ฏธํ๋ค. False negative๋ ์ ํ์์ ๊ตณ์ด ํํํ์๋ฉด.. 2020. 4. 4. ์ด์ 1 ยทยทยท 6 7 8 9 10 11 12 13 ๋ค์