๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

์ „์ฒด ๊ธ€73

ํ–‰๋ ฌ์˜ ์ „์น˜์™€ ๋ธŒ๋กœ๋“œ์บ์ŠคํŒ… โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com ํ–‰๋ ฌ์˜ ์ค‘์š”ํ•œ ์—ฐ์‚ฐ์ค‘ ํ•˜๋‚˜๋Š” ์ „์น˜(transpose)์ด๋‹ค. ํ–‰๋ ฌ $\boldsymbol{A}$์˜ ์ „์น˜๋Š” $\boldsymbol{A}^\textrm{T}$๋กœ ๋‚˜ํƒ€๋‚ด๊ณ , ์ˆ˜์‹์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค. $\left(\boldsymbol{A}^\textrm{T}\right)_{i,j} = A_{j, i}$ ๋ฒกํ„ฐ๋Š” ํ•˜๋‚˜์˜ ์—ด๋งŒ ๊ฐ€์ง€๋Š” ํ–‰๋ ฌ๋กœ ์ƒ๊ฐ๋  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋ฒกํ„ฐ์˜ ์ „์น˜๋Š” ํ•˜๋‚˜์˜ ํ–‰๋งŒ์„ ๊ฐ€์ง„ ํ–‰๋ ฌ.. 2020. 4. 10.
์„ ํ˜•๋Œ€์ˆ˜์˜ ์—ฌ๋Ÿฌ ๊ฐ์ฒด ์†Œ๊ฐœ โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com โ—‹ ๋ฒกํ„ฐ(Vectors) : ์ˆ˜๋“ค์˜ ๋ฐฐ์—ด(array)์ด๋‹ค. ์ˆซ์ž๋“ค์€ ์ˆœ์„œ๋Œ€๋กœ ๋ฐฐ์—ด๋œ๋‹ค. ๋ฒกํ„ฐ์˜ ์š”์†Œ๋“ค์„ ๋ช…์‹œ์ ์œผ๋กœ ํ‘œ์‹œํ•  ํ•„์š”๊ฐ€ ์žˆ์„๋•Œ๋Š”, ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์—ด ๋ฒกํ„ฐ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. $x = \begin{bmatrix}x_1 \\ x_2 \\ \cdots \\ x_n \end{bmatrix}$ ๋˜ํ•œ ๋ฒกํ„ฐ๋ฅผ ๊ฐ ์š”์†Œ๋“ค์ด ๋‹ค๋ฅธ ์ถ•๋“ค์„ ๋”ฐ๋ผ์„œ ์ฃผ์–ด์ง€๋Š” ๊ณต๊ฐ„์œ„์˜ ์ ์œผ๋กœ๋„ ์ƒ๊ฐํ•  ์ˆ˜ ์žˆ๋‹ค. โ—‹ ํ–‰๋ ฌ(Matrices) .. 2020. 4. 10.
#5 ๋จธ์‹ ๋Ÿฌ๋‹ ์šฉ์–ด ์ •๋ฆฌ โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์ž์ฃผ ๋“ฑ์žฅํ•˜๋Š” ์šฉ์–ด์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์˜๋ฏธ๊ฐ€ ๋ถˆ๋ช…ํ™•ํ•˜๊ฑฐ๋‚˜ ํ˜ผ๋™ํ•ด์„œ ์“ฐ์ด๋Š” ๊ฒƒ๋“ค์— ๋Œ€ํ•ด ์ •๋ฆฌํ•œ๋‹ค. design matrix ๋ฐ์ดํ„ฐ์…‹์„ ๋ฌ˜์‚ฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ค‘ ํ•˜๋‚˜๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด๋œ๋‹ค. ํ–‰์€ ๊ด€์ธก์น˜๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ , ์—ด์€ feature๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, R์˜ iris ๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ design matrix $\boldsymbol{X} \in \mathbb{R}^{150\times4}$์™€ ๊ฐ™์ด ์“ฐ์—ฌ์งˆ ๊ฒƒ.. 2020. 4. 9.
๊ณ ์ฐจ์› ์ž๋ฃŒ์— ๋Œ€ํ•œ ๊ณ ์ „์ ์ธ ํšŒ๊ท€๋ถ„์„์˜ ๋ฌธ์ œ์  โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com ์šฐ๋ฆฌ๊ฐ€ ์•Œ๊ณ ์žˆ๋Š” ๊ณ ์ „์ ์ธ ํšŒ๊ท€๋ถ„์„์„ ๊ณ ์ฐจ์› ๋ฐ์ดํ„ฐ์— ์ ์šฉํ•  ๊ฒฝ์šฐ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ์ ๋“ค์— ๋Œ€ํ•ด ์•Œ์•„๋ณธ๋‹ค. ์—ฌ๊ธฐ์„œ ๊ณ ์ „์ ์ธ ํšŒ๊ท€ ๋ถ„์„์ด๋ž€, ํ”ํžˆ๋“ค ํšŒ๊ท€๋ถ„์„์„ ์ฒ˜์Œ ์ ‘ํ•  ๋•Œ ๋ฐฐ์šฐ๋Š” ์˜ค์ฐจํ•ญ์— ๋Œ€ํ•œ ๋ถ„ํฌ๋ฅผ ์ •๊ทœ๋ถ„ํฌ๋กœ ๊ฐ€์ •ํ•˜๋Š” ๋‹จ์ˆœ ์„ ํ˜•ํšŒ๊ท€, ๋‹ค์ค‘ ์„ ํ˜•ํšŒ๊ท€ ๋“ฑ์„ ๋งํ•œ๋‹ค. ์–ด๋–ป๊ฒŒ ๋ณด๋ฉด Penalized regression(๋ฒŒ์ ํšŒ๊ท€ i.e. Ridge, Lasso)์˜ ๋ชจํ‹ฐ๋ฒ ์ด์…˜์— ๊ด€ํ•œ ๊ธ€์ด๋ผ๊ณ ๋„ ํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ ์ฒซ .. 2020. 4. 8.
#4 ๊ตฌ๊ฐ„์ถ”์ • ํ•ด์„์— ๋Œ€ํ•œ ๊ณ ์ „์  ๊ด€์ ๊ณผ ๋ฒ ์ด์ง€์•ˆ ๊ด€์  โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com โ— Prerequisite ๊ธฐ๋Œ“๊ฐ’ E(X)์™€ ํ‘œ๋ณธํ‰๊ท ์— ๋Œ€ํ•ด ์‹ ๋ขฐ๊ตฌ๊ฐ„(confidence interval)์˜ ํ•ด์„์— ์žˆ์–ด์„œ ๊ณ ์ „์ ์ธ ๊ด€์ ๊ณผ ๋ฒ ์ด์ง€์•ˆ ๊ด€์ (bayesian Inference)์˜ ์ฐจ์ด์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. ํ†ต๊ณ„ํ•™์˜ ์ถ”๋ก ์—๋Š” ์ ์ถ”์ •(point estimation)๊ณผ ๊ตฌ๊ฐ„ ์ถ”์ •(interval estimation)์ด ์žˆ๋‹ค. ์ ์ถ”์ •์€ ๋ชจ์ง‘๋‹จ์˜ ๋ชจ์ˆ˜๋ฅผ ํ•˜๋‚˜์˜ ๊ฐ’์œผ๋กœ ์ถ”์ •ํ•˜๋ฉฐ, ๊ตฌ๊ฐ„ ์ถ”์ •์€ ๋ชจ์ˆ˜๋ฅผ ๊ตฌ.. 2020. 4. 7.
FDR โ—๏ธ๋ธ”๋กœ๊ทธ ์˜ฎ๊น€: https://www.taemobang.com ๋ฐฉํƒœ๋ชจ ์•ˆ๋…•ํ•˜์„ธ์š”, ์ œ ๋ธ”๋กœ๊ทธ์— ์˜ค์‹  ๊ฒƒ์„ ํ™˜์˜ํ•ฉ๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™์„ ์ „๊ณต์œผ๋กœ ํ•™๋ถ€, ์„์‚ฌ๋ฅผ ์กธ์—…ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ๋Š” ๊ฐ€์ฒœ๋Œ€ ๊ธธ๋ณ‘์› G-ABC์—์„œ Data Science๋ฅผ ํ•˜๊ณ ์žˆ์Šต๋‹ˆ๋‹ค. ํ†ต๊ณ„ํ•™, ์‹œ๊ณ„์—ด, ํ†ต๊ณ„์ ํ•™์Šต๊ณผ ๊ธฐ๊ณ„ www.taemobang.com โ€ป prerequisite ๋‹ค์ค‘ ๊ฒ€์ • FWER (์ฐธ๊ณ ) ํ›„์˜ ์„ค๋ช…์—์„œ ๋‚˜์˜ฌ ๊ฐ€์„ค๊ฒ€์ •์˜ True positive(Discovery) ๋“ฑ๊ณผ ๊ฐ™์€ ์šฉ์–ด๋Š” ๋‹ค์Œ์˜ ํ…Œ์ด๋ธ”์„ ๋ณด๊ณ  ์ดํ•ดํ•˜๋ฉด ๋œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด True positive๋Š” ์œ„ ํ‘œ์—์„œ True Discovery($A$)๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๊ณ , ๊ท€๋ฌด๊ฐ€์„ค์„ ๊ธฐ๊ฐ์‹œ์ผฐ๋Š”๋ฐ ๊ทธ ๊ฒฐ์ •์ด ์˜ณ์€ ํŒ๋‹จ์ž„์„ ์˜๋ฏธํ•œ๋‹ค. False negative๋Š” ์œ„ ํ‘œ์—์„œ ๊ตณ์ด ํ‘œํ˜„ํ•˜์ž๋ฉด.. 2020. 4. 4.