본문 바로가기

ALL73

행렬의 전치와 브로드캐스팅 ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com 행렬의 중요한 연산중 하나는 전치(transpose)이다. 행렬 $\boldsymbol{A}$의 전치는 $\boldsymbol{A}^\textrm{T}$로 나타내고, 수식으로는 다음과 같이 정의된다. $\left(\boldsymbol{A}^\textrm{T}\right)_{i,j} = A_{j, i}$ 벡터는 하나의 열만 가지는 행렬로 생각될 수 있다. 그러므로 벡터의 전치는 하나의 행만을 가진 행렬.. 2020. 4. 10.
선형대수의 여러 객체 소개 ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com ○ 벡터(Vectors) : 수들의 배열(array)이다. 숫자들은 순서대로 배열된다. 벡터의 요소들을 명시적으로 표시할 필요가 있을때는, 다음과 같이 열 벡터로 나타낸다. $x = \begin{bmatrix}x_1 \\ x_2 \\ \cdots \\ x_n \end{bmatrix}$ 또한 벡터를 각 요소들이 다른 축들을 따라서 주어지는 공간위의 점으로도 생각할 수 있다. ○ 행렬(Matrices) .. 2020. 4. 10.
#5 머신러닝 용어 정리 ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com 머신러닝에서 자주 등장하는 용어임에도 불구하고, 의미가 불명확하거나 혼동해서 쓰이는 것들에 대해 정리한다. design matrix 데이터셋을 묘사하는 방법중 하나라고 생각하면된다. 행은 관측치를 나타내고, 열은 feature를 나타낸다. 예를 들어, R의 iris 데이터의 경우 design matrix $\boldsymbol{X} \in \mathbb{R}^{150\times4}$와 같이 쓰여질 것.. 2020. 4. 9.
고차원 자료에 대한 고전적인 회귀분석의 문제점 ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com 우리가 알고있는 고전적인 회귀분석을 고차원 데이터에 적용할 경우 발생하는 문제점들에 대해 알아본다. 여기서 고전적인 회귀 분석이란, 흔히들 회귀분석을 처음 접할 때 배우는 오차항에 대한 분포를 정규분포로 가정하는 단순 선형회귀, 다중 선형회귀 등을 말한다. 어떻게 보면 Penalized regression(벌점회귀 i.e. Ridge, Lasso)의 모티베이션에 관한 글이라고도 할 수 있다. 그 첫 .. 2020. 4. 8.
#4 구간추정 해석에 대한 고전적 관점과 베이지안 관점 ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com ❗ Prerequisite 기댓값 E(X)와 표본평균에 대해 신뢰구간(confidence interval)의 해석에 있어서 고전적인 관점과 베이지안 관점(bayesian Inference)의 차이에 대해 알아보자. 통계학의 추론에는 점추정(point estimation)과 구간 추정(interval estimation)이 있다. 점추정은 모집단의 모수를 하나의 값으로 추정하며, 구간 추정은 모수를 구.. 2020. 4. 7.
FDR ❗️블로그 옮김: https://www.taemobang.com 방태모 안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계 www.taemobang.com ※ prerequisite 다중 검정 FWER (참고) 후의 설명에서 나올 가설검정의 True positive(Discovery) 등과 같은 용어는 다음의 테이블을 보고 이해하면 된다. 예를 들어 True positive는 위 표에서 True Discovery($A$)로 표현할 수 있고, 귀무가설을 기각시켰는데 그 결정이 옳은 판단임을 의미한다. False negative는 위 표에서 굳이 표현하자면.. 2020. 4. 4.