❗️블로그 옮김: https://www.taemobang.com
시계열 자료의 예측 가능성
세상에는 시간 순서로 관측된 수많은 시계열 자료가 존재하며, 시계열 자료에 관한 예측(forecasts)은 많은 상황에서 필요로 됩니다. 일부 시계열 자료는 상당히 예측하기 쉬운 것들도 있습니다. 예를 들어, 우리는 다음날 아침의 일출 시간은 정확하게 예측할 수 있습니다. 그러나, 단순히 시계열 자료라고 해서 무작정 시계열 예측 모형을 이용해 예측을 시도한다면, 좋지 못한 결과를 초래할 가능성이 큽니다. 그래서, 해당 시계열이 예측이 가능한 자료에 해당하는지, 즉 시계열 자료의 "예측 가능성(predictability)"을 판단할 수 있는 몇 가지 사항을 검토해 볼 필요가 있습니다. 예측 가능성을 판단하는 사항은 크게 4가지가 있습니다:
- 시계열의 예측에 기여하는 요인들을 얼마나 잘 이해하고 있는가
- 얼마나 많은 양의 데이터를 이용할 수 있는가
- 미래는 과거와 얼마나 비슷한가
- 예측이 우리가 예측하려는 것에 영향을 미치는가
예를 들어, 국내 주거용 전기 수요의 단기 예측은 꽤 정확하게 수행할 수 있을 겁니다. 왜냐하면, 위 4가지 사항을 만족시키기 때문이죠. 다음과 같이 말입니다:
- 우리는 기여 요인에 관한 정보를 갖고 있습니다: 전기 수요는 기온에 상당한 영향을 받으며, 휴일, 경기(economic conditons)와 같은 것들에도 약간의 영향을 받습니다.
- 수십 년 동안 쌓인 국내 전기 수요 자료와 기상 환경(weather conditions)에 관한 자료를 이용할 수 있습니다.
- (몇 주 후까지의) 단기 예측에서는, 전기 수요의 형태가 과거와 비슷하다고 가정할 수 있습니다.
- 국내 전기 사용료는 수요에 따라 변화하지 않습니다. 즉, 전기 수요의 예측은 주거용 전기 사용 고객들의 행동에 영향을 미치지 않는다고 할 수 있습니다.
여기에 우리가 전기 수요에 대해 훌륭한 성능을 보이는 모형을 개발할 수 있는 능력이 갖고 있다면, 예측은 상당히 정확하게 이루어 질 것입니다.😃
반대로, 위 사항을 만족하지 않는 자료에 대해 예를 들어보겠습니다. 바로 통화 환율(currency exchange rates)입니다. 통화 환율은 위 사항 중 단 한 가지인 두 번째 사항만을 만족시킵니다. 나머지 사항들에 관해 말해보겠습니다. 우리는 환율에 영향을 미치는 요인들에 대한 이해에 한계가 있으며, 수 많은 예측할 수 없는 것들이 환율에 영향을 미칠 가능성이 존재합니다. 그리고, 미래의 환율의 변화 형태가 과거와 비슷할 것이라고 가정하는 것은 매우 힘듭니다. 왜냐하면, 어떤 나라의 경제 또는 정치에 중대한 위기가 발생한다면 환율은 과거와 상당히 다르게 움직일 것이기 때문입니다. 그리고, 무엇보다 환율의 예측은 그 자체로 시장의 사람들에게 직접적인 영향을 미칩니다. 예를 들어, 환율을 꽤 정확하게 예측할 수 있는 모형이 개발되었다고 가정했을 때, 환율이 오를 것이라고 예측하면 사람들은 즉시 그것에 반응할 것이기 때문이죠. 이를 바로 "효율적 시장 가설(efficient market hypothesis)"이라고 일컫습니다. 결론적으로, 내일 환율이 오를지 내릴지 예측하는 행위는 결국 양면이 나올 확률이 공정한 동전을 던졌을 때 앞면이 나올 것이냐 뒷면이 나올 것이냐 예측하는 행위와 같습니다. 즉, 무엇을 예측하든 그 예측이 맞을 확률은 반반에 불과하다 이 얘기죠. 시계열 자료에 관한 예측을 빈번히 수행하는 사람이라면 이러한 사항에 대해 꼭 인지할 필요가 있습니다. 그리고, 사실 뭐 이런저런 사항을 차치해놓고 봐도 환율을 예측하는 행위는 불가능하다는 생각이 드실겁니다. 환율을 자유롭게 예측할 수 있는 누군가가 존재한다면, 그 사람이 억만장자가 되는 것은 시간 문제겠죠.😂
시계열의 예측에 대해
시계열의 예측에서 기본적이고 중요한 첫 번째 단계는 어떤 것을 정확하게 예측하고자 할 때, 이 예측이 과연 동전 던지기보다 더 나은 결과를 가져다 줄 수 있는 지를 아는 것이라고 할 수 있습니다. 좋은 예측은 과거 자료에 존재하는 진짜 패턴과 관계를 잡아낼 수 있습니다. 많은 사람들은 변화하는 환경에 대한 시계열 자료는 예측이 불가능하다고 잘못된 가정을 합니다. 모든 환경은 당연히 변화하며, 좋은 예측 모형은 그것이 변화하는 방식을 잡아냅니다. 시계열에 관한 예측을 결코 환경이 변화하지 않는다고 가정한채로 진행되지 않습니다.😀 다만, 시계열 모형은 일반적으로 해당 시계열의 환경이 변화하는 방식이 미래에도 이어진다는 것을 가정한 채로 예측을 수행합니다. 즉, 해당 시계열의 예측값 그 자체 뿐만이 아닌 움직이는 방식을 잡아낸다고 할 수 있습니다. 그리고, 상식적으로 생각해봐도 과거에 시계열의 환경이 변화하는 방식이 미래로 이어진다는 가정을 내포하지 않고서는, 결코 미래에 대한 예측을 수행할 수 없습니다. 왜냐하면, 우리는 결국 과거 자료의 특성을 바탕으로 미래를 예측해야하기 때문이죠. 미래를 100% 정확하게 예측하는 행위는 불가능합니다. 그러나, 좋은 예측은 우리에게 좀 더 좋은 합리적인 판단을 할 수 있게끔 해준다는 점에서, 예측 가능성이 있는 시계열에 관한 예측은 늘 필요로 된다고 할 수 있습니다.
시계열 예측은 예측 기간, outcome($y$)을 결정하는 요인, 자료의 패턴 등 여러 측면에 따라서 다양한 방식으로 다르게 이루어 질 수 있습니다. 예를 들어, 예측을 수행하는 방법론은 가장 최근의 관측치를 예측값으로 하는 naive method처럼 매우 간단할 수도 있고, 또는 인공신경망(neural nets), 여러 연립방정식을 사용하는 경제학적 구조를 갖는 모형들 처럼 매우 복잡할 수도 있습니다. 그리고, 그 외 간혹 예측은 필요로 되나 이용할 수 있는 자료는 전무한 경우가 있을 수 있습니다. 예를 들어, 신제품 출시를 앞두고, 해당 제품을 출시하는 연도의 판매량을 예측하고 싶은 상황이라고 해봅시다. 이러한 경우 우리가 이용할 수 있는 자료는 없습니다. 이때 우리는 판단 예측(judgmental forecasting) 방법론을 통해 예측을 수행할 수 있습니다. 해당 갈래에 속하는 방법론은 몇 가지가 있고, 추후에 본 블로그를 통해 소개할 예정입니다. 이처럼, 예측 방법론의 선택은 어떤 자료를 이용할 수 있는지, 그리고 예측 하려는 양적 자료의 예측 가능성에 달려있다고 할 수 있습니다.
📝참고 문헌
[1] Hyndman, R.J. & Athanasopoulos, G. (2021) Forecasting: principles and practice, 3rd edition, OTexts: Melbourne, Australia. OTexts.com/fpp3. Accessed on 30-04-2021.
'시계열 자료분석' 카테고리의 다른 글
Count Time Series 분석에 대해 (0) | 2021.03.17 |
---|---|
계층적 시계열 분석 (0) | 2020.10.25 |
ARIMA 모형 (2) | 2020.07.02 |
시계열 평활법 (2) | 2020.07.01 |
댓글