'모델링'에 해당되는 글 1건

  1. 2014.01.13 The signal and the noise

The signal and the noise

2014. 1. 13. 18:49 from Lectura





- 2014.1, Nate Silver


이 책에 따르면 예측이란 과학과 망상을 구별할 수 있는 중요한 툴이다. 우리가 생각하는 현실이 얼마만큼 실제와 가까운가 라는 질문은 바로 예측의 정확도를 통해서 검증할 수 있다. 이렇게 예측을 통해서 이론의 정합성을 검토받는 것이 바로 과학의 핵심적인 방법론인바. 예측이란 과학적인 사고방식의 요체라고 할 수도 있겠다.


예측을 성공적으로 수행하기 위해서는 다음과 같은 과정이 필요하다. 

 

1. 예측하고자 하는 시스템을 모방하는 모델을 만든다

2. 이 모델을 과거 데이터를 통해 검증/조정한다.

3. 모델을 개선한다.

 

이때 과거의 데이터를 통해 검증/조정 하는 과정에서 signal과 noise의 문제가 발생한다. 노이즈를 포함한 모든 과거 데이터와 일치하는 복잡한 모델을 만들면 overfitting의 문제가 발생하여 정작 미래 사건에 대한 예측력은 떨어지게 된다. 때문에 예측을 하는 사람은 과거 데이터에서 노이즈가 얼만큼 포함되어 있는지, 예측의 정확도는 어느 정도까지로 해야 할지에 대해서 고민해야 한다.  

 

문제는 우리의 인식은 늘 데이터에서 패턴을 찾아내고자 한다는 것이다. 우리의 뇌는 패턴을 찾아내는 작업에 놀랍도록 최적화되어 있기 때문에, 노이즈를 통해서도 패턴을 찾아낸다. 이렇게 노이즈와 신호가 섞여있을 경우 예측의 정확도를 향상 시킬 수 있는 유일한 해결방법은 결과가 아니라 과정에 집중하는 것이다.  


즉, 외부 세계에 대한 모델과 그 모델을 통해 성공적으로 예측 할 수 있는 확률을 가정한뒤, 새로운 증거가 나올때마다 지속적으로 가정된 확률을 재조정해야 한다. 이것을 공식화 한 것이 바로 베이시안 공식이라고 할 수 있다.


상당히 지루할 수 있는 주제를 다양한 영역에서 예제를 가져와 재미있게 설명해준다. 교과서처럼 모델링과 확률을 설명하는 것이 아니라, 우리가 매일 마주치는 금융위기, 주식, 일기예보, 포커, 체스, 지진예측 등의 실질적인 사례를 통해서 이야기 한다. 


기억에 남는 구절들…


Prediction is important because it connects subjective and objective reality   -14page 


The key to making a good forecast is not in limiting yourself to quantitative information. Rather, it's having a good process for weighing the information appropriately.   - 100page


You are most likely to overfit a model when the data is limited and noisy and when your understanding of the fundamental relationships is poor; both circumstances apply in earthquake forecasting.  -166page


Perhaps the central finding of behavioral economics is that most of us are overconfident when we make predictions.  -359page


The goal of any predictive model is to capture as much signal as possible and as little noise as possible.  -388page


Information becomes knowledge only when it's placed in context. Without it we have no way to differentiate the signal from the noise, and our search for the truth might be swamped by false positives.   -451page

        

'Lectura' 카테고리의 다른 글

1차세계대전사  (1) 2014.05.07
국가는 왜 실패하는가  (0) 2014.03.30
The Big Short  (0) 2013.12.23
육식의 종말  (0) 2013.12.23
히페리온 시리즈  (0) 2013.12.18
Posted by 중년하플링 :