-regression
-용도:
-종속변수와 독립변수 사이의 이론적 관계를 기초로 모형 구성
-특징:
-유의한 독립변수를 찾는데 쓰인다.
-독립변수의 찾고자하는 종속변수의 시점에서의 값도 알아야 하므로, 대게 독립변수의 시점은 종속변수 시점보다 1시점 앞선 값을 이용한다.


-time series

-용도:

-trend, cycle, seasonality(계절성), irregular(뷸규칙성) 등을 파악

-예측 추정

-변수 자체의 시간의 흐름에 따른 특성을 토대로 모형 설정

-모형의 주 관심

-서로 다른 두 시점에서의 상관관계가 매우 중요

-autocovariance, autocorrelation(ACF)

-단점:

-변수 사이들의 이론적인 관계를 고려하지 못함, 관심 변수 외의 변수는 다루지 않는다는 것


-데이타 분류

-deterministic trend

-trend

-season dummy

-probabilistic 

-(weak)stationary

-의미

-time series의 특징이, 시간이 흐름에 따라 변화하는지 안하는 지, 안한다면 stationary

-성질

-ACF_k, k가 증가시 감소를 하는 경향을 띰

-종류

-WN

-현재값의 크기가 미래 예측에 전혀 도움이 안되는 형태

-AR

-변수의 현재값을 과거의 값의 함수로 나타낸 형태

-과거의 값의 계수의 절댓값이 1보다 작아야 weak stationary

-order설정과 계수추정이 모델링의 주요 과정

-MA

-변수의 현재값을 과거의 오차항의 값과 현재의 오차항의 함수로 나타낸 형태

-항상 weak stationary

-과거 오차항의 계수긔 절댓값이 1보다 작아야 invertible(즉 AR형태로 나타낼 수 있음)

-order설정과 계수추정이 모델링의 주요 과정

-ARMA

-AR+MA

-order설정과 계수추정이 모델링의 주요 과정


-not stationary

-의미

-times series의 특징이 시간에 따라 변화하는 경우, 예를 들면, trend나, season term이 있는 경우

-성질

-stationary하게 만들 수 있을 수가 있다. 

-ACF_k, k가 증가하더라도 감소안하는 경우

-종류

-ARIMA

-Random walk

-가장 최근의 변수값이 그 다음 변수값에 영향을 미치는 형태

-integrated

-ANOVA

-y는 metric값, D(종속 dummy)는 0,1, 질적인 양을 표현, y,D_i로 이루어진 model을 ANOVA


-VAR

-Cointegration



*Model 선택, 기준 및 점검

-좋은 모형의 기준

-Parsimony

-Identifiability

-Goodness of Fit

-Theoretical Consistency

-Predictive Power

-모형 설정 오류들(다른 가정들은 성립할 때)

-관련 높은 변수를 생략

-(OLS)Estimator가 biased일 수 있게 된다.

-not consistency하게 될 수 있다.

(항상 그렇듯, consistent하더라도 unbiased in the case small-sample 을 보장해주는게 아님)

-error term의 sigma^2을 estimate하는 것도 biased될  수 있다.

-계수자체가 아니라 계수의 분산의 estimator 또한 biased될 수 있다

->신뢰구간과 가설 검정의 결과는 신빙성이 없어짐

-불필요한 변수의 포함(연구자가 이론을 모르거나, 그쪽 이론이 발전안되있거나해서 발생하는 오류)

-(OLS)Estimator가 unbiased, consistent해버림!(별문제 없단 소리)

-error term의 sigma^2도 제대로 estimate함

-T-test, F-test 다 유효함 하지만, 신뢰구간이 더 크게나와버림(not efficient)

-not efficient해짐

-not BLUE, but LUE는 됨

-자유도 감소

-no multicollinearity 성립하기 어려워짐

-잘못된 함수 형태

-경제학이론은, y와 X의 함수형태를 제시하진 않는다. 

-측정 오차

-y에 측정오차가 발생하는 경우

-OLS Estimator는 unbiased

-OLS estimator의 분산도 unbiased

-분산 estimate값은 측정오차가 없을 때보다 크게 나오긴 함

-X에 측정오차가 발생하는 경우

-OLS Estimator는 biased

-OLS Estimator는 not consistent

-해결법

-IV이용(이것은 IV찾는게 어렵다.)

-최대한 오차없는 자료를 이용할 것이며, 각 자료의 정의가 시간이 지남에 따라 달라지면 수정해서 합답한 변수 사용해야함

(구자라티, 번역본 p209부터 보기)





+ Recent posts