그냥 노트

지수화 방법에 대한 노트



요즘에 개인적으로 K 선생님의 일을 좀 도와드리고 있다. 어떤 데이터들을 가지고 지수화하는 것이 최종적인 목적이고, 때문에 한번도 배워본 적도 없는 지수화 방법들을 울며 겨자먹기로 공부를 대강 했다. 그리고 공부한 것이 억울해서 정리라도 해야겠다. 다음의 내용은 몇가지 과거에 배운 것들, 그리고 이번에 공부한 것들을 적절히 정리한 것이다.


먼저, 지표(indicator)와 지수(index)를 구분 해야겠다. 지수는 지표들의 합으로 구성된다. 양자 모두 특정한 정도를 나타내지만 지표는 이를 일면적으로만 보여줄 뿐인 것이다. 즉, 지수는 이러한 일면적으로 보여주는 지표들을 합하여 목적으로 하는 정도 전체를 보여주도록 한다. 따라서 지수화 문제에서 가장 중요한 것은 서로 단위나 중요도가 다른 여러 지표들을 합하는 방식이 쟁점이 된다.


먼저 서로 단위가 다른 지표들을 합하기 위하여 단위를 바꾸는 것이 문제이다. 이때 z-값은 좋은 방법이다. 단위가 서로 다른 지표들을 표준정규분포의 z-값으로 바꾸면, -∞에서 +∞ 사이의 값을 가지게 된다. 그러나 이때 z-값이 음수를 가진다는 점에서 z-값의 백분위 값으로 다시 바꾸어 합산하는 것이 적절하다.


백분위 z-값을 합산할 때는 중요도에 따라 가중치를 두어 합산하는 방법과 가중치를 부과하지 않고 단순합산하는 방법이 있다. 단순합산은 이론적인 기초가 없을 때 사용할 수 있다. 그러나 당연하게도 단순합산이므로 각각의 지표들이 가지는 상대적인 중요성을 무시하게 된다. 


한편, 가중치를 부여하기 위해서는 임의성을 무시할 수 없다. 때문에 임의성을 배제하기 위한 방법이 쟁점이 된다. 크게 세가지로 구분해 볼 수 있다. 첫째는 연구자의 선험적인 주관에 의해서 각각의 가중치를 다르게 부과하는 것이다. 물론 이론적 근거가 선험적으로 존재해야 할 것이다. 둘째로, 전문가의 주관에 의한 방법이다. 이때 분석적계층화방법(Analytical Hierarchy Process; AHP)은 중요한 방법이 될 수 있다.


셋째로 통계적 방법을 통해 가중치를 부여하는 방법이다. 여기에는 다시 크게 세가지로 나뉜다. 첫째는 회귀분석을 통해 가중치를 부여하는 방법이다. 각각의 지표들을 이미 관측된 대안적인 지수를 종속변수로 하여 회귀분석을 실시하고, 그 결과로 나온 계수값을 가중치로 사용하는 것이다. 그러나 이 경우, 종속변수를 필요로 하고 다른 나머지 두 가지 통계적 방법 모두 유사한 한계를 가진다. 두번째 방법은 구조방정식모형을 통한 방법이고, 세번째 방법은 상관관계 분석을 통한 방법이다.


주성분분석이란 것을 이용하는 방법도 존재하는데, 이는 조금 더 공부를 해야지 이해할 수 있을 것 같다.



저작자 표시 비영리 변경 금지
신고

티스토리 툴바