지금으로부터 무려 9년 전인 2005년 3월에 직장 소속의 한 연구소에서 요청하여 연구방법론 특강을 할 때 사용했던 자료입니다.
변량분석과 회귀분석을 그야말로 초간단 요약했습니다만 그래도 나름 핵심은 빠짐없이 담으려고 애를 썼던 기억이 나네요;;;;
자료에 포함된 내용은 다음과 같습니다.
* 변량분석의 정의
* 전체 변량, 표본 내 평균 변량, 표본 간 평균 변량의 개념 이해
* 변량분석의 결과 해석
* F값의 개념
* 변량분석의 영가설과 대립가설
* 변량분석의 척도 조건
* 변량분석의 기본 가정과 충족 조건
* 일원변량분석과 다원변량분석
* 사전비교와 사후비교
* 공변량분석
* MANOVA
* ANOVA의 제한점
* 회귀분석의 정의
* 회귀분석의 종류
* 회귀분석의 사용 목적
* 회귀분석의 척도 조건
* 회귀분석의 기본 가정
* 중다회귀분석에서 발생 가능한 문제점
변량분석과 회귀분석을 함께 정리한 이유는 회귀분석을 사용할 수 밖에 없는 변량분석의 제한점으로 인해 두 분석 기법이 연결되기 때문에 그렇습니다.
PPT 자료는 좀 더 개괄적인 내용을 담고 있고 아래아한글 자료는 공식과 도해를 통해 변량분석과 회귀분석의 기본적인 내용을 이해하도록 만들었습니다. 좀 더 근본적인 원리를 살펴보고픈 분들만 보시면 됩니다.
태그 -
ANOVA,
F값,
MANOVA,
Regression Analysis,
공변량분석,
다원변량분석,
대립가설,
변량분석,
사전비교,
사후비교,
연구방법론,
영가설,
일원변량분석,
중다회귀분석,
통계방법론,
평균 변량,
회귀분석
이 글의 트랙백 주소 :: http://walden3.kr/trackback/3751
최근에 석사 논문 3편의 통계 분석을 동시에 의뢰 받아서 한동안 정신이 없었습니다. 두 편은 공변량 구조 분석을 통해 매개 모형을 검증하는 것이고, 다른 하나는 기술통계분석과 상관분석, T검증을 하는 간단한 것이었습니다.
그런데 이 중 아주 기본적인 통계 방법론의 지식도 모르는 의뢰인이 있어서 적지않이 충격을 받았습니다. 그래도 소위 명문대에 속하는 대학의 석사 과정생인데 말이죠. 물론 심리학과 출신이 아닐 수도 있습니다만 대학원에도 통계 방법론 강의가 있을텐데 제 상식으로는 도무지 이해가 되지 않습니다. 이건 담당 교수의 책임도 크다고 봅니다.
하기는 최근에 많은 심리학과 교과 과정에서 방법론 관련 과목들이 필수에서 선택으로 변경되면서 많은 학생들이 방법론을 외면하고 있다는 이야기를 들었습니다. 아마도 그런 경향의 연장이 아닌가 싶은데 참으로 걱정스럽습니다.
사회 과학은 명칭에 과학이라는 말이 들어가 있는 것에서도 알 수 있듯이 연구에서 다양한 통계 방법론을 사용하기 때문에 기본적인 통계 지식과 프로그램의 운용 기술은 필수적이라고 할 수 있습니다.
자신의 연구 아이디어를 어떻게 구현하는지 모르는 사람이 어떻게 연구를 할 수 있겠습니까? 프로그램의 운용 기술은 technical한 것이라고 하더라도 기본적인 개념은 잡고 있어야 하지 않을까요?
'심리학 공부를 잘하기 위해서 필요한 것들'이라는 포스팅에서도 강조했지만 통계 방법론은 심리학과 뗄레야 뗄 수 없는 불가분의 관계입니다.
제발 미리미리 공부를 해 두시기 바랍니다.
저요? 저 학력고사 시험에서 수학 반타작을 한 수학맹입니다. 그래서 위기감에 대학 때 통계 방법론 만큼은 정말 열심히 공부했고 지금도 방법론 워크샵이라면 시간, 장소 불문하고 따라다니면서 듣습니다.
노력으로 안되는 것은 없습니다. 최소한 통계 방법론은 그렇습니다.
이 글의 트랙백 주소 :: http://walden3.kr/trackback/699
단일 피험자 설계는 1900년대 초 조작적 조건화를 통해 동물 실험을 한 Skinner에 의해 태동하였으며 이후 우수한 치료 효과를 보여주는 논문이 많이 발표되면서 활성화되었고 1950년대 말 Journal of Applied Behavior Analysis가 창간되면서 학계에 본격적으로 자리를 잡았습니다. 그러나 계량 통계학이 주류인 심리학계에서 단일 피험자 설계는 아직까지 학자들의 의구심을 완전히 극복하지 못하고 있으며 여전히 많은 심리학자들이 선호하는 방법론이 아닙니다.
단일 피험자 설계는 응용행동분석에 기반을 두고 있는데 응용행동분석의 특징은 첫째, 모든 행동은 학습을 통한 유기체와 환경과의 상호작용에서 비롯된다. 둘째, 조작적 정의에 의거한 관찰가능한 행동의 객관적 측정(심리현상에 대한 주관적인 rating은 될 수 있으면 하지 않는다)에만 관심을 가진다. 셋째, 단일 피험자 설계라는 실험적 방법을 통한 기능적 관계의 분석을 통해 문제 행동을 규명하고 치료하려고 시도하므로 인과 관계의 원인을 환경적 요인에서 찾습니다. 여기까지만 읽어도 아마 극단적인 행동주의를 연상하시는 분이 많을 겁니다.
단일 피험자 설계의 특징은 첫째, 행동의 지속적인 평가와 intervention을 반복한다. 둘째, 기본적으로
소수 참여자 연구이나 피험자가 1명인 경우는 좀 드물고 보통 3명 정도이다. 때로는 20명 이상의 집단도 가능하다. 셋째, 명백한 행동에 대한 평가만 한다. 넷째.
시각적 분석과 비통계적인 분석 기법을 사용하며 최근에는 auto regression과 같은 분석 방법을 사용하기도 하나 사용자가 적습니다.
단일 피험자 설계의 장점은 첫째, 피험자의 차이를 고려할 수 있다. 둘째, 시간에 따른 차이를 반복측정할 수 있기 때문에 피험자 내 차이를 관찰할 수 있다. 셋째, 단일 피험자 내에서 효과를 치밀하게 관찰할 수 있기 때문에 임상 및 교육 현장에서 치료나 교육 방법의 효과를 연구하기 위해 많이 사용합니다. 다만 측정 대상이 측정 가능한 행동으로 엄격하게 제한되기 때문에 적용 가능한 분야 또한 매우 제한됩니다.
단일 피험자 설계를 적용하기 위한 목표 행동은 크게 세 범주로 나눌 수 있는데
첫째, 행동 과잉(공격 행동 둥), 둘째, 행동 부족(의사소통의 어려움 등), 셋째, 부적절한 자극 통제하의 행동(노출증 등)이며 이때 목표 행동은 다음의 3가지 요소를 충족하도록 조작적으로 정의되어야 합니다.
1. 객관적일 것 : 명확하게 정의내려지고, 관찰가능한 사건이어야 함.
2. 분명할 것 : 정의에 익숙하지 않은 사람도 쉽게 이해하고, 반복하고, 다른 말로 바꿀 수 있을 정도로
3. 완전할 것 : 포함하고 포함하지 않는 행동에 대한 기준이 있음.
단일 피험자 설계에서 사용하는 목표 행동은 당연히 측정 가능해야 하는데 이 때 다음과 같은 측정 단위를 사용합니다.
1. 빈도/비율 : 일정시간동안 반응의 수(긴 시간동안 지속되는 행동에는 부적절)
2. 지속시간(duration) : 단일 행동의 시작과 끝 사이의 간격
3. 반응지연시간(latency) : 특정 자극의 시작과 반응 시작 사이의 시간 간격
4. 목표 도달 반응 횟수
: 행동이 일정수준(정해진 목표)에 도달하는데 소요되는 반응 횟수(많이 사용되지 않음)
5. 강도 : 행동의 세기 또는 정도(측정이 어려워 많이 이용되지 않음)
6. 결과물 : 여러가지 행동이 발생했는지 아닌지를 재는데 유용. 한 가지 이상의 목표 행동이 있을 때 편리
단일 피험자 설계에서 사용하는 기록 방법은 1. 연속기록 : 특정 시간 동안 모든 행동 기록 2. 간격기록 : 선택된 시간간격동안 특정 행동이 발생했는지를 기록하는 것이 대표적입니다. 여건 상 연속기록보다는 간격기록을 더 많이 사용합니다.
단일 피험자 설계에서 측정하는 목표 행동이 아무리 엄밀한 조작적 정의를 거쳐 선별되었다고 하더라도 신뢰도의 문제가 있을 수 있기 때문에
최소한 두 명의 관찰자 간 신뢰도가 임상 장면에서는 80%이상, 연구에서는 90%이상이 되도록 해야 합니다.
연구시 적어도 전체 회기의 25~30% 분량에서 신뢰도를 측정해야 하며 이 때 평정자는 충분한 훈련과 재교육, 관찰 중 상호작용 금지, 훈련상황과 실제상황의 유사성 증진으로 신뢰성을 높여야 합니다. 여건 상 어렵다면 video taping을 하여 나중에 평정하기도 합니다.
신뢰도를 계산하는데 있어 가장 많이 사용하는 구간 대 구간 신뢰도는 (동의구간/동의+비동의구간)X100으로 계산합니다.
단일 피험자 설계는 A-B, ABAB, Multiple Baseline Design(MBD), Changing Criterion Design(CCD)을 많이 사용하는데 MBD는 문제 행동, 피험자 혹은 셋팅에 따라 개별적인 기저선을 측정하고 나서 치료에 따라 각 기저선이 차례 차례 개별적으로 소거되는 설계이며 CCD는 A-B 설계와 비슷하나, 마라톤 대비 단계적 목표 상향 훈련처럼 치료 단계가 서로 다른 행동 기준을 요하는 하위 단계로 나뉘어 있는 설계를 말합니다.
앞에서도 말한 것처럼 단일 피험자 설계의 자료는 통계분석을 하지 않으며 즉각적으로 자료를 시각화해서 살펴보기 때문에 자료 수집 후 바로 그래프를 그려야 합니다. 주로 단순선 그래프, 막대 그래프, 누적 그래프를 많이 사용하는 데
각 처치 수준에서 적어도 세 자료점 이상을 기록해야 trend를 살펴볼 수 있습니다.
단일 피험자 설계의 자료 평가 기준은 당연히 행동의 변화 여부일텐데 평균의 변화, 경향의 변화, 수준의 변화를 중심으로 살펴봅니다.
* 월덴지기의 comment : 행동의 빈도가 매우 낮은 경우에는 적용하기가 어렵다고 하니 도박 행동을 드러내지 않으려고 노력하는 도박 중독자의 치료 과정에는 적용할 수가 없는 연구설계법이네요. 대략 좌절입니다. OTL 그렇더라도 행동수정기법을 적용할 수 있는 분야에서는 사용할 수 있겠습니다.
출처 : 2006년 임상심리학회 추계학술대회 워크샵 3 '단일표본 연구설계' 발췌 및 요약
이 글의 트랙백 주소 :: http://walden3.kr/trackback/690
이미 미국의 SPSS 본사에서는 SPSS 15.0과 AMOS 7.0의 선주문을 받고 있는 상황이니 3월에 출시된 14.0을 소개하는 것이 때늦은 감은 있습니다만...
Base System의 경우 현재 미국에서 1,599불에 판매되고 있습니다.
새로 추가된 기능은 크게
1. 그래픽 기능 향상
2. 데이터와 엑세스 관리 기능 향상
3. Data Validation 기능 추가로 나눌 수 있는데
그래픽 기능에서는 Graph와 Chart가 대거 추가되었고 새로운 chart 생성 interface가 추가되어 보다 쉽게 그래프를 작성할 수 있게 되었습니다.
데이터 관리 기능에서는 이전 version과 달리 여러 개의 data set을 동시에 창으로 띄워 관리할 수 있게 되었고 원본 데이터를 유지하면서 복제된 데이터를 이용해 변환이나 분석을 실행할 수 있게 되었습니다. 엑세스 관리 기능에서는 SAS 압축 파일을 읽어들일 수 있게 되었고 Stata 파일의 읽기/쓰기도 가능하게 되었습니다.
또한 분석 전에 데이터의 타당성을 검증하여 부적절한 케이스를 제거하거나 수정하는 기능과 다변량 이상치를 쉽게 식별하는 data validation기능이 새로 추가되었습니다.
SPSS 14.0은 AMOS 6.0을 포함할 수 있으며 10월에 한글판이 출시될 예정입니다.
덧. SPSS 14.0은 기존의 version과 달리 설치할 때, License Code뿐 아니라 License Authorization Wizard라는 프로그램을 통해 인터넷, 이메일, 전화 등을 이용한 정품 사용자 인증 절차를 마련해 두었습니다. 아직까지는 이 Authorization Wizard를 우회하거나 무시하고 설치할 수 있는 크랙킹 파일이 나오지 않은 상태입니다.
이것이 License Authorization Wizard입니다.
보시는 것처럼 인터넷, 전화, 이메일을 통해 Authorization을 받도록 되어 있습니다.
이 글의 트랙백 주소 :: http://walden3.kr/trackback/630
한국심리학회 하계연수회(1990)의 방법론 workshop 중 '중다변인의 분석'을 정리 요약한 자료입니다.
포함된 내용은 다음과 같습니다.
요인 분석의 개요, 기본 개념(유래, 분석목적, 가정, 개념들, Centroid method), 요인 추출(주성분 분석, 요인 분석, Maximum Likelihood, Alpha factoring, Image factoring), 요인의 수(의미, 일반적인 기준, 결정 방법), 요인 해석(개요, 규칙, 문제점), 요인 회전(미결정성 문제, 회전의 의미, 종류), 요인 패턴과 요인 구조(직교 회전, 사각회전), Kaiser 정상화, 요인 점수(산출 이유, 산출 방식)
상세한 내용은 첨부한 자료를 참고하시기 바랍니다.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/456
구조 방정식 모형의 절차는 다음과 같습니다.
* 모형 개발 -> 자료 수집 -> 모형 분석 -> 모형 평가 -> 모형 수정 -> 모형 비교
1. 모형 개발
구조 방정식 모형을 적용하는 데 있어 첫 번째 단계는 통계적으로 검증할 이론 모형을 개발하는 것입니다. 어떤 변수가 잠재 변수(latent variable)가 될 것인지, 어떤 표시 변수(indicator)를 이용해서 잠재 변수를 간접적으로 측정할 것인지 등을 결정해야 합니다.
보통 한 잠재 변수에 약 2~4개 정도의 표시 변수를 사용하는 것이 적당합니다.
2. 자료 수집
검증하려는 이론 모형의 복잡성을 고려하여 충분한 표본으로부터 자료를 수집하여야 합니다. 표본 수가 너무 작으면 추정 오차(estimation error)가 커지므로 추정된 미지수의 값을 신뢰할 수 없게 됩니다. 표본 크기에 대한 절대적인 기준은 없지만
일반적인 기준은 1) 추정하는 미지수 숫자의 5~10배 정도의 표본을 사용하는 것(Bentler & Chou, 1987), 2) 최소 150명 이상의 표본을 사용하는 것(Anderson & Gerbing, 1988) 등이 있습니다. 그 밖에
MacCallum, Browne & Sugawara(1996) 등이 제안한 power analysis 방법을 이용해서 power 수준이 0.8이 되는데 필요한 표본 수를 사용하는 방법도 있습니다.
3. 모형 분석
이론 모형을 개발하고 모형 검증을 위한 충분한 자료가 수집되면 모형을 분석하게 됩니다. 이때 구조 방정식 모형 분석 프로그램을 사용하여 개발한 모형에서 자유 미지수 값을 추정하게 됩니다.
추정 방법으로는 ML(maximum likelihood) estimation이 가장 많이 사용되는데 이는 수집된 자료의 공변량 행렬과 추정된 자유 미지수 값을 이용해 재생한 공변량 행렬 사이의 차이를 최소화하는 방법입니다. 모형의 적합도가 완벽하면 ML 방법으로 구해지는 F값(sample discrepancy function value)이 0이 되며 적합도가 나빠질수록 F값은 커집니다.
ML은 자료에 결측치(missing value)가 없다는 것을 전제로 하기 때문에 만약 결측치가 있으면 FIML(full-information maximum likelihood)를 이용합니다. FIML은 한 변수의 결측치가 무선적으로 발생했거나(missing completely at random, MCAR), 한 변수의 결측 여부가 다른 변수의 값에 의해 결정되는 경우(missing at random, MAR)에 listwise 또는 pairwise와 같은 전통적인 방법보다 정확하게 미지수 추정을 합니다(Arbuckle, 1996).
ML은 다변량 정규분포를 가정한 방법이므로 자료 수집 후 우선 다변량 정규분포 가정에 위배되지 않는지 검토해야 합니다. 가장 쉽게 사용할 수 있는 방법은 여러 통계 프로그램이 제공하는
Mardia 지수를 이용해서 검증하는 것인데 이 지수는 표본 크기에 민감하다는 사실에 유념해야 합니다.
다변량 정규분포에 대한 가정이 위배되었을 경우, ML대신 Robust ML(Satorra & Bentler, 1994)을 이용할 수 있는데, Robust ML은 EQS에서 제공하고 있습니다. Robust ML은 최근 결측치 자료에도 적용이 가능해졌습니다(Yuan & Bentler, 1998).
* 구조 방정식 모형 분석을 위한 프로그램들
1. LISREL(Joreskog & Sorbom, 1993)
1970년대 중반에 가장 먼저 개발된 프로그램입니다. 연구자가 직접 행렬표를 작성하여 프로그램을 짜야 한다는 어려움이 있었지만 회귀 분석을 바탕으로 한 SIMPLIS를 발표하면서 여전히 많이 사용되고 있습니다. LISREL의 장점은
잠재 변수 사이에 비선형 관계를 다룰 수 있어 잠재 변수 간의 상호작용 모형을 처리하는 데 있어 가장 강력합니다.
2. EQS(Bentler, 1995)
회귀 분석을 바탕으로 한 프로그램입니다. EQS는 모형에 사용되는 측정 변수의 분포가 정규 분포로부터 심하게 벗어나 있을 때에도 사용할 수 있는
Robust ML 방법을 제공하며,
모형의 특정 미지수에 동일화 제약을 하였을 때, 그 제약이 타당한지 LM(Lagrange Multiplier) 검사를 이용해서 검증할 수 있도록 해 줍니다. 따라서 동일화 제약이 많이 사용되는 다집단 분석(multi-group analysis)에 유용합니다.
3. AMOS(Arbuckle, 1999)
분석을 위해 프로그램을 짤 필요가 없고, 검증할 모형을 경로도로 직접 그려서 분석하는 그래픽 기법의 도입으로 엄청난 반향을 불러일으킨 프로그램입니다. 사용하기가 매우 쉽다는 장점이 있으며 잠재 변수의 평균을 추정해야 하는 LGM같은 복잡한 모형도 쉽게 분석할 수가 있습니다.
4. Mplus(Muthen & Muthen, 2001)
최근 주목받고 있는 프로그램입니다. AMOS에 비해 사용하기는 어려우나 다른 프로그램에서는 찾아볼 수 없는 강력한 기능을 많이 가지고 있어 주목받고 있는 프로그램입니다. Mplus는
구조 방정식 모형에서 비연속 변수를 종속 변수로 이용할 수 있으며 latent class model을 회귀 분석이나 LGM 등에 결합한 mixture model을 검증하거나 GGMM, Event history analysis 등 다양한 종단 모형과, 다층 모형과 구조 방정식 모형을 결합한 다층 구조 방정식 모형(multi-level SEM)도 검증할 수 있습니다.
출처 : 구조 방정식 모형의 원리와 응용(홍세희, 2003)
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/181
* 미지수(parameter)
간단히 말하면 미지수는 추정하고자 하는 값을 말합니다. 예를 들어, 독립 변수가 하나인 단순 회귀 분석에서의 미지수는 절편과 기울기(즉, 회귀 계수)입니다.
미지수에는 두 가지 종류가 있는데 하나는
자유 미지수(free parameter)로, 모형에서 자유롭게 추정되는 미지수이고, 다른 하나는
고정 미지수(fixed parameter)로 추정되지 않고 특정 값으로 고정된 미지수입니다. 구조 방정식 모형에 사용되는 잠재 변수는 실제로 존재하지 않는 변수로 척도(scale)가 없습니다. 따라서 척도를 부여하기 위해 잠재 변수의 변량을 특정 값으로 고정하거나, 여러 측정 변수 중 하나의 요인 계수(요인 부하량)를 특정 값으로 고정하게 됩니다. 이것이 고정 미지수입니다. 다른 예로는 특정한 미지수 값이 두 집단에 대해 같을 것이라는 가설에 따라, 두 값을 동일하게 고정해 놓고 그 가설을 검증하는 것이 있습니다. 특정 계수를 두 집단에 대해 같게 고정하는 방법을
동일화 제약(equality constraint)이라고 하고, 동일한 모형을 두 집단 또는 그 이상의 집단에 적용하여 집단 간 차이를 검증하는 분석을 다집단 분석(multi-group analysis)이라고 합니다.
* 자유도(degree of freedom)
SEM에서 자유도는 모형이 간단한 정도(간명성, parsimony)를 의미합니다. 정해진 수의 변수를 이용해 모형을 만들 때, 모형 A의 자유도가 10이고, 모형 B의 자유도가 15라면, 모형 B가 더 간단하다고 하는 겁니다. 즉, 정해진 수의 변수를 이용해 모형을 만들 때, 모형의 자유도가 클수록 모형은 더 간단하다고 할 수 있습니다.
자유도는 최대 가능한 미지수의 수와 이론 모형에서 구하고자 하는 미지수간의 차이값을 말합니다. 예를 들어, 포화 모형(saturated model)은 모든 미지수를 추정해야 하므로 최대 가능한 미지수의 수와 이론 모형에서 구하는 미지수가 동일하므로 자유도가 0이 됩니다.
또한 미지수의 수와 자유도의 합은 항상 최대 가능한 미지수의 수가 됩니다. p가 모형에서 사용되는 측정 변수의 수이고 q가 모형에서 구하고자 하는 미지수의 수라고 정의하면 수학적으로 최대 가능한 미지수의 수는 p(p+1)/2가 되며 자유도는 (p(p+1)/2)-q가 됩니다.
출처 : 구조 방정식 모형의 원리와 응용(홍세희, 2003)
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/177
구조 방정식 모형(Structural Equation Modeling; 이하 SEM)은 1990년대 중반 이후로 경영학, 심리학, 교육학, 사회학, 가정학, 간호학 등 여러 분야에서 널리 사용되고 있는 통계 기법으로 사회 과학 분야에 몸담고 있는 사람이라면 반드시 알고 있어야 하는 매우 중요한 통계 기법입니다.
* 구조 방정식 모형의 장점
1. 여러 개의 측정 변수를 이용해서 추출된 공통 변량을 변수(잠재 변수)로 사용하므로 측정 오차(measurement error)가 통제됩니다. 따라서 측정 변수만을 사용해 계수를 추정하는 회귀 분석 등에 비해 더욱 정확한 값을 추정해 줍니다.
2. 매개 변수(mediator)의 사용이 용이합니다. 매개 변수는 특성상 모형에서 독립 변수 및 종속 변수의 역할을 동시에 해야 하는데 회귀 분석에서 한 변수는 하나의 역할만을 해야 하므로 매개변수의 도입 및 평가가 쉽지 않고, 이것이 가능한 경로 분석(path analysis)의 경우는 잠재 변수가 아닌 측정 변수가 사용되므로 측정 오차를 제대로 통제할 수 없다는 문제가 있습니다.
3. 이론 모형에 대한 통계적 평가가 가능하기 때문에 연구자가 개발한 이론 모형이 실제 자료에 얼마나 부합되는지를 평가하고 수정할 수 있습니다.
* 구조 방정식 모형의 주요 개념
1. 잠재 변수(latent variable)
잠재 변수는 이론적, 추상적 개념으로 직접 관측할 수 없는 변수입니다. 행동 과학에서 사용되는 대부분의 개념이 잠재 변수에 해당합니다. 요인 분석(factor analysis)에서는 잠재 변수를 요인(factor)이라고 하고 path diagram에서는 원 모양으로 표시됩니다.
2. 측정 변수(measured variable)
측정 변수는 직접 관측할 수 있는 변수로 예를 들어, 지능, 길이, 무게 등이 해당합니다. 측정 변수는 잠재 변수를 간접적으로 측정하는데 사용될 수 있습니다. 측정 변수는 표시 변수(indicator)로 불리기도 하며 path diagram에서는 사각형 모양으로 표시됩니다.
3. 잠재 변수와 측정 변수의 관계
측정 변수의 값은 잠재 변수의 값과 오차에 의해 결정되는데 이를 수학적으로 표현하면 '측정 변수=k*잠재 변수+측정 오차'가 되고, 이 때 계수 k는 측정 변수와 잠재 변수의 관련성 정도를 반영하는데 k의 값이 클수록 측정 변수의 신뢰도가 높은 것을 의미합니다. 잠재 변수와 측정 변수의 관계를 그림으로 나타내면 아래와 같습니다.
(잠재 변수) -> [측정 변수] <- (측정 오차)
* 내생(endogenous) 변수와 외생(exogenous) 변수
간단히 말하면 어떤 모형 내에서
다른 변수에 의해 설명되는 변수를 내생 변수라고 하고
다른 변수에 의해 설명되지 않는 변수를 외생 변수라고 합니다. 이는 독립 변수, 종속 변수와 다른 개념인데 아래의 그림을 보시면,
[V1] -> [V2] -> [V3] : V2와 V3의 오차는 설명의 편의상 생략
위의 그림에서 V1은 V2에 대한 독립 변수, V2는 V1에 대한 종속 변수인 동시에 V3에 대한 독립 변수, V3는 V2에 대한 종속 변수입니다. V2의 경우처럼 독립 변수와 종속 변수의 개념은 한 변수의 다른 변수에 대한 상대적인 개념입니다. 이에 반해, 내생 변수와 외생 변수는 절대적인 개념입니다.
V1은 다른 변수에 의해 설명되지 않으므로 외생 변수이고, V2와 V3는 다른 변수에 의해 설명되므로 모두 내생 변수입니다. 위의 그림에서는 생략되었지만 V2와 V3의 오차 변수도 다른 변수에 의해 설명되지 않으므로 외생 변수입니다.
내생 변수는 다른 변수에 의해 설명되는데 아무리 많은 변수를 이용해서 설명한다고 하더라도 완벽하게 설명하기가 불가능합니다. 따라서 내생 변수의 변량 중, 설명되지 않은 나머지는 오차에 해당됩니다. 따라서
모든 내생 변수는 반드시 오차를 설정해주어야 합니다. 오차는 실제로 존재하는 변수가 아니므로 잠재 변수로 간주합니다(path diagram에서 원으로 그린다는 의미). 오차는 측정 오차와 설명 오차(또는 예측 오차)의 두 종류가 있습니다. 우선 그림을 보시겠습니다.
1) (F1) -> [V1] <- (E1)
측정 변수 V1은 잠재 변수 F1에 의해 완벽하게 설명되지 않으므로(측정 변수의 신뢰도가 완벽하지 않으므로) 설명되지 않는 나머지는 측정 오차(E1)입니다.
2) (F1) -> (F2) <- (E2)
설명 오차 E2는 내생 변수 F2가 외생 변수 F1에 의해 설명되고 남은 오차입니다. 측정 변수와 잠재 변수의 관계가 아닌 잠재 변수 간의 관계라는 점에 주목하기 바랍니다.
출처 : 구조 방정식 모형의 원리와 응용(홍세희, 2003)
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/176
Kwakstat은 현재 경북대학교 심리학과 교수로 재직중인 곽호완 선생님이 제작하신
무료 통계 프로그램이며
지금도 계속 업데이트가 되고 있습니다.
SPSS와 같은 상용 프로그램처럼 다양한 기능과 멋진 display를 볼 수는 없지만 모든 파일을 합친 용량이 1메가가 되지 않으며 install과정도 불필요한, 매우 가벼운 프로그램입니다.
압축된 파일을 해제하면 두 개의 폴더가 있는데 하나의 폴더(kwakstat_dos)에는 4.201 version의 도스용 Kwakstat 프로그램과 도움말 파일, 사용 설명서가 들어있고 다른 하나의 폴더(kwakstat_win)에는 곧바로 수치를 입력해 분석할 수 있도록 만들어진 HTML 파일들이 들어 있습니다. 루트에 있는 index.html 파일을 실행시키면 어떤 통계 분석을 할 수 있는지 보실 수 있습니다. 현재 Kwakstat 윈도우용 프로그램은 version 6.0206까지 개발되어 있습니다.
현재 제공되는 통계 분석은
'기술통계', '단순상관', '중다회귀', '독립 T 검증', '상관 T 검증', '일원 변량분석', '일원 반복측정 변량분석', 'ANCOVA', '카이자승검증', 'Mann-Whitney U 검증', 'Wilcoxon 검증'입니다.
곽호완 선생님이 도움말 파일에서 말씀하셨듯이 Kwakstat은 실제로 실험 디자인을 하고 공식에 직접 수치를 대입해 변량 분석과 같은 통계 분석을 해 본 사람만 사용하는 것이 좋습니다. Keppel, Kirk, McCall과 같은 1980년대 실험설계법의 대가들의 교재를 바탕으로 제작되었기 때문에 SPSS같은 프로그램의 click & drag 방식에 익숙한 분들은 사용하기가 매우 껄끄러울 겁니다.
변량 분석의 원리를 공식 단계에서부터 이해하고 실제 실험 디자인에 적용해보고 싶은 분들에게 권해 드립니다.
이 프로그램은
비매품이므로 이윤을 목적으로 배포하면 안되며 배포 시 반드시 출처를 명기해 주시기 바랍니다.
프로그램은 첨부한 파일을 내려받기 하시면 됩니다.
덧. Kwakstat의 소개와 프로그램 배포를 흔쾌히 허락해 주신 곽호완 선생님께 다시 한번 감사의 말씀을 드립니다.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/173
SPSS 13.0에 포함된 새로운 기능
지금까지 11.5 버전을 사용하다가 어둠의 통로를 이용(저도 어지간하면 정품을 사용하자는 주의지만 SPSS만큼은 개별 구입 불가능 품목입니다. 너무 비싸요. ㅠ.ㅠ)해 12.0을 구한 기쁨이 채 가시기도 전에 13.0이 출시되었다는 메일을 받았습니다. 뭘까요. 뒤처지고 있다는 이 느낌은(괜히 기분 나쁘다~).
쭉 훑어보니 12.0과 차별화할 수 있을 정도로 새로운 점은 찾지 못했습니다.
그래프 기능과 출력 매니지먼트 기능 강화는 제가 11.5에서도 제대로 구현하고 있지 못하니 특별히 영양가가 높아 보이지는 않고, 주목할 만한 것은 'Classification Trees'라는 새로운 분석 module이 포함된 것인데 아마도 clementine과 같은 data mining tool의 일부 기능을 사용할 수 있도록 한 것이 아닌가 싶습니다.
올해는 그냥 12.0을 충실하게 사용하는데 매진해야겠네요. 새로운 프로그램만 보면 제대로 사용하지도 못하면서 지름병이 도지니...
덧글. AMOS 5.0도 출시되었는데 쩝...
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/44
이 자료 역시 1990년 한국심리학회 동계연수회의 현장연구방법론 총론에서 요약, 발췌한 내용입니다.
현장 연구는 매우 많은 변인을 다루고 있음에도 실험실 연구에 비해 통제(control)가 미흡하게 마련이죠. 따라서 수집된 자료가 오염(confounding)되어 있거나 불완전한 경우가 많습니다.
이 자료에서는 이처럼 현장 연구에서 수집된 자료의 분석 전에 연구자가 직면하게 되는 문제들 중 대표적이면서도 중요한 몇 가지를 다루고 있습니다.
포함되는 내용은 다음과 같습니다.
○ 자료분석 이전의 검토 사항
○ 결측치(missing value)
- 결측치의 유형
- 결측치의 발생원인
- 결측치의 처리전략
- 자료의 추정
○ 이상치(outlier)
- 이상치의 검출
- 일변인적 이상치(univariate outlier)
- 다변인적 이상치(multivariate outlier)
- 이상치의 처리전략
○ 왜곡반응(response set)
- 사회적으로 바람직하게 반응하려는 경향(social desirability)
- 묵종반응경향(acquiescence response set)
- 극단적 반응경향(extremity biases)
- 왜곡반응의 통계적 처리방안
자세한 내용은 첨부한 자료를 참고하시기 바랍니다.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/123
이 자료도 1990년 한국심리학회 동계연수회의 현장연구방법론 총론 중에서 발표한 것입니다.
연구를 할 때, research design도 꼼꼼하게 했고, questionnaire도 구성했다면 소위 말하는 '질문지 뿌리기'를 하게 됩니다. 여기서 연구자가 범하기 쉬운 실수가 '다다익선'이라는 가치를 맹종하는 것이죠. ^^;;;
물론 많은 표본을 추출할 수 있다면 좋겠지만 이 역시도 모집단을 잘 반영한다는 기준이 충족되어야 하고 그 밖에도 알고 있어야 할 부분들이 적지 않습니다. 이 자료는 그러한 내용을 다루고 있죠.
자료에 포함된 내용은 다음과 같습니다.
○ 모집단의 정의
○ 전수조사, 표본조사의 선택
○ 표본 설계
○ 표본 추출법 - 확률 표본 추출법(probability sampling)
- 단순 무작위 추출법(simple random sampling)
- 체계적 표본 추출법(systematic sampling)
- 층화 표본 추출법(stratified sampling)
- 군집 표본 추출법(cluster sampling)
- 지역 표본 추출법(area sampling)
○ 표본 추출법 - 비확률 표본 추출법(nonprobability sampling)
- 할당 표본 추출법(quota sampling)
- 임의 판단 추출법(judgement sampling)
- 편의 추출법(convenience sampling)
- 눈덩이 추출법(snowball sampling)
○ 표본의 크기
자세한 내용은 첨부한 자료를 참고하시기 바랍니다.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/122
이 자료도 1990년 한국심리학회 동계연수회의 현장연구방법론 총론에서 발췌한 것입니다.
심리학에서 질문지를 사용한 연구를 하다 보면 자료수집 후 통계분석에 대한 고민은 열심히 하는데 정작 더 중요한 질문지 구성 및 선택을 간과하는 바람에 엉뚱한 자료가 모이는 경우가 많죠. 그걸 사후에 기술적으로 refining하려고 하다 보니 무리를 하게 되고 결국 자신의 연구 결과를 연구자가 믿을 수가 없게 되는 일도 생깁니다.
저는 가끔 통계 분석 아르바이트를 의뢰받는 경우가 있는데 연구 내용과 질문지가 맞지 않는 경우가 왕왕 있습니다. 그래서 연구자가 통계 방법론에 익숙하지 않으면 꼭 질문지 구성 단계에서부터 상담을 하도록 권합니다. 그래야, 저도 덜 힘들거든요.
이 자료는 질문지 구성법이 아주 구체적으로 기술되어 있지는 않지만 질문지법을 사용하려는 사람이라면 한번쯤 읽어보아야 할 내용으로 이루어져 있습니다. 분명 도움이 되실 겁니다.
자료에 포함된 내용은 다음과 같습니다.
○ 질문지 구성의 기본 원칙
- 응답자(respondent)에 대한 정확한 이해
- 응답자에 대한 심리적, 윤리적 보호
- 기술적인 원칙
○ 질문의 형태
○ 질문의 표현
○ 응답 형태
- 개방형과 폐쇄형
- 폐쇄형 선택지(alternative)의 구성
- '잘 모르겠다'와 '보통이다' 선택지
- 응답 강도(intensity)의 확인
- 응답 방식 제시
○ 질문 배열
○ 질문지 사전검사
○ 질문지 사전조사 결과의 평가
자세한 내용은 첨부한 자료를 참고하세요.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/121
이 자료는 예전에 제가 중앙대학교 학술 동아리 '사색'의 웹진에 투고를 했던 것입니다.
심리학을 포함한 행동 과학(behavioral sciences)에서는 변인 간의 관계를 검증하는 것이 매우 중요하죠. 실제로 연구를 진행하다 보면 많이 접하게 되는 관계 중 하나가 매개 효과(Mediation Effect)입니다. 그런데 의외로 심리학도들도 매개 효과에 대한 이해가 많이 부족하고 어떻게 검증하는지 모르는 경우가 많습니다.
심리학도라면 방법론을 전공하는 사람이 아니더라도 매개 효과 정도는 반드시 알고 있어야 한다고 생각합니다.
다음은 포함된 내용의 목차입니다.
○ 매개(Mediation)란 무엇인가?
○ 매개의 종류
○ 매개(Mediation)와 조절(Moderation)의 차이는 무엇인가?
○ 매개 효과의 통계적 검증 방법
○ 회귀 계수의 유의도 검증 방법
상세한 내용은 아래에 첨부한 자료를 참고하세요
○ 관련 사이트
Dave Mackinnon의 사이트
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/120
1990년에 열린 한국심리학회 동계 연수회(8회)의 현장연구방법론 총론 중 측정(measurement)에 대한 내용을 요약, 발췌해서 정리한 hwp파일입니다.
포함된 내용은 아래와 같습니다.
○ 측정(measurement)의 정의
○ 심리적 구성개념(construct) 측정의 문제점
○ 신뢰도(reliability)란
○ 고전 진점수 모형
○ 신뢰도 추정 절차
○ 신뢰도 계수의 선택
○ 타당도(validaty)란
○ 준거관련 타당도(criterion-related validity)
○ 예언 타당도(predictive validity)
○ 공시 타당도(concurrent validity)
○ 준거관련 타당도의 현실적 문제점
○ 내용 타당도(content validity)
○ 구성 타당도(construct validity)
○ 구성 타당도의 결정
○ 수렴 타당도(convergent validity)
○ 확산 타당도(divergent validity)
날짜를 보아하니 제가 대학원에 다니던 1998년 7월 이맘때에 정리한 거네요. 이 연구방법론 워크샵 자료집은 10년이 넘은 것임에도 통계 방법론을 공부하는 심리학도에게 상당히 짭짤한 가치가 있다고 생각합니다. 개인적으로도 많은 도움을 받았고요.
하나쯤 가지고 있으면 상당히 도움이 됩니다. 구할 수 있다면 최대한 구해서 확보하시는 게 좋을 겁니다.
- 온라인 문법/맞춤법 점검 -
이 글의 트랙백 주소 :: http://walden3.kr/trackback/114