통계분석이란 무엇일까요?
통계분석은 수집된 자료를 요약하고 해석하여 불확실한 사실에 대한 결론이나 예측을 하는 과정이라고 할수 있습니다. 통계분석은 거의 모든 학문과 분야에서 필요하고 중요한 역할을 하고 있습니다. 예를 들어, 실업률이나 물가지수와 같은 통계자료를 분석하여 경제상황을 파악하고 정책을 수립하거나, 임상연구에서 얻은 통계자료를 분석하여 치료의 효과나 부작용을 평가하고 환자에게 적절한 처방을 한다거나, 여론조사나 시장조사에서 얻은 통계자료를 분석하여 소비자의 성향이나 구매경향을 파악하고 광고나 판매전략을 수립하는 등의 다양한 역할을 합니다.
< 목차 >
통계 분석의 단계
1단계 : 가설 및 연구 설계
가설 설정
어떤 주장이나 예상을 증명하거나 반박하기 위해 수집된 자료를 분석하는 과정에서 통계적 가설 검정을 사용하게 됩니다.
귀무 가설(영가설, null hypothesis) = 기각될 가설
로널드 피셔가 1966년 정의한 개념. 기본적으로 받아들여지는 가설로, 설정한 가설이 진실할 확률이 극히 적어 처음부터 버릴 것이 예상되는 가설로 때때로 "null"이라고 간단히 언급하기도 함.
차이가 없거나 의미있는 차이가 없는 경우의 가설이며, 통계적 가설 검정에서 증명하고자 하는 주장과 반대되는 주장입니다. 보통 차이가 없거나 효과가 없다는 내용을 담고 있습니다. 귀무 가설은 기각하고 싶어하는, 폐기하고 싶어하는 주장이며, H0로 표기합니다.
예를 들어, 어떤 신약이 감기에 효과가 있다는 주장을 증명하고자 한다면, 귀무 가설은 신약이 감기에 효과가 없다는 주장의 가설을 의미합니다.
대립 가설 (alternative hypothesis) = 대가설
대립 가설은 귀무 가설에 대응하여 귀무 가설이 거짓일 때 채택하기 위해 설정하는 가설. 사실처럼 알려져 있는 것이 상식과 다름을 증명하는 것.
다시 말하면, 대립 가설은 증명하고 싶어하는, 주장하고 싶어하는 가설이며, 주로 H1로 표기합니다.
예를 들어, 어떤 신약이 감기에 효과가 있다는 주장을 증명하고 싶다면, 대립 가설은 신약이 감기에 효과가 있다는 주장입니다.
통계적 가설 검정의 절차
1. 귀무 가설과 대립 가설을 설정합니다.
2. 적절한 검정 통계량을 선택하고 계산합니다.
3. 유의 수준을 결정하고 임계값을 구합니다.
4. 검정 통계량과 임계값을 비교하여 귀무 가설을 기각할지 채택할지 결정합니다.
5. 결론을 도출하고 해석합니다.
연구 설계
연구 설계란 논문이나 보고서를 작성하기 위해 데이터를 수집하고 분석하는 방법에 대한 계획을 말하는데, 연구 설계 과정을 통해 연구의 목적을 수립하고, 가설, 변수, 표본, 자료 수집 방법, 자료 분석 방법 등을 결정하게 됩니다. 연구 설계는 연구의 품질과 타당성을 결정하는 중요한 요소로, 연구 설계의 종류에는 기술적 연구, 탐색적 연구, 상관관계 연구, 실험 연구 등이 있습니다. 각 종류의 연구 설계는 다른 목적과 방법을 가지고 있으므로, 연구자는 자신의 연구 주제와 질문에 적합한 연구 설계를 선택해야 합니다.
연구방법의 종류
탐색적 연구 (exploratory research)
선행연구가 없거나 부족할 때, 변인 간의 관계에 대해 귀납적으로 결론 (이론 또는 가설)을 얻는 연구방법.
탐색적 연구는 연구가설이 없고, 연구 문제만 제시되며, 질적 자료를 수집하는 경우가 많으며, 관찰연구, 문헌연구, 사례연구, 델파이연구, 포커스 집단 연구, 내용분석법 등의 자료 수집 방법을 사용합니다.
실험연구 (experimental research)
원인과 결과 사이의 인과관계를 밝히기 위한 연구방법.
실험연구에서는 실험군과 대조군을 구성하고, 실험군에는 원인을 적용하고 대조군에는 적용하지 않는 방식으로 연구를 진행하고, 이를 통해 원인과 결과 사이의 인과관계를 파악하게 됩니다. 실험연구에서는 연구가설을 세우고 예측할 만큼 많은 선행연구가 있거나 선행연구의 결과가 분명할 때 활용됩니다.
상관관계연구 (correlational research)
둘 이상의 요인 (변수)간에 관계가 존재하는지 여부를 찾는 데 초점을 맞추고 관계의 본질에도 초점을 맞춘 연구방법.
상관관계연구에서는 인과관계를 입증하기 보다는 변수들 간의 상호작용을 분석하고, 조사연구, 관찰연구 등의 자료 수집 방법을 사용하며, 상관계수, 회귀분석 등의 자료 분석 방법을 사용합니다.
기술연구 (descriptive research)
연구 모집단에 대한 더 나은 이해를 얻기 위해 수행되는 연구방법.
기술연구에서는 변인 간의 관계나 차이에 대한 가설검정보다는 변인들의 특성이나 분포에 대한 기술적 정보를 제공하고, 조사연구, 관찰연구, 사례연제 등의 자료 수집 방법을 사용하며, 비율, 백분율, 빈도분포, 집중경향치, 변산도 등의 자료 분석 방법을 사용합니다.
연구설계에서의 비교 대상 결정
그룹 수준에서 비교할 것인지, 개인 수준에서 비교할 것인지, 아니면 둘 다 비교할 것인지
피험자간 설계 (between-subjects design)
독립변인의 수준에 따라 서로 다른 피험자들을 두 개 이상의 집단으로 나누고, 각 집단의 종속변인을 비교하는 연구방법.
예를 들어, 공부 방법이 학업 성취도에 미치는 영향을 알아보기 위해, A집단은 음악을 들으면서 공부하고, B집단은 조용한 곳에서 공부하게 한 후, 시험 점수를 측정하는 실험은 피험자간 설계 실험입니다.
피험자간 설계의 장점은 피험자의 개인차가 결과에 영향을 미치지 않고, 이월 효과나 학습 효과 등의 문제가 없다는 것이고, 단점은 많은 수의 피험자가 필요하고, 집단 간의 균형을 맞추기 어렵다는 것입니다.
피험자내 설계 (within-subjects design)
동일한 피험자들이 독립변인의 모든 수준을 경험하고, 각 수준에서의 종속변인을 비교하는 연구방법.
예를 들어, 스트레스가 기억력에 미치는 영향을 알아보기 위해, 같은 피험자들에게 스트레스 상황과 비스트레스 상황을 각각 제시하고, 단어 기억력을 측정하는 실험은 피험자내 설계 실험입니다.
피험자내 설계의 장점은 적은 수의 피험자로도 충분하고, 집단 간의 차이가 없다는 것이고, 단점은 이월 효과나 학습 효과 등의 문제가 있을 수 있고, 순서 효과를 제거하기 위한 반복순서를 조절해야 한다는 것입니다.
혼합 설계 (mixed design)
피험자간 요인과 피험자내 요인을 모두 포함하는 연구방법. 즉, 독립변인 중 일부는 서로 다른 피험자들이 경험하고, 일부는 동일한 피험자들이 경험하게 됩니다.
예를 들어, 성별이 자기주장에 미치는 영향을 알아보기 위해, 남성과 여성으로 구분된 두 집단에게 자기주장 교육과 비교군 교육을 각각 제공하고, 교육 전과 후의 자기주장 점수를 측정하는 실험은 혼합 설계입니다.
혼합 설계의 장점은 피험자간 설계와 피험자내 설계의 장점을 모두 활용할 수 있다는 것이고, 단점은 분석이 복잡하고, 상호작용 효과를 해석하기 어렵다는 것입니다.
예시)
예제: 실험연구설계
5분 동안의 명상 운동이 수학 시험 점수를 향상시킬 수 있는지 여부를 연구하기 위해 피험자 내 실험을 설계합니다.연구에서는 한 그룹의 참가자로부터 반복 측정을 수행합니다.
먼저, 참가자들로부터 기초 테스트 점수를 받습니다.그런 다음 참가자들은 5분간 명상 운동을 하게 됩니다.마지막으로, 두 번째 수학 시험에서 참가자들의 점수를 기록하게 됩니다.
본 실험에서 독립변수는 5분 명상 운동이며 종속변수는 중재 전후의 수학시험 점수입니다.
예제: 상관 연구 설계
상관관계 연구에서는 졸업 대학생의 부모 소득과 GPA 간에 관계가 있는지 여부를 검정합니다.데이터를 수집하기 위해 참가자들에게 설문지를 작성하고 부모님의 수입과 자신의 평점을 스스로 보고하도록 요청할 것입니다.
이 연구에는 종속 변수나 독립 변수가 없습니다. 변수에 영향을 미치지 않고 측정만 하려고 하기 때문입니다.
측정변수
연구에서 관심의 대상이 되는 특성이나 속성을 나타내는 변수로, 연구 설계를 계획할 때는 변수를 조작하여 측정 방법을 정확하게 결정해야 하며, 통계 분석을 위해서는 변수에 포함된 데이터의 종류를 알려주는 변수의 측정 수준을 고려하는 것이 중요합니다.
측정변수의 구분
양적변수(quantitative variable)
수치로 측정이 가능한 변수로, 양이나 크기를 나타내는 값.
예)키, 몸무게, 온도, 점수 등.
양적변수는 값의 연속성 여부에 따라 이산형 변수(discrete variable)와 연속형 변수(continuous variable)로 나뉩니다.
- 이산형 변수 : 연속적이지 않은 값을 가지는 변수, 고객 수, 판매량, 주사위 눈 등이 해당.
- 연속형 변수 : 연속적인 값을 가지는 변수로, 신장, 체중, 온도 등이 해당.
질적변수(qualitative variable)
수치로 측정이 불가능한 변수로, 종류나 분류를 나타내는 값.
예) 성별, 혈액형, 종교, 선호도 등.
질적변수는 순위를 매길 수 있는지 여부에 따라 명목형 변수(nominal variable)와 순서형 변수(ordinal variable)로 나뉩니다.
- 명목형 변수: 순위가 없는 변수로, 성별, 혈액형 등이 해당.
- 순서형 변수: 순위가 있는 변수로, 학점, 등급, 만족도 등이 해당.
데이터의 구분
범주형 데이터(categorical data)
수치로 측정이 불가능한 데이터로, 종류나 분류를 나타내는 값.
예) 성별, 혈액형, 종교, 선호도 등.
범주형 데이터는 순위를 매길 수 있는지 여부에 따라 명목형 데이터(nominal data)와 순서형 데이터(ordinal data)로 나뉩니다.
- 명목형 데이터 : 순위가 없는 데이터로, 성별, 혈액형 등이 해당.
- 순서형 데이터 : 순위가 있는 데이터로, 학점, 등급, 만족도 등이 해당.
정량적 데이터(quantitative data)
수치로 측정이 가능한 데이터로, 양이나 크기를 나타내는 값.
예)키, 몸무게, 온도, 점수 등
정량적 데이터는 값의 연속성 여부에 따라 이산형 데이터(discrete data)와 연속형 데이터(continuous data)로 나뉩니다.
- 이산형 데이터 : 연속적이지 않은 값을 가지는 데이터로, 고객 수, 판매량, 주사위 눈 등이 해당.
- 연속형 데이터 : 연속적인 값을 가지는 데이터로, 신장, 체중, 온도 등이 해당.
변수의 측정
연구에서 관심의 대상이 되는 변수의 값을 수치화하거나 범주화하는 과정.
변수의 측정은 연구의 목적과 가설, 변수의 성격, 측정 도구, 측정 방법 등에 따라 달라질 수 있으며, 연구의 신뢰도와 타당성을 결정하는 중요한 요소입니다.
변수 측정 단계
첫째, 측정하고자 하는 변수를 정의하고 구체화. 이때, 개념적 정의와 조작적 정의를 명확히 해야 합니다.
개념적 정의(conceptual definition)란
연구에서 사용되는 개념에 대해 용어가 의미하는 바가 무엇인지를 구체화하는 과정.
개념적 정의는 일반적으로 사회과학에서는 개념(concept)이란 특수한 현상들이 갖는 특징들을 일반화 시켜 추상적으로 표현한 것을 의미합니다.
예를 들어 학업성취도란 개념은 듣기, 읽기, 말하기 등의 합의 개념으로 개념적 정의를 내릴 수 있는 것처럼 개념적 정의는 연구의 대상이 되는 사람이나 사물의 속성, 사회적 현상 등을 개념적으로 정의하는 것으로 연구에서 사용되는 개념은 추상적이고 주관적일 수 있습니다.
조작적 정의(operational definition)란
추상적인 개념을 실제 현장에서 측정 가능하도록 관찰 가능한 형태로 정의해 놓은 것.
조작적 정의는 개념적 정의를 측정이 가능한 형태로 변환하는 것을 의미하는 것으로, 조작적 정의과정을 통해 변수를 측정가능(measurable)하고 조작가능(manipulatable)한 형태로 변화시킵니다.
예를 들어 상표애호도(brand loyalty)를 고객이 선택 가능한 제품의 브랜드 중에서 특정브랜드를 일관성 있고 지속적으로 구매하는 정도로 개념적 정의를 할 때 이를 측정하기 위하여 구체적인 관찰 가능한 현상으로 표현하면 조작적 정의가 됩니다. 즉 20회의 동일제품 구매 중에서 같은 브랜드의 구매회수로 상표애호도의 강도를 측정할 수 있습니다.
둘째, 적절한 측정 도구와 방법을 선택하거나 개발.
측정도구(measurement tool)
연구에서 사용하는 변수를 측정하기 위해 사용하는 장치나 도구.
예)설문지, 인터뷰, 관찰, 테스트 등.
측정도구는 연구의 목적과 가설, 변수의 성격, 측정 방법 등에 따라 달라질 수 있으며, 측정도구의 선택이나 개발은 연구의 신뢰도와 타당성을 결정하는 중요한 요소.
측정방법(measurement method)
측정도구를 사용하여 데이터를 수집하고 분석하는 방법.측정방법은 측정대상의 값을 수치화하거나 범주화하는 과정.
예) 비율척도, 등간척도, 순서척도, 명목척도 등
▶ 비율척도(ratio scale)는 측정대상의 값을 수치화하고, 절대적인 영점과 동일한 간격을 가지는 척도.
예) 무게, 길이, 시간 등. 비율척도는 사칙연산이 모두 가능하고, 비율의 개념이 적용됨.
▶ 등간척도(interval scale)는 측정대상의 값을 수치화하고, 동일한 간격을 가지지만 절대적인 영점이 없는 척도.
예) 온도, 지능, 성적 등. 등간척도는 가감연산은 가능하지만, 곱셈나눗셈과 비율의 개념은 적용되지 않습니다.
▶ 순서척도(ordinal scale)는 측정대상의 값을 서열화하고, 상대적인 크기나 순위를 나타내는 척도.
예) 학점, 만족도, 선호도 등. 순서척도는 크기비교는 가능하지만, 간격이나 비율은 알 수 없습니다.
▶ 명목척도(nominal scale)는 측정대상의 값을 구분하고, 분류나 명칭을 나타내는 척도.
예) 성별, 혈액형, 종교 등. 명목척도는 서열이나 크기비교가 불가능하고, 빈도나 비율만 계산할 수 있습니다.
셋째, 측정 도구와 방법의 신뢰도와 타당성을 평가하고 개선.
신뢰도(reliability)
측정도구가 일관된 결과를 내는 정도. 즉, 동일한 측정대상에게 동일한 측정도구를 반복적으로 적용했을 때, 측정값이 변하지 않는 정도. 신뢰도가 높으면 측정오차가 작다고 할 수 있음.
신뢰도의 측정
▶ 검사-재검사법: 동일한 측정대상에게 일정한 시간 간격을 두고 동일한 측정도구를 두 번 이상 적용하고, 두 번 이상의 측정값의 상관계수를 구하는 방법입니다. 이 방법은 시간적 안정성을 평가하는 방법입니다. 단점은 시간 간격이 너무 짧으면 기억효과나 연습효과가 있을 수 있고, 너무 길면 변인의 변화가 있을 수 있다는 것입니다.
▶ 동형검사법: 동일한 측정대상에게 동일한 난이도와 범위를 가진 두 개 이상의 유사한 측정도구를 동시에 또는 짧은 시간 간격으로 적용하고, 두 개 이상의 측정값의 상관계수를 구하는 방법입니다. 이 방법은 동시적 안정성을 평가하는 방법입니다. 단점은 유사한 측정도구를 만드는 것이 어렵다는 것입니다.
▶ 반분법: 동일한 측정대상에게 한 번만 적용한 후, 측정도구를 두 개의 부분으로 나누어 각 부분의 측정값의 상관계수를 구하는 방법입니다. 이 방법은 내적 일관성을 평가하는 방법입니다. 단점은 문항들이 동질적이지 않거나 속도검사인 경우 신뢰도가 과소평가되거나 과대평가될 수 있다는 것입니다.
▶ 내적 일관성 분석법: 한 번의 측정에서 각 문항이나 항목들이 전체 검사나 척도와 얼마나 일관된 관계를 보이는지를 분석하는 방법입니다. 이 방법은 문항들이나 항목들의 동질성을 평가하는 방법입니다. 대표적인 분석방법으로는 크론바흐 알파 계수(Cronbach’s alpha coefficient)가 있습니다.
타당성
측정도구가 측정하고자 하는 개념이나 현상을 제대로 측정하는 정도를 나타내는 것. 즉, 측정도구가 정확하고 타당하게 측정하고 있는지를 평가하는 것.
타당성의 구분
내용타당성(content validity)은 측정도구가 측정하고자 하는 내용을 얼마나 충실히 측정하고 있는지를 논리적으로 분석하고 평가하는 것.
예를 들어, 학업성취도를 측정하는 도구는 학습목표와 교육내용을 잘 반영해야 합니다. 내용타당성은 주로 전문가들의 판단이나 내용분석을 통해 확인할 수 있습니다.
준거타당성(criterion validity)은 측정도구의 결과를 이미 타당성이 입증된 다른 기준이나 도구와 비교하여 나타난 관련성의 정도.
예를 들어, 지능검사의 결과를 학업성적이나 다른 지능검사와 상관분석하여 준거타당성을 확인할 수 있습니다. 준거타당성에는 공인타당성(concurrent validity)과 예언타당성(predictive validity)이 있습니다. 공인타당성은 현재의 기준과 관련된 타당성이고, 예언타당성은 미래의 기준과 관련된 타당성입니다.
구인타당성(construct validity)은 측정도구가 가설적인 개념이나 특성을 구성한다고 생각할 수 있는 구인을 제대로 측정하고 있는지를 확인하는 것.
예를 들어, 스트레스를 측정하는 도구는 스트레스라는 구인이 실제로 존재하고 그것을 반영하는지를 검증해야 합니다. 구인타당성은 보통 요인분석이나 상관분석 등의 통계적 방법을 통해 확인할 수 있습니다.
2단계 : 데이터 수집
대부분의 경우, 전체 표본을 대상으로 데이터를 수집하는 것은 너무 어렵거나 비용이 많이 드는 경우가 많기때문에 표본에서 데이터를 수집하게 됩니다. 통계적 기법을 통해 적절한 표본데이터를 추출하는 것은 연구의 신뢰도와 타당성을 결정하는 중요한 요소 입니다.
통계분석을 위한 샘플링
샘플링(sampling)이란 연구의 대상이 되는 모집단(population)에서 일부를 추출하여 연구의 자료로 사용하는 과정.
샘플링(표본추출) 방법
확률적 샘플링(probabilistic sampling)
모집단의 각 구성원이 샘플에 포함될 확률을 알 수 있는 샘플링 방법.
확률적 샘플링에는 단순임의추출(simple random sampling), 계통추출(systematic sampling), 비례층화추출(proportional stratified sampling), 군집추출(cluster sampling) 등이 있습니다.
비확률적 샘플링(non-probabilistic sampling)
모집단의 각 구성원이 샘플에 포함될 확률을 알 수 없는 샘플링 방법.
비확률적 샘플링에는 편의추출(convenience sampling), 판단추출(judgmental sampling), 할당추출(quota sampling), 눈덩이추출(snowball sampling) 등이 있습니다.
데이터 수집과 샘플링 방법은 연구의 품질과 타당성에 큰 영향을 미치는 요소이기 때문에 연구자는 자신의 연구 목적과 가설, 모집단의 특성, 자료수집의 가능성 등을 고려하여 적절한 데이터 수집과 어떤 샘플링 방법을 선택하고, 그 방법의 장단점과 한계를 인식하고 고려해야 합니다. 또한 연구 결과를 일반화하거나 추론할 때는 자신이 사용한 데이터 수집과 샘플링 방법에 대해 명확하게 밝혀야 합니다.
확률적 샘플링은 모집단의 각 구성원이 샘플에 포함될 확률을 알 수 있기 때문에, 표본의 대표성과 신뢰도가 높으며, 통계적 추론을 수행할 때 오차의 범위나 신뢰수준을 계산할 수 있다는 장점이 있습니다. 하지만 모집단의 정확한 정보가 필요하고, 시간과 비용이 많이 들 수 있으며, 모집단이 너무 커서 랜덤하게 추출하기 어렵거나, 모집단이 너무 작아서 표본의 크기가 충분하지 않은 경우에는 적절하지 않을 수 있습니다.
비확률적 샘플링은 모집단의 각 구성원이 샘플에 포함될 확률을 알 수 없기 때문에, 표본의 대표성과 신뢰도가 낮으며, 통계적 추론을 수행할 때 오차의 범위나 신뢰수준을 계산할 수 없는 단점이 있습니다. 하지만 비확률적 샘플링은 모집단의 정보가 없어도 가능하고, 시간과 비용이 절약되며, 모집단이 너무 커서 랜덤하게 추출하기 어렵거나, 모집단이 너무 작아서 표본의 크기가 충분하지 않은 경우에도 사용이 가능합니다.
적절한 샘플링(표본추출) 절차 예시
연구에 사용할 수 있는 리소스를 바탕으로 데이터 수집 방법을 결정합니다.
예제: 샘플링(실험연구) 당신이 관심을 갖고 있는 표본은 서울지역의 고등학생들입니다.서울 시내 다양한 지역의 사립학교 3곳과 공립학교 7곳에 연락을 해서 3학년 학생들에게 실험을 진행할 수 있는지 알아봅니다.
참가자는 학교에서 자체적으로 선발하게 하고, 비확률 표본을 사용하는 경우에도 다양하고 대표적인 표본을 사용하려고 노력합니다.
예제: 샘플링(상관관계 연구)당신의 주된 관심 대상은 대한민국 남자 대학생들입니다.소셜 미디어 광고를 사용하여 서울 지역의 7개 대학이라는 소규모 하위 인구에서 4학년 남자 대학생을 모집합니다.
- 대학 환경 밖을 포함하여 학업을 널리 광고할 자원이 있습니까?
- 다양한 모집단을 대표하는 다양한 표본을 모집할 수 있는 방법이 있습니까?
- 접근이 어려운 그룹의 멤버들과 연락하고 후속 조치를 취할 시간이 있습니까?
충분한 샘플(표본) 크기 계산
표본 크기 계산 결정 방법은 연구의 목적과 가설, 모집단의 특성, 통계적 유의성과 검정력, 효과 크기 등을 고려하여 적절한 표본 크기를 결정하는 방법입니다. 표본 크기가 너무 작으면 실제로 존재하는 효과를 발견하지 못하거나, 표본의 대표성이 떨어질 수 있습니다. 반면 표본 크기가 너무 크면 자원의 낭비나 윤리적 문제가 발생할 수 있습니다. 따라서 연구자는 자신의 연구 상황에 맞는 적절한 표본 크기를 결정해야 합니다.
표본 크기 계산 결정 방법은 다양한 공식이나 소프트웨어를 이용할 수 있습니다. 예를 들어, 연속형 결과 변수를 가지는 경우, 다음과 같은 공식을 사용할 수 있습니다.
여기서 S는 무한 모집단의 표본 크기, Z는 Z 점수, P는 모집단 비율(50% 또는 0.5로 가정), Q는 1-P, M은 오차 범위입니다. Z 점수는 신뢰 수준에 따라 결정되며, 일반적으로 95% 신뢰 수준에서 1.96을 사용합니다. 만약 모집단의 크기가 유한하다면, 다음과 같은 보정 공식을 사용하여 표본 크기를 조정할 수 있습니다.
여기서 S’는 유한 모집단의 표본 크기, N은 모집단의 크기입니다.
이 외에도 범주형 결과 변수나 생존형 결과 변수를 가지는 경우, 다른 공식이나 소프트웨어를 사용할 수 있습니다. 예를 들어, G*Power, R, Web-based solution 등이 있습니다.
통계적 검정력(statistical power)은 가설 검정에서 대립가설이 사실일 때, 이를 사실로서 결정할 확률을 말합니다. 즉, 실제로 존재하는 효과를 발견할 수 있는 능력을 의미합니다. 통계적 검정력은 1-2종 오류의 확률로 계산할 수 있습니다. 2종 오류란 대립가설이 사실인데 귀무가설을 기각하지 못하는 오류입니다. 통계적 검정력은 1-2종 오류의 확률입니다.
기대효과크기(expected effect size)는 연구에서 관심 있는 현상이 모집단에 얼마나 존재하는지를 나타내는 수치입니다. 즉, 두 집단이나 두 변수 사이에 얼마나 큰 차이나 관계가 있는지를 측정하는 지표입니다. 기대효과크기는 연구의 목적과 가설, 선행연구의 결과 등을 고려하여 결정할 수 있습니다. 기대효과크기는 Cohen’s d, Pearson’s r 등 다양한 방법으로 표현할 수 있습니다.
모집단 표준편차(population standard deviation)는 모집단의 각 구성원이 모집단 평균으로부터 얼마나 떨어져 있는지를 나타내는 산포도의 척도입니다. 즉, 모집단의 변동성을 측정하는 지표입니다. 모집단 표준편차는 모집단의 각 구성원과 모집단 평균의 차이의 제곱합을 모집단 크기로 나눈 후 제곱근을 취한 값으로 계산할 수 있습니다.
유의수준 알파(significance level alpha)는 가설 검정에서 귀무가설이 사실일 때, 귀무가설을 기각할 위험을 나타내는 확률입니다. 즉, 실제로는 차이나 관계가 없는데 있다고 잘못 결론 내리는 오류를 의미합니다. 이러한 오류를 1종 오류라고 합니다. 유의수준 알파는 보통 0.05나 0.01 등으로 설정하며, 이는 1종 오류를 범할 최대 허용 확률을 의미합니다 .
3단계: 기술 통계 분석
모든 데이터를 수집한 후에는 데이터를 검사하고 요약하는 기술 통계량을 계산할 수 있습니다.
기술 통계 분석(descriptive statistics analysis)이란 데이터의 일반적인 특성을 요약하고 설명하는 분석 방법으로, 예를 들어, 데이터의 개수, 평균, 표준편차, 최댓값, 최솟값, 중앙값, 사분위수 등의 통계량을 계산하거나, 데이터의 분포나 관계를 차트나 그래프로 시각화하는 것이 기술 통계 분석의 예입니다.
기술 통계분석
데이터 분석 란 데이터의 특성, 목적, 가설 등에 따라 적절한 분석 기법이나 도구를 선택하여 데이터로부터 유의미한 정보나 인사이트를 도출하는 방법으로, 데이터 분석 방법은 다양한 분야와 적용 사례가 있으며, 일반적으로 통계학, 기계학습, 데이터 시각화 등을 포함합니다.
빈도분석(frequency analysis)
범주형 변수에 대하여 각 범주의 빈도수, 비율, 누적 비율 등을 계산하고 요약하는 방법. 예를 들어, 성별이나 학력과 같은 변수에 대하여 빈도분석을 할 수 있습니다.
막대차트(bar chart)는 범주형 변수의 각 범주에 대하여 수치적인 값을 막대의 길이로 표현하는 그래프로, 범주 간의 차이나 비교를 쉽게 파악할 수 있습니다. 예를 들어, 성별에 따른 평균 소득이나 학력에 따른 만족도와 같은 변수에 대하여 막대차트를 그릴 수 있습니다.
산점도(scatter plot)는 두 개의 연속형 변수의 관계를 점으로 표현하는 그래프로, 두 변수 간의 상관관계나 패턴을 시각적으로 확인할 수 있습니다. 예를 들어, 키와 몸무게, 광고비와 매출액과 같은 변수에 대하여 산점도를 그릴 수 있습니다.
※ 데이터를 표와 그래프로 시각화하면 데이터가 치우침 분포 또는 정규 분포를 따르는지 여부와 특이치 또는 결측치 데이터가 있는지 여부를 평가할 수 있습니다.
정규분포(normal distribution)
연속확률분포의 한 종류로, 평균을 중심으로 좌우대칭인 종 모양의 곡선으로 표현되는 분포.
정규분포는 자연현상이나 사회현상에서 많이 나타나는 분포로, 통계적 추론이나 가설 검정에 많이 사용되는데, 평균과 표준편차라는 두 개의 모수로 완전히 결정되며, 평균은 분포의 중심을, 표준편차는 분포의 퍼짐도를 나타냅니다. 정규분포의 확률밀도함수는 다음과 같은 식으로 표현할 수 있습니다.
여기서 \(\mu\)는 평균, \(\sigma\)는 표준편차입니다.
예) 인간의 키나 몸무게, IQ 점수 등, 측정 오차나 실험 오차 등, 주식 시장의 수익률이나 변동성 등
비대칭 분포(skewed distribution)
연속확률분포의 한 종류로, 평균을 중심으로 좌우대칭이 아닌 분포. 비대칭 분포는 한쪽 방향으로 긴 꼬리를 가지며, 평균과 중앙값이 다르게 나타나는데, 비대칭 분포의 비대칭도(skewness)란 분포의 비대칭 정도를 나타내는 지표로, 0보다 큰 경우 오른쪽으로 치우친 양적 편향(positive skewness), 0보다 작은 경우 왼쪽으로 치우친 음적 편향(negative skewness)을 의미합니다.
예) 소득이나 재산, 인구 등, 지진이나 홍수와 같은 자연재해 발생 빈도 등, 로그 정규 분포나 감마 분포와 같은 특수한 확률분포 등
중심경향성 측도(central tendency measure)
데이터의 분포의 중심을 나타내는 값으로, 데이터 전체를 대표할 수 있는 값.
예) 평균(mean), 중앙값(median), 최빈값(mode) 등
평균은 데이터의 합을 데이터의 개수로 나눈 값으로, 가장 대표적인 중심경향성 측도입니다. 평균은 데이터의 총량을 고려하므로, 이상치(outlier)의 영향을 많이 받습니다. 예를 들어, 1, 2, 3, 4, 5의 평균은 3이고, 1, 2, 3, 4, 100의 평균은 22입니다.
중앙값은 데이터를 크기 순으로 나열했을 때 가운데 위치하는 값으로, 데이터의 개수가 홀수이면 정확한 가운데 값이고, 짝수이면 가운데 두 값의 평균입니다. 중앙값은 이상치의 영향을 적게 받으므로, 데이터가 비대칭적일 때 유용합니다. 예를 들어, 1, 2, 3, 4, 5의 중앙값은 3이고, 1, 2, 3, 4, 100의 중앙값도 3입니다.
최빈값은 데이터에서 가장 자주 나타나는 값으로, 범주형 데이터나 이산형 데이터에 적용할 수 있습니다. 최빈값은 데이터에 따라 여러 개가 있을 수도 있습니다. 예를 들어, A, B, C, D, E의 최빈값은 없고, A, A, B, C, D의 최빈값은 A입니다.
변동성 측도(variability measure)
데이터의 분포가 얼마나 퍼져 있는지를 나타내는 값으로, 데이터의 변동성을 수치화할 수 있는 값.
예) 범위(range), 분산(variance), 표준편차(standard deviation) 등
범위는 데이터에서 가장 큰 값과 가장 작은 값의 차이로, 데이터의 최대 변동 폭을 나타냅니다. 범위는 계산이 간단하지만 이상치의 영향을 많이 받으므로 주의해야 합니다. 예를 들어, 1, 2, 3, 4, 5의 범위는 5-1=4이고, 1, 2, 3 ,4 ,100의 범위는 100-1=99입니다.
분산은 각 데이터와 평균과의 차이(편차)를 제곱하여 합한 후에 데이터 개수로 나눈 값으로, 데이터가 평균으로부터 얼마나 떨어져 있는지를 나타냅니다. 분산은 편차의 제곱합을 사용하므로 측정 단위가 제곱 단위가 됩니다. 예를 들어, \(x_1=2\), \(x_2=3\), \(x_3=7\), \(x_4=8\), \(x_5=10\)인 경우 평균은 6이고, 분산은 \(\frac{(2-6)2+(3-6)2+(7-6)2+(8-6)2+(10-6)^2}{5}=11.6\)입니다.
표준편차는 분산의 양의 제곱근으로, 데이터의 산포도를 나타내는 가장 대표적인 변동성 측도입니다. 표준편차는 분산과 달리 측정 단위가 원 데이터와 같으므로 해석이 용이합니다. 예를 들어, 위의 예에서 표준편차는 \(\sqrt{11.6}\)으로 약 3.4입니다.
4단계 : 가설 검정
표본을 설명하는 숫자를 통계량이라고 하고 모집단을 설명하는 숫자를 모수라고 합니다.
- 추정: 표본 통계량을 기반으로 모집단 모수를 계산합니다.
- 가설 검정: 표본을 사용하여 모집단에 대한 연구 예측을 검정하는 공식적인 과정.
추정(estimation)이란 표본의 정보를 통해 모집단의 특성을 추측하는 통계적 추론 방법입니다. 추정에는 점추정(point estimation)과 구간추정(interval estimation)이 있습니다. 점추정은 하나의 값으로 모수의 값을 추측하는 것이고, 구간추정은 모수가 포함될 것으로 기대되는 구간을 확률적으로 구하는 것입니다.
- 점 추정치: 정확한 모수에 대한 최적의 추측을 나타내는 값입니다.
- 구간 추정치: 모수가 어디에 있는지에 대한 최적의 추측을 나타내는 값의 범위입니다.
표본 데이터에서 모집단의 특성을 추론하고 보고하는 것이 목적이라면 논문에서 점과 구간 추정치를 모두 사용하는 것이 가장 좋습니다.
표본 통계량은 대표 표본이 있을 때 모집단 모수에 대한 점 추정치로 간주할 수 있습니다(예: 광범위한 여론 조사에서 현 정부를 지지하는 표본의 비율을 정부 지지자의 모집단 비율로 사용).
추정에는 항상 오차가 존재하므로 점 추정치 주변의 변동성을 표시하기 위해 구간 추정치로 신뢰 구간을 제공해야 합니다.
신뢰 구간은 표준 오차와 표준 정규 분포의 z 점수를 사용하여 대부분의 경우 모집단 모수를 찾을 것으로 예상되는 위치를 전달합니다.
모수 분석(parametric analysis)
모집단에 대해 특정한 분포를 가정하고 모수에 대해 추론하는 통계적 분석 방법.
예를 들어, 정규분포나 이항분포와 같은 확률분포를 모집단에 적용하고, 평균이나 비율과 같은 모수를 추정하거나 검정하는 것이 모수 분석의 예입니다.
가설검정
표본의 데이터를 사용하여 모집단 내 변수들 간의 관계에 대한 가설을 검정할 수 있습니다.가설 검정은 모집단에서 귀무 가설이 참이라는 가정에서 시작되며 통계 검정을 사용하여 귀무 가설이 기각될 수 있는지 여부를 평가합니다.
통계 검정은 귀무 가설이 참인 경우 표본 데이터가 예상되는 표본 데이터 분포의 위치를 결정합니다.
- 검정 통계량은 데이터가 검정의 귀무 가설과 얼마나 다른지 알려줍니다.
- p 값(유의수준)은 귀무 가설이 모집단에서 실제로 참인 경우 결과를 얻을 가능성을 나타냅니다.
통계적 검정.
비교 분석(comparative analysis) - 결과의 그룹 차이를 평가
두 개 이상의 집단이나 변수 간의 차이나 관계를 분석하는 통계적 분석 방법. 예를 들어, t-검정(t-test)이나 분산분석(ANOVA)과 같은 방법을 이용하여 두 개 이상의 집단의 평균 차이를 검정하거나, 카이제곱 검정(chi-square test)과 같은 방법을 이용하여 두 개 이상의 범주형 변수 간의 독립성을 검정하는 것이 비교 분석의 예입니다 .
회귀 분석(regression analysis) - 변수의 인과 관계 평가
독립변수와 종속변수 간의 인과관계를 수학적인 함수로 나타내고 예측하는 통계적 분석 방법. 예를 들어, 선형회귀분석(linear regression analysis)과 같은 방법을 이용하여 독립변수와 종속변수 간의 선형 관계를 파악하거나, 로지스틱 회귀분석(logistic regression analysis)과 같은 방법을 이용하여 종속변수가 범주형일 때 인과관계를 파악하는 것이 회귀 분석의 예입니다 .
상관 분석(correlation analysis) - 원인을 가정하지 않고 변수 간의 관계를 평가
두 개 이상의 변수 간의 상관관계(공변성)를 측정하고 해석하는 통계적 분석 방법으로, 두 정량적 변수 사이의 선형 관계의 강도를 나타냅니다. 예를 들어, 피어슨 상관계수(Pearson correlation coefficient)나 스피어만 상관계수(Spearman correlation coefficient)와 같은 방법을 이용하여 두 변수 간의 선형적인 상관 정도를 수치로 나타내거나, 산점도(scatter plot)와 같은 방법을 이용하여 두 변수 간의 상관 패턴을 시각적으로 나타내는 것이 상관 분석의 예입니다 .
그러나 표본의 상관 관계가 모집단에서 중요할 정도로 강한지 여부를 검정하려면 일반적으로 검정 시 상관 계수의 유의 검정을 수행하여 p 값을 얻어야 합니다.이 검정은 표본 크기를 사용하여 상관 계수가 모집단에서 0과 얼마나 다른지 계산합니다.
기타
Z 검정(Z test)
모집단의 특성(모수)에 대한 주장이나 추측을 표본의 정보를 이용하여 판단하는 통계적 가설 검정 방법 중 하나입니다. Z 검정은 모집단이 정규분포를 따르고, 모분산이 알려져 있을 때 사용할 수 있습니다. Z 검정은 표준정규분포를 이용하여 표본평균과 모평균의 차이가 유의한지를 판단합니다. Z 검정은 단일표본 Z 검정, 두 표본 Z 검정, 비율에 대한 Z 검정 등이 있습니다.
- 단일표본 Z 검정은 하나의 표본의 평균이 특정한 값과 같은지 다른지를 검정하는 방법입니다. 예를 들어, A 학교 3학년 학생의 국어 성취도 평균이 전국 3학년 국어 성취도 평균과 같은지 다른지를 확인하고자 할 때 단일표본 Z 검정을 사용할 수 있습니다.
- 두 표본 Z 검정은 두 개의 표본이 서로 관련이 없거나 독립적인 대상으로부터 얻은 경우, 두 표본의 평균이 같은지 다른지를 검정하는 방법입니다. 예를 들어, 남녀의 소득 차이나 치료군과 대조군의 효과 차이와 같이 서로 다른 대상에게 측정한 경우, 두 표본 Z 검정을 사용할 수 있습니다.
- 비율에 대한 Z 검정은 범주형 변수에 대하여 각 범주의 비율이 특정한 값과 같은지 다른지를 검정하는 방법입니다. 예를 들어, A 도시에서 100명을 조사한 결과 60%가 B 후보에게 투표할 것이라고 응답했을 때, 이 비율이 실제 전체 인구의 비율과 같은지 다른지를 확인하고자 할 때 비율에 대한 Z 검정을 사용할 수 있습니다.
T 검정
Z 검정과 비슷하지만, 모집단의 분산이나 표준편차를 알지 못하고 표본의 분산이나 표준편차를 이용할 때 사용하는 통계적 방법다. T 검정은 t 분포를 이용하여 표본평균과 모평균의 차이가 유의한지를 판단합니다.
T 검정에는 독립 표본 T 검정, 대응 표본 T 검정, 단일 표본 T 검정 등이 있습니다.
- 독립 표본 T 검정은 두 개의 표본이 서로 관련이 없거나 독립적인 대상으로부터 얻은 경우, 두 표본의 평균이 같은지 다른지를 검정하는 방법입니다. 예를 들어, 남녀의 소득 차이나 치료군과 대조군의 효과 차이와 같이 서로 다른 대상에게 측정한 경우, 독립 표본 T 검정을 사용할 수 있습니다.
- 대응 표본 T 검정은 두 개의 표본이 서로 관련이 있거나 동일한 대상으로부터 얻은 경우, 두 표본의 평균 차이가 0과 같은지 다른지를 검정하는 방법입니다. 예를 들어, 교육 전후의 성취도 차이나 다이어트 전후의 체중 차이와 같이 동일한 대상에게 반복적으로 측정한 경우, 대응 표본 T 검정을 사용할 수 있습니다.
- 단일 표본 T 검정은 하나의 표본의 평균이 특정한 값과 같은지 다른지를 검정하는 방법입니다. 예를 들어, A 학교 3학년 학생의 국어 성취도 평균이 전국 3학년 국어 성취도 평균과 같은지 다른지를 확인하고자 할 때 단일 표본 T 검정을 사용할 수 있습니다.
Z 검정과 T 검정의 주요 차이점
- Z 검정은 모집단의 분산이나 표준편차가 알려져 있어야 하지만, T 검정은 알지 못해도 됩니다.
- Z 검정은 정규분포를 따르는 모집단에서만 사용할 수 있지만, T 검정은 정규분포를 따르지 않는 모집단에서도 사용할 수 있습니다. 단, 표본 크기가 충분히 크면 정규분포에 근사한다는 중심극한정리에 의해 Z 검정을 사용할 수도 있습니다.
- Z 검정은 표준 정규분포를 이용하여 확률을 계산하지만, T 검정은 자유도에 따라 달라지는 t 분포를 이용하여 확률을 계산합니다. t 분포는 정규분포와 비슷하지만 꼬리 부분이 더 두꺼운 형태를 띠며, 자유도가 커질수록 정규분포에 가까워집니다.
단일표본 검정(one-sample test)
하나의 표본의 평균이 특정한 값과 같은지 다른지를 검정하는 방법입니다. 예를 들어, A 학교 3학년 학생의 국어 성취도 평균이 전국 3학년 국어 성취도 평균과 같은지 다른지를 확인하고자 할 때 단일표본 검정을 사용할 수 있습니다.
종속 표본 검정(paired-sample test)
두 개의 표본이 서로 관련이 있거나 동일한 대상으로부터 얻은 경우, 두 표본의 평균 차이가 0과 같은지 다른지를 검정하는 방법입니다. 예를 들어, 복용 전후의 혈압 변화나 교육 전후의 성적 변화와 같이 동일한 대상에게 반복적으로 측정한 경우, 종속 표본 검정을 사용할 수 있습니다.
독립적 표본 검정(independent-sample test)
두 개의 표본이 서로 관련이 없거나 독립적인 대상으로부터 얻은 경우, 두 표본의 평균이 같은지 다른지를 검정하는 방법입니다. 예를 들어, 남녀의 소득 차이나 치료군과 대조군의 효과 차이와 같이 서로 다른 대상에게 측정한 경우, 독립적 표본 검정을 사용할 수 있습니다.
외꼬리 검정(one-tailed test)
통계적 가설 검정에서 대립 가설을 방향성있게 표현한 귀무 가설 검정을 의미합니다. 예를 들어, 모평균이 특정 값보다 크다거나 작다는 가설을 검정하는 경우에 외꼬리 검정을 사용할 수 있습니다. 외꼬리 검정은 귀무 가설을 기각할 확률의 최대 허용 한계인 유의 수준을 한쪽 꼬리에만 할당하므로, 두 꼬리 검정보다 기각역이 넓어집니다.
두 꼬리 검정(two-tailed test)
통계적 가설 검정에서 대립 가설을 방향성없게 표현한 귀무 가설 검정을 의미합니다. 예를 들어, 모평균이 특정 값과 다르다는 가설을 검정하는 경우에 두 꼬리 검정을 사용할 수 있습니다. 두 꼬리 검정은 유의 수준을 양쪽 꼬리에 각각 절반씩 할당하므로, 외꼬리 검정보다 기각역이 좁아집니다.
외꼬리 검정과 두 꼬리 검정의 차이점은 다음과 같습니다.
- 외꼬리 검정은 대립 가설이 모수가 특정 방향으로만 변화한다고 주장하는 경우에 사용되고, 두 꼬리 검정은 대립 가설이 모수가 양쪽 방향으로 변화할 수 있다고 주장하는 경우에 사용됩니다.
- 외꼬리 검정은 유의 수준을 한쪽 꼬리에만 할당하고, 두 꼬리 검정은 유의 수준을 양쪽 꼬리에 각각 절반씩 할당합니다.
- 외꼬리 검정은 두 꼬리 검정보다 기각역이 넓고, 유의 확률이 작으므로, 귀무 가설을 기각하기 쉽습니다.
5단계 : 결과 해석
통계분석 마지막 단계는 분석결과의 해석 및 결론입니다. 결과의 해석은 가정된 모형의 모수추정, 가설검정, 모형평가 등을 실시하여 모형의 타당성을 검토하는 과정입니다. 분석결과의 결론은 해석된 결과를 바탕으로 연구목적과 연구가설에 대한 답을 제시하고, 연구의 한계와 향후 연구방향을 제안하는 과정입니다.
통계적 유의성
통계적 유의성이란 모집단에 대한 가설이 가지는 통계적 의미를 말합니다. 어떤 실험 결과 자료를 두고
"통계적으로 유의하다"라고 하는 것은 확률적으로 봐서 단순한 우연이라고 생각되지 않을 정도로 의미가 있다는 뜻.
반대로 "통계적으로 유의하지 않다"라고 하는 것은 실험 결과가 단순한 우연일 수도 있다는 뜻.
가설검정에서 통계값과 연구자가 설정한 수준(유의수준)을 비교·판단하여 영가설을 기각할 때, 연구가설이 "통계적으로 유의하다"라고 합니다.
통계적 유의성을 판단하는 방법에는 여러 가지가 있습니다. 대표적인 방법은 p-값(p-value)을 이용하는 것입니다.
p-값이란 영가설이 참일 때, 관측된 통계값보다 극단적인 통계값이 나올 확률을 말합니다. p-값이 작을수록 영가설이 거짓일 가능성이 높습니다.
따라서 p-값이 유의수준보다 작으면 영가설을 기각하고, 그렇지 않으면 영가설을 채택합니다.
p-값은 보통 0.05, 0.01, 0.001 등으로 나누어서 표시하며, 별표(*)로 표기하기도 합니다.
예를 들어, A와 B 두 집단의 평균 차이를 검정하는 t-검정에서 p-값이 0.003이라면, A와 B 집단의 평균이 같다는 영가설이 참일 때, 관측된 t-값보다 극단적인 t-값이 나올 확률은 0.003입니다. 이는 매우 낮은 확률로 우연히 발생할 가능성이 적습니다. 따라서 유의수준 0.05에서 영가설을 기각하고, A와 B 집단의 평균에는 통계적으로 유의한 차이가 있다고 결론짓습니다. 이때 별표로 표기하면 **로 표시합니다.
효과크기
효과의 크기(effect size)
두 집단이나 두 변수 사이에 얼마나 큰 차이나 상관이 있는지를 수치적으로 나타내는 지표.
효과의 크기는 통계적 유의성과는 다른 개념으로, 통계적 유의성은 표본의 크기에 영향을 받지만, 효과의 크기는 표본의 크기와 무관하지만 연구의 실질적 의미나 중요도를 평가하는데 도움을 주는 지표입니다.
효과의 크기는 여러 가지 방법으로 측정할 수 있습니다. 대표적인 방법으로는 코헨의 d(Cohen’s d), 에타 제곱(eta squared), 옴가 제곱(omega squared), 상관계수(correlation coefficient) 등이 있습니다.
- 코헨의 d : 두 집단의 평균 차이를 표준편차로 나눈 값으로, 두 집단이 얼마나 겹치는지를 나타냅니다.
- 에타 제곱, 옴가 제곱 : 분산 분석에서 사용되며, 전체 변동 중에 처리 변동이 차지하는 비율을 나타냅니다.
- 상관계수 : 두 변수 사이의 선형 관계의 강도와 방향을 나타냅니다.
구간 추정치(interval estimate)
모수가 포함될 것으로 예상되는 구간을 추정하는 것.
구간 추정치는 점 추정치(point estimate)보다 더 신뢰할 수 있는 정보를 제공하는데, 구간 추정치를 구할 때는 신뢰수준(confidence level)을 정해야 합니다.
신뢰수준 : 구간 추정치가 모수를 포함할 확률을 의미.
예를 들어, 신뢰수준이 95%라면, 동일한 방법으로 반복해서 구간 추정치를 구하면 100번 중 95번은 모수를 포함할 것이라는 뜻.
구간 추정치를 구하는 대표적인 방법으로는 정규분포를 이용한 구간 추정, t-분포를 이용한 구간 추정, 카이제곱 분포를 이용한 구간 추정 등이 있습니다.
정규분포를 이용한 구간 추정 : 모집단이 정규분포를 따르고 모분산이 알려져 있을 때 모평균의 구간 추정을 하는 방법.
t-분포를 이용한 구간 추정 : 모집단이 정규분포를 따르고 모분산이 알려져 있지 않을 때 모평균의 구간 추정을 하는 방법.
카이제곱 분포를 이용한 구간 추정 : 모집단이 정규분포를 따르고 모분산의 구간 추정을 하는 방법.
결과해석의 절차
- 자료의 정리: 수집한 자료를 표, 그래프, 그림 등으로 요약하고 정리.
- 자료의 분석: 통계적 방법을 이용하여 자료의 특성, 분포, 관계, 차이 등을 파악.
- 자료의 해석: 분석한 자료를 바탕으로 연구 목적과 가설에 대한 답을 찾고, 연구의 의미와 한계를 설명.
- 자료의 발표: 해석한 자료를 논문, 보고서, 발표 등의 형식으로 공개하고, 피드백.
결과해석의 고려사항
- 자료의 타당성: 수집한 자료가 연구나 실험의 목적과 방법에 적합하고, 신뢰할 수 있는지 확인.
- 자료의 신뢰성: 수집한 자료가 재현 가능하고, 일관성 있고, 오류가 없는지 확인.
- 자료의 유의성: 분석한 자료가 우연이 아니라 필연적인 결과를 나타내는지 확인.
- 자료의 해석력: 해석한 자료가 연구나 실험의 목적과 가설에 대한 증거를 제공하고, 새로운 지식이나 인사이트를 도출하는지 확인.
통계분석 예시
어느 학교에서 남학생 100명과 여학생 100명의 수학 성적을 비교하려고 합니다. 남학생의 평균 성적은 80점이고, 여학생의 평균 성적은 85점입니다. 남학생과 여학생의 수학 성적에 차이가 있는지 알아보려면 어떻게 해야 할까요?
1. 귀무 가설과 대립 가설을 설정합니다.
귀무 가설: 남학생과 여학생의 수학 성적에 차이가 없다. (H0: μ1 = μ2)
대립 가설: 남학생과 여학생의 수학 성적에 차이가 있다. (H1: μ1 ≠ μ2)
2. 적절한 검정 통계량을 선택하고 계산합니다.
두 집단의 평균 차이를 비교하기 위해 독립표본 t-검정 을 사용합니다.
t-검정식은 다음과 같습니다: t = (X̅1 - X̅2) / √(s²p/n1 + s²p/n2)
여기서 X̅1과 X̅2는 각 집단의 표본 평균, n1과 n2는 각 집단의 표본 크기, s²p는 두 집단의 표본 분산의 가중평균입니다.
s²p = ((n1 - 1)s²1 + (n2 - 1)s²2) / (n1 + n2 - 2)
여기서 s²1과 s²2는 각 집단의 표본 분산입니다.
문제에서 주어진 값들을 대입하면 다음과 같습니다:
X̅1 = 80, X̅2 = 85, n1 = n2 = 100, s²1 = s²2 = 100
s²p = ((100 - 1)100 + (100 - 1)100) / (100 + 100 - 2) = 100
t = (80 - 85) / √(100/100 + 100/100) = -5 / √(2) ≈ -3.54
3. 유의 수준을 결정하고 임계값을 구합니다.
유의 수준은 보통 0.05나 0.01로 설정합니다. 여기서는 0.05로 설정하겠습니다.
유의 수준이 0.05이고, 대립 가설이 양측이므로, 양쪽 꼬리 검정을 사용합니다.
양쪽 꼬리 검정에서는 유의 수준을 반으로 나누어 각 꼬리에 할당합니다. 즉, 유의 수준이 0.05이면, 각 꼬리에는 0.025가 할당됩니다.
자유도는 두 집단의 표본 크기의 합에서 2를 뺀 값입니다. 즉, 자유도는 100 + 100 - 2 = 198입니다.
t-분포표 에서 자유도가 198이고, 꼬리 확률이 0.025인 t-값을 찾습니다. 그 값은 약 ±1.97입니다.
즉, 임계값은 ±1.97입니다.
4. 검정 통계량과 임계값을 비교하여 귀무 가설을 기각할지 채택할지 결정합니다.
검정 통계량인 t가 임계값인 ±1.97보다 작거나 큰지 확인합니다.
t가 ±1.97보다 작거나 크다면, 귀무 가설을 기각하고 대립 가설을 채택합니다.
t가 ±1.97보다 크지 않고 작지도 않다면, 귀무 가설을 기각하지 않고 채택합니다.
t가 약 -3.54이므로, t는 ±1.97보다 작습니다.
따라서, 귀무 가설을 기각하고 대립 가설을 채택합니다.
5. 결론을 도출하고 해석합니다.
결론은 유의 수준 0.05에서 남학생과 여학생의 수학 성적에 차이가 있다고 할 수 있습니다.
해석은 다음과 같습니다: 남학생과 여학생의 수학 성적에 차이가 없다는 귀무 가설을 기각하고, 차이가 있다는 대립 가설을 채택했다는 것은, 남학생과 여학생의 수학 성적에 차이가 우연히 발생한 것이 아니라 통계적으로 유의한 결과를 나타냈다는것을 의미합니다.
[참고 자료]
남학생과 여학생의 수학 성적에 차이가 통계적으로 유의한 이유는 무엇일까요? 이에 대해 여러 연구와 자료가 있습니다. 예를 들어, 유니세프는 세계 100여 개국을 대상으로 한 보고서에서 남학생보다 여학생의 수학 과목 성취가 부족하고, 이는 부정적인 성 인식 때문이라고 분석했습니다. 즉, '여성은 선천적으로 수학을 못 한다’는 교사와 학부모, 또래의 고정관념이 여학생들의 자신감을 훼손하고, 수학에 대한 흥미와 도전 정신을 저하시킨다고 주장했습니다.
반면에, 한국에서는 남학생과 여학생의 수학 성적 격차가 크지 않거나, 오히려 여학생이 더 우위에 있는 경우도 있습니다. 예를 들어, 2021학년도 수능에서는 국어 영역에서 여학생이 표준점수 평균이 높았고, 1·2등급 비율도 남학생보다 높았습니다. 또한, 고등학교에서는 여학생의 수학 성취도가 남학생보다 더 높게 나타났습니다. 이러한 결과는 남녀의 수학 능력에 선천적인 차이가 없으며, 오히려 환경적인 요인이 중요하다는 것을 보여줍니다. 따라서, 남학생과 여학생의 수학 성적에 차이가 있다고 할 때, 그 원인은 단순히 성별에 귀결할 수 없습니다. 오히려, 수학 교육의 질과 방식, 사회적인 기대와 인식, 개인의 태도와 동기 등 다양한 요인들이 복합적으로 작용한다고 볼 수 있습니다.
'논문, 통계학 공부' 카테고리의 다른 글
통계 초보자의 상관관계분석이해하기 (2) | 2023.12.12 |
---|---|
신뢰수준, 유의수준, 유의확률 (1) | 2023.10.29 |
모집단(population)과 표본(Sample) 그리고 표본 추출(sampling) (3) | 2023.10.28 |
논문과 변수 유형 (3) | 2023.10.28 |
통계란 무엇인가? (1) | 2023.10.24 |