; ; '논문, 통계학 공부' 카테고리의 글 목록 — 내일과 사랑이 있는 삶
통계초보자의 인과관계 이해하기 2부 - 회귀분석, 이중차분법, 도구변수법
·
논문, 통계학 공부
회귀분석 회귀분석(regression analysis)은 두 변수 간의 관계를 수학적으로 모델링하는 방법입니다. 예를 들어, 교육과 소득의 관계를 회귀분석을 통해 다음과 같이 표현할 수 있습니다. y는 독립변수 (x)의 주어진 값에 대한 종속 변수로 소득 x는 교육, β0​는 (x)가 0일때 y의 예측값인 절편, β1​은 (x)가 증가함에 따라 y가 변할 것으로 예상하는 회귀계수(기울기), ϵ는 추정치의 오차 또는 회귀 계수의 추정치에 변동이 얼마나 있는 지를 나타내는 오차항입니다. 이 모델은 교육이 소득에 얼마나 영향을 미치는지를 나타내는데, β1​의 값이 크면 클수록 교육이 소득에 더 큰 영향을 준다는 것을 의미합니다. 회귀분석을 통해 인과관계를 증명하려면, 다음 두 가지 가정을 만족해야 합니다. 오..
통계 초보자의 인과관계 이해하기
·
논문, 통계학 공부
인과관계부터 공부해야했는데 상관관계부터 공부하긴 했습니다. 오늘은 인과관계에 대해 공부해보고자합니다. 통계학에서 매우 중요한 개념중의 하나인 인과관계. 인과관계란 무엇이고, 어떻게 분석할 수 있는지, 그리고 왜 상관관계와 혼동되어서는 안되는지에 대해 이야기 해보겠습니다. 인과관계의 정의와 예시 인과관계란 하나의 사건(원인)이 다른 사건(결과)을 일으킬 때 둘의 관계를 말합니다. 예를 들어, 비가 오면 땅이 젖는다면, 비가 오는 것이 땅이 젖는 것의 원인이고, 땅이 젖는 것이 비가 오는 것의 결과입니다. 이때, 비가 오는 것과 땅이 젖는 것은 인과관계에 있다고 합니다. 이처럼 인과관계는 일상생활에서 많이 볼 수 있는 현상입니다. 예를 들면 담배를 피우면 폐암에 걸릴 확률이 높아진다. 공부를 열심히 하면 성..
통계 초보자의 상관관계분석이해하기
·
논문, 통계학 공부
논문 작성을 위해 통계 공부하는 초보자입니다. 전문가에게 맡겨서 한다는 분들도 많은데, 왠지 직접 공부해보고 싶어 져서 시작해 봅니다. 그런데 처음부터 난관이 많네요. 대학교 다닐 때 한 과목 통계학 개론을 들었던 것 같은데 잊어버린 지 오래고, 새롭게 시작하려니 용어도 익숙치 않고, 어찌 되었든 여러 논문을 공부하려니 알아야 하는 통계 용어들이 많아서 하나씩 하나씩 정리해보고자 합니다. 상관관계 (Correlation, 相關關係) 상관관계는 두대상이 서로 관련성이 있다고 추측되는 관계를 의미한다고 합니다. A와 B과 관련이 있다라고 논리적으로 이야기하고 싶을 때 주로 자주 사용하는 단어입니다. "A와 B는 상관관계가 있다" 그런데 어느정도 상관관계가 있는지에 대해서 알아야 하는 경우가 있습니다. 단순히..
신뢰수준, 유의수준, 유의확률
·
논문, 통계학 공부
통계적 가설 검정에서 사용되는 값으로 많이 쓰이기도 하고 가장 기본적으로 쓰이는 것이 신뢰 수준, 유의확률 P value와 유의 수준입니다. P value는 T-검정, 회귀 분석 등 다양한 통계 분석에서 사용되며, 가설검정의 통계적 유의성을 판단하기 위해 사용합니다. 이글에서는 신뢰 수준, 유의확률 (P value)과 유의 수준에 대해서 알아보고 올바른 해석에 대해서 이야기해보고자 합니다. 신뢰 수준연구에 있어서 데이터 전체를 조사하고 분석하는 것이 현실적으로 어렵기 때문에 대부분 표본 조사와 통계적 분석을 통해 신뢰도를 확보하고자 합니다. 그렇기 때문에 통계를 100% 신뢰하는 것은 매우 위험하다고 생각될 수도 있습니다. 하지만 100% 신뢰는 못하더라도 일반적으로 95% 이상 신뢰할 수 있으면 통계적..
모집단(population)과 표본(Sample) 그리고 표본 추출(sampling)
·
논문, 통계학 공부
통계학을 공부하거나 방송에서 설문조사 또는 통계를 이야기할 때 자주 듣게 되는 용어 중의 하나가 모집단과 표본이라는 용어입니다. 간단히 이야기 하면 모집단(population)이란 연구의 대상이 되는 전체 집단을 말하고, 표본(sample)이란 모집단에서 일정한 기준에 따라 선택된 일부분을 의미한다고 이야기 할수 있습니다. 예를 들어, 한국의 모든 성인 남성의 키를 조사하고 싶다면, 모집단은 한국의 모든 성인 남성이 되고, 한국의 성인 남성 1000명을 무작위로 뽑아서 키를 측정한다면, 표본은 1000명의 성인 남성이 됩니다. 모집단과 표본(Sample)의 차이점 모집단은 연구의 대상이 되는 전체 집단이고, 표본은 모집단에서 선택된 일부분. 모집단은 보통 무한하거나 매우 크기 때문에 모든 요소를 조사하기..
논문과 변수 유형
·
논문, 통계학 공부
통계학에서 많이 배우는 내용이기도 하지만 논문작성 초기에 많이 고민하게 되는 부분 중의 하나는 연구 설계 과정에서 측정하고자 하는 변수의 설정을 어떻게 할 것인지에 대한 것입니다. 그리고 측정 변수를 선택하는 것은 연구 설계에서 매우 중요한 부분이기 때문에 정확한 개념을 가지고 있어야 합니다. 논문을 작성하려면 연구 방법을 선택하고, 변수를 설정하고, 데이터를 수집한 이후 결과를 분석하고, 해석하는 과정을 거치게 됩니다 여기서 어떤 유형의 변수를 선택하느냐에 따라 연구 결과의 분석과 해석이 달라질 수 있기 때문에 변수의 유형을 구분하고, 내 연구에 필요한 변수를 선택하는 것은 매우 중요한 일이기도 합니다. 변수 유형 데이터는 변수의 측정값으로, 데이터 시트에 기록되는 값입니다. 변수는 이러한 데이터 즉 ..
통계 분석의 5단계
·
논문, 통계학 공부
통계분석이란 무엇일까요? 통계분석은 수집된 자료를 요약하고 해석하여 불확실한 사실에 대한 결론이나 예측을 하는 과정이라고 할수 있습니다. 통계분석은 거의 모든 학문과 분야에서 필요하고 중요한 역할을 하고 있습니다. 예를 들어, 실업률이나 물가지수와 같은 통계자료를 분석하여 경제상황을 파악하고 정책을 수립하거나, 임상연구에서 얻은 통계자료를 분석하여 치료의 효과나 부작용을 평가하고 환자에게 적절한 처방을 한다거나, 여론조사나 시장조사에서 얻은 통계자료를 분석하여 소비자의 성향이나 구매경향을 파악하고 광고나 판매전략을 수립하는 등의 다양한 역할을 합니다. 1단계 : 가설 및 연구 설계 2단계 : 데이터 수집 3단계 : 기술 통계 및 분석 4단계 : 가설을 검정 5단계 : 결과 해석 통계 분석의 ..
통계란 무엇인가?
·
논문, 통계학 공부
통계는 기업, 정부, 제조업 뿐만 아니라 물리학, 인문학, 사회과학등 사실상 모든 분야에서 사용되는 학문 분야입니다. 통계학은 미적분학과 선형대수학을 포함한 수학적 도구를 확률이론에 적용하면서 발전된 응용 수학의 한 분야라고 할 수 있습니다. 실제로 통계학은 소수의 객체 데이터 또는 표본의 특성을 연구함으로서 대규모의 개체 또는 집단의 속성을 파악하고자 하는 개념입니다. 전체 모집단에 대한 포괄적인 데이터를 수집하는 것은 매우 비용이 많이 들거나 어렵고, 불가능한 경우가 많기 때문에 수집이 가능한 수준의 데이터를 관찰하고, 그 데이터를 통해 전체 데이터를 대변할 수 있는 지를 판단하게 됩니다. 통계학자는 이러한 통계를 진행하기 위해 표본의 개인 또는요소에 대한 데이터를 측정하고, 수집한 이후 데이터를 분..