728x90
반응형

데이터 분석(Data Analysis) 5

difference between Mean and Median.

안녕하세요 지식마블입니다. Hi, Guys. I am Knowledge Marble, KM. This post is for global friends who want to figure out the difference between Mean and Median. These days, there are so many increasing people who want to learn Korean, so I also wrote Korean as well. So, this post can be duplicable of my Korean posting, but this can be helpful for those who learn either Korean and English. 오늘부터는 데이터분석의 기초가 되는 ..

[통계 기초] 평균(mean)과 중위수(median) 의 차이

안녕하세요 지식마블입니다. 오늘부터는 데이터분석의 기초가 되는 기본통계 지식에 대해서 공부해보도록 하겠습니다. #평균 mean과 중간값 median의 차이 평균과 중간값의 차이를 아시나요?평균은 영어로는 average 또는 mean 이라고 하구요중간값 또는 중앙값, 또는 중위수라고 하는 것은 median 이라고 합니다. 저는 개념이 중요하니깐, 확 와닿을 수 있도록 중앙값 또는 median이라고 말하겠습니다. (중위수는 뭔가 말이 어렵잖아요? ㅋ 그래도 알고는 계셔야 다른 사람하고 의사소통할 수 있습니다) 모든 과목이 마찬가지이겠지만, 통계를 공부할 때에도, 계산하는 법도 중요한데, 이걸 어떨 때 왜 쓰느냐, 그래서 이게 뭘 의미하느냐가 더 중요하다고 생각합니다. 왜냐하면, 계산 자체는 요새 너무 툴이 ..

가설, 신뢰수준, 유의확률 뜻

추리통계는 가설을 설정하고 분석을 통해 가설을 채택할지를 정합니다. 그렇다면 가설은 어떻게 정할까요? 영가설, 연구가설로 나누어, 이 둘 중 하나를 채택하면 나머지 하나는 저절로 사라지는 방법을 씁니다. 영가설? 연구가설?? 이게 뭘까요? - 영가설(H0): 연구가설과 반대되는 가설. 실제 분석이 이루어지는 가설- 연구가설(H1): 분석을 통해서 알아보고자 하는 내용으로 이루어진 가설 유의확률 (p-value)- 실제로는 영가설이 참 임에도 불구하고 통계분석으로 통해 영가설을 거짓 으로 판단할 가능성 - 즉, 연구결과가 실제 현상을 반영하지 못할 가능성- 즉, 유의확률이 낮아지면 낮아질수록, 영가설을 채택할 확률이 가능성이 높아짐. 신뢰수준- 실제로 영가설이 참이고 통계분석을 통해서도 영가설이 참으로 판..

척도

척도가 중요한 이유는 척도에 따라 분석방법이 달라지기 때문. 척도는 2가지 원칙을 지켜서 만들어져야 함. - 포괄성: 척도 안에 모든 경우의 수가 포함되어야 한다는 원칙- 상호배타성: 척도 안에 중복되는 경우의 수가 없어야 한다는 원칙 척도는 4가지 유형으로 구분됨1. 명목척도: 측정이 이루어지는 항목들이 상호배타적인 특성만을 가진 척도 ex) 남,여2. 서열척도: 명목척도들 중 항목들간에 서열이나 순위가 존재하는 척도 ex) 중졸, 고졸, 대졸3. 등간척도: 서열척도 중 항목들 간의 간격이 일정한 척도4. 비율척도: 등간척도 중 아무 것도 없는 상태를 '0' 으로 정할 수 있는 척도

모집단과 표본

모집단- 연구 또는 분석이 이루어지는 전체 대상 - 전수 조사할 수 있다면 가장 좋지만, 모집단의 대상이 클 경우 이는 불가능한 얘기임. 이러한 경우, 모집단을 대표할 수 있는 표본을 추출하는 것이 최상의 방법 표본- 모집단에서 추출한 일부로, 모집단의 속성들을 유추하는데 사용- 표본추출 방법 - 확률표본추출: 무작위로 표본을 추출. 모집단을 대표할 가능성이 높은 방법 - 비확률표본추출: 조사자의 편의나 판단에 의해서 표본을 추출. 모집단을 대표하지 않을 가능성이 존재. 확률표본추출보다 쉽기 때문에, 실제 연구에서 많이 사용 그렇다면, 표본을 얼마나 추출해야 모집단을 대표할 수 있는가 라는 의문이 생길 수 있는데, 이를 해결해주는 것이 바로 중심극한정리입니다. 중심극한정리- 표본이 30이상 충분히 클 때..

728x90
반응형