본문 바로가기

기술통계 vs 추론통계 [빅공남 통계 같이 공부해요]

KAIST수학전공쌤 2021. 7. 21.

 

 

기술통계 추론통계 빅데이터 분석기사 필기 2과목 빅데이터 탐색에선는 통계에 관련된 내용들이 많이 등장합니다. 빅공남 통계노트에서는 통계 개념과 관련된 내용들을 공부하면서 정리해보고자 합니다. 오늘은 첫번째 시간으로 2-3 과목 통계기법을 큰 틀에서 보면 기초통계 vs 추론통계로 나눌 수 있습니다. 오늘은 먼저 기초통계와 추론통계가 무엇인지에 대해서 정리를 해보고자 합니다.먼저, 기초통계 vs 추론통계를 이해하기 위한 그림을 찾아보았습니다.

.

1. 기술통계란?

 

데이터를 묘사하고 요약하는 정보를 주는 통계를 말합니다. 기술통계는 때문에 차트와 그래프로 시각화해서 나타내기도 합니다. 단순한 데이터 요약이 아니라 데이터의 특성을 요약할 수 있는 정량화 된 수치로 표현하는 통계를 의미.

 

2. 추론통계란?

표본으로 부터 모집단을 예측 또는 추측하는 통계 입니다. 또한 추측이 어느 정도 맞출수 있는지 검정하는 통계도 추론통계입니다. 추론통계는 크게 2가지 주제로 볼 수 있습니다.

1) 추정 (Estimation)

2) 가설검정(Testing Hypothesis)

 

3. 기술통계 vs 추론통계 ??

아래 그림과 같이 모집단과 표본에 대해서 보면 쉽게 이해를 할 수 있습니다. 우리나라 전체 인구 5천망명을 모집단(Population)이라고 생각하고, 추출한 10만명을 표본(Sample)이라고 봅니다. 10만명을 요약할 수 있는 정량화 된 값들을 구하는 것을 기술통계라고 볼 수 있습니다. 예를들어서, 10만명의 평균, 분산, 표준편차 등등을 계산해서 요약된 정보를 만들어 내는 것을 기술통계라고 합니다. 히스토그램, 파이차트 등등 시각화한 그래프로 표현하는 것도 기술통계를 하는 것으로도 볼 수 있습니다. 10만명으로부터 모집단 인구 5천만명의 분포를 추측하거나 예측하는 것을 추론통계라고 합니다.

 

4. 기술통계 vs 추론통계 관련 Keyword

기술통계에서는 기초통계량이라는 단어가 중요합니다. 3가지 정도로 요약해서 정리 할수 있습니다.

1) 중심경향성(Centeral Tendency)

평균(Mean), 중앙값(Median),

최빈값(Mode)

2) 산포도 (Dispersion)

분산(Variance), 표준편차(Std)

3) 분포(Distribution)

왜도(Skewness), 첨도(Kurtosis)

기술통계 , 출처 : datatab.net

추론통계에서는 크게 보면 2가지로 정리해 볼 수 있습니다.

 

1) 추론(Estimation)

점추정, 구간추정, 최대우도점추정,평균제곱오차,편향, 모평균 구간추정, 모분산 신뢰구간, 모비율 신뢰구간

 

2) 가설검정 (Testing Hypothesis)

귀무가설, 유의수준, 1종오류, 2종오류, 검정통계량,표본의 평균 검정, 평균차이 검정

 

유튜브 영상으로도 도움을 드리고자 유익한 콘텐츠를 만들고 있습니다. 유트브 구독과 좋아요 하시면 계속 빅공남 통계/빅데이터 관련 내용들을 를 보실 수 있습니다 ^^ 열심히 공부해서 유익한 정보로 인사드리겠습니다

 

 

[빅공남 유트브 채널 바로가기]

[빅공남! 통계 같이해요 바로가기]

[빅공남! 문과생을 위한 고등수학 13강]

[빅공남통계 - 기술통계 vs 추론통계

 

 

 

 

 

댓글