본문 바로가기

퍼짐정도 분산 표준편차 사분위편차(IQR) 변동계수 산포도 기초통계량(Degree of Dispersion) [빅공남! 통계같이 공부해요]

KAIST수학전공쌤 2021. 12. 28.

기초통계량은 크게 3가지로 분류할 수 있습니다. 오늘은 기초통계량 3가지중 2번째인 산포도(Degree of Dispersion)에 관한 주제입니다.

 

1. 기초통계량 종류

1) 중심경향 기초통계량 (Central Tendency)

2) 산포도(Degree Dispersion)

3) 분포의 형태 (Shape of Distribution)

 

2. 산포도(Degree of Dispersion)

데이터의 중앙으로부터 흔터진 정도를 측정하는 기술통계량

 

1) 분산(Variance)

편차의 제곱의 평균

2) 범위(Range)

데이터 구간의 길이 (최대값 - 최소값)

3) 사분위편차(Inter Quartile Range)

Q3 - Q1

(오름차순 25%, 50%, 75%,100%)

Q3 : 3분위수 (75% 숫자)

Q1 : 1분위수 (25% 숫자)

 

4) 변동계수 (CV, Coefficient Varicance)

표준편차/평균 의 비율(%) 값

두 집단의 상대적인 산포도의 크기 비교

즉, 두 집단의 상대적인 퍼진 정도 측정

 

3. 분산과 표준편차의 관계??

분산을 이해하려면 먼저 편차의 개념에 대해서 알고 있어야합니다. 편차는 변량 - 평균을 의미하며 편차의 합이 0이기 때문에 양수로 만들기 위해서 제곱을 합니다. 이때 제곱이 아닌 절대값을 택하면 평균절대편차라는 개념이 등장합니다. 분산은 결론적으로 평균으로부터 떨어진 거리의 제곱의 평균이 됩니다. 분산과 관련된 개념을 이해하려면 아래 단어에 익숙해지면 개념이 쉽게 이해가 갑니다.

 

1) 편차 : 변량 - 평균

※ 편차의 합 = 0 이기 때문에

양수로 만들려고 함

☞절대편차, 분산 개념 등장

2) 절대편차 : 변량 - 평균의 절대값

3) 평균절대편차 : 절대편차의 평균

4) 분산 : 편차의 제곱의 평균

5) 표준편차 : 루트 분산

☞ 편차의 합이 0이기 때문에

☞ 분산을 제곱의 합의 평균으로 계산

☞ 수치적으로 제곱 떄문에 큰 값이 나오게됨 ☞ 다시 루트를 붙여서 숫자를 줄이자

☞ 표준편차는 루트 분산이라고 외우는데

그 이유는 편차를 임의로 제곱해서 분산을

구했기 때문에 다시 루트를 붙여서

표준 편차라고 칭함.

 

빅공남 통계영상에서는 아래 개념을 쉽게 이해할 수 있게 예제를 통해서 쉽게 설명을 하고 있습니다. 포스트 맨 아래 유트브 링크에서 쉽게 이해하는 영상을 볼 수 있습니다.

 

사진 삭제링크

사진 설명을 입력하세요.

빅공남 절대편차 이해하기 (유트브 강의자료)

 

4. 사분위 편차 (IQR)

4분위편차는 데이터를 오름차순으로 정리한 뒤 25%,50%,75%,100% 지점을 찾습니다. 이때 순서대로 Q1,Q2,Q3,Q4라 하며 IQR은 Q3-Q1의 값을 의미합니다. 즉, IQR은 중앙값에서 50%의 숫자가 어느 정도 범위로 존재할지에 관한 수치입니다.

 

5. 변동계수(Coefficient Variance)

변동계수 CV는 표준편차/평균의 비율(%) 을 나타냅니다. 평균값 대비 분포가 얼마나 퍼져있는가를 측정하는 값입니다. 절대 수치가 아닌 비율을 측정하므로 서로 다른 두집단의 상대적인 분포의 퍼짐 정도를 측정하는 수치입니다. 아래의 예시를 통해서 변동계수로 두 집단을 비교해보겠습니다.

사진 삭제링크

사진 설명을 입력하세요.

빅공남 변동계수 비교

 

A집단 : 평균10, 표준편차2

B집단 : 평균20, 표준편차10

A집단의 CV = 2/10 *100% = 20%

B집단의 CV = 10/20 * 100% = 50%

 

 

[빅공남 유트브 채널 바로가기]

[빅공남! 통계 같이해요 바로가기]

[빅공남! 문과생을 위한 고등수학 13강]

[빅공남통계 - 산포도 기초통계량]

https://youtu.be/jXatzp3lyCU

 

 

 

 

댓글