#1-3 수치를 통한 연속형 자료의 요약-2

티스토리 뷰

Univ/Statistics

#1-3 수치를 통한 연속형 자료의 요약-2

DevOpser 2016. 6. 26. 15:15

* 퍼진 정도의 측도

---->

- 모분산은 모집단의 분산, 표본분산은 표본집단의 분산이다.

- 표준편차는 루트 분산을 계산한 값이다.

* 제 100 x p 백분위수 구하는 방법

----> 기호로만 보니 무슨말인지 잘 모르겠다 예제를 통해서 확인하겠다.

예제)

1. 관측값을 작은값부터 크기 순서로 배열한다.

---->

31, 35, 37, 38, 38, 39, 40, 40, 41, 42, 43, 44, 44, 45, 78

n = 16

- 제 50백분위수 구하기

n= 16, p = 0.5

n x p = 16 x 0.5 = 8 ----> 정수

(𝑛×𝑝) 번째 관측값과 (𝑛×𝑝+1) 번째 관측값의 평균

= 8번째 관측값과 9번째 관측값의 평균

= (40 + 40)/2 = 40

==> 제 50백분위수는 40이다. (제 50백분위수는 중앙값이다.)

- 제 20백분위수 구하기

n = 16, p = 0.2

n x p = 16 x 0.2 = 3.2 ----> 정수가아니다.

(𝑛×𝑝 의 정수부분 +1) 번째 관측값

= (3+1) 번째 관측값

= 38

==> 제 20백분위수는 38이다.

* 사분위수 범위

----> 사분위수란 데이터의 표본을 4개의 동일한 부분으로 나눈 값이다. 따라서 100을 기준으로 25씩 나눌수 있다.

----> 사분위수 범위는 제 1사분위수와 제 3사분위수 간의 거리이다. (Q3 - Q1)

이 범위는 데이터의 중간 50%에 대한 범위이다.

* 변동계수

- 상대적으로 퍼진 정도를 나타내는 수치로서 변동계수는 표본평균에 대한 상대적인 퍼진 정도를 백분율(%)로 나타낸다.

----> 변동계수가 클수록 데이터의 편차가 크다.

예제)

	A회사	B회사
표본평균	77417	7100
표준편차	816	429
변동계수	1.11	6.04

----> A회사의 표준편차가 B회사의 표준편차보다 크기때문에 A회사의 데이터가 평균과 떨어진값이 더 많다고 할 수있다. 그러나 변동계수를 보면 A회사의 변동계수가 B회사의 변동계수보다 더 작기 때문에 변동이 작다는 것을 알 수 있다.

만일 주식을 매입한다면 어느 회사의 주식을 매입할것인가? ㅎㅎ

'Univ > Statistics' 카테고리의 다른 글

#1-4 두 연속형 변수의 요약: 상관계수 (0)	2016.06.27
#1-3 수치를 통한 연속형 자료의 요약-3 (0)	2016.06.26
#1-3 수치를 통한 연속형 자료의 요약-1 (0)	2016.06.25
#1-2 연속형 자료의 도수분포표 작성방법 (0)	2016.06.23
#1-2 표와 그림을 통한 자료의 요약 (0)	2016.06.23

공유하기 링크

페이스북
카카오스토리
트위터

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

감성과 공학

TAG more

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

글 보관함

Work Hard, Play Harder

티스토리 뷰

#1-3 수치를 통한 연속형 자료의 요약-2

'Univ > Statistics' 카테고리의 다른 글

티스토리툴바