티스토리 뷰

* 퍼진 정도의 측도 


----> 


- 모분산은 모집단의 분산, 표본분산은 표본집단의 분산이다.


- 표준편차는 루트 분산을 계산한 값이다.




* 제 100 x p 백분위수 구하는 방법


----> 기호로만 보니 무슨말인지 잘 모르겠다 예제를 통해서 확인하겠다.



예제)


1. 관측값을 작은값부터 크기 순서로 배열한다.


----> 

31, 35, 37, 38, 38, 39, 40, 40, 41, 42, 43, 44, 44, 45, 78


n = 16


- 제 50백분위수 구하기 


n= 16, p = 0.5


n x p = 16 x 0.5 = 8 ----> 정수


(𝑛×𝑝) 번째 관측값과 (𝑛×𝑝+1) 번째 관측값의 평균

= 8번째 관측값과 9번째 관측값의 평균 

= (40 + 40)/2 = 40

==> 제 50백분위수는 40이다. (제 50백분위수는 중앙값이다.)



- 제 20백분위수 구하기 


n = 16, p = 0.2


n x p = 16 x 0.2 = 3.2 ----> 정수가아니다.


(𝑛×𝑝 의 정수부분 +1) 번째 관측값

= (3+1) 번째 관측값

= 38

==> 제 20백분위수는 38이다. 



* 사분위수 범위 


----> 사분위수란 데이터의 표본을 4개의 동일한 부분으로 나눈 값이다. 따라서 100을 기준으로 25씩 나눌수 있다.





----> 사분위수 범위는 제 1사분위수와 제 3사분위수 간의 거리이다. (Q3 - Q1)

이 범위는 데이터의 중간 50%에 대한 범위이다. 





* 변동계수


- 상대적으로 퍼진 정도를 나타내는 수치로서 변동계수는 표본평균에 대한 상대적인 퍼진 정도를 백분율(%)로 나타낸다.


----> 변동계수가 클수록 데이터의 편차가 크다. 




예제)



 

 A회사

B회사

표본평균


77417 

 7100

표준편차 


816 

429 

변동계수 


1.11 

6.04 



----> A회사의 표준편차가 B회사의 표준편차보다 크기때문에 A회사의 데이터가 평균과 떨어진값이 더 많다고 할 수있다. 그러나 변동계수를 보면 A회사의 변동계수가 B회사의 변동계수보다 더 작기 때문에 변동이 작다는 것을 알 수 있다.

만일 주식을 매입한다면 어느 회사의 주식을 매입할것인가? ㅎㅎ  



댓글