* 산점도(scatter diagram) : 두 연속형 변수 𝑥,𝑦에 대한 관측값 (𝑥,𝑦)가 짝을 이루어 주어졌다고 할 때, 변수 𝑥를 수평축에 놓고 변수 𝑦를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시한 그림. 탄소/수소 * 표본상관계수: - 점이 모여있는정도, - 변수 𝑥,𝑦에 대하여 관측값 𝑛개의 짝 𝑥1,𝑦1,⋯,𝑥𝑛,𝑦𝑛이 주어졌을 때 상관계수는 다음과 같이 계산한다. * 상관계수(r)의 특징 - ==> 상관계수 r은 음수가 될 수 있다. - r은 직선관계에서 가까운 정도를 나타내도 부호는 직선관계의 방향을 나타낸다. - 절대값이 1에 가까울수록 직선에 가깝다. - 표본상관계수의 단위는 없다. * 표본상관계수와 산점도의 대응 비교 - 양의 상관관계 - a가 b보다 강한 양의 상관관계..
*상자그림 상자그림 (box plot): 자료로부터 얻는 최솟값, 𝑄1, 𝑄2, 𝑄3, 최댓값을 가지고 그림을 그린 것.---->상자 그림은 표본 분포를 요약한 그래프로, 분포의 형상 및 중심 위치와 변동성을 표시한다. 상자그림의 작성과정1. 사분위수(𝑄1, 𝑄2, 𝑄3)를 결정한다.2. 𝑄1과 𝑄3를 네모난 상자로 연결하고, 중앙값(𝑄2)의 위치에 수직선을 긋는다.3. 𝐼𝐼 𝐼=𝑄3−𝑄1을 계산한다.4. 상자 양끝에서 1.5×𝐼𝐼 𝐼 크기의 범위를 경계로 하여, 이 범위에 포함되는 최솟값과 최댓값을 𝑄1과 𝑄3로부터 각각 선으로 연결한다.5. 양 경계를 벗어나는 자료값들을 *로 표시한다.(이 점들을 이상점이라 한다.) -----> 상자그림을 그리는 예제는 추후에 연습문제를 풀어가면서 그려보도록하겠다.
* 퍼진 정도의 측도 ----> - 모분산은 모집단의 분산, 표본분산은 표본집단의 분산이다. - 표준편차는 루트 분산을 계산한 값이다. * 제 100 x p 백분위수 구하는 방법 ----> 기호로만 보니 무슨말인지 잘 모르겠다 예제를 통해서 확인하겠다. 예제) 1. 관측값을 작은값부터 크기 순서로 배열한다. ----> 31, 35, 37, 38, 38, 39, 40, 40, 41, 42, 43, 44, 44, 45, 78 n = 16 - 제 50백분위수 구하기 n= 16, p = 0.5 n x p = 16 x 0.5 = 8 ----> 정수 (𝑛×𝑝) 번째 관측값과 (𝑛×𝑝+1) 번째 관측값의 평균= 8번째 관측값과 9번째 관측값의 평균 = (40 + 40)/2 = 40==> 제 50백분위수는 40이다. ..
* 중심 위치의 측도 (1) 평균(mean) : 가장 많이 사용되는 측도(가운데)로서 모든 관측 값의 합을 자료의 개수로 나눈 값. ----> 모집단의 평균과 표본집단의 평균은 계산방법은 같고 기호가 다르다. (2) 중앙값(median) : 중앙값은 전체 관측 값을 크기 순서로 배열했을 때 가운데 위치하는 값. * 중앙값을 구하는 방법 1. 관측값의 크기 순으로 정렬한다. 2. - 자료의 개수가 홀수이면, 중앙값은 (𝑛+1)/2 번째 관측값이다.ex) 다섯 손가락 중에서 중앙값을 구하면 (5+1)/2 = 3 이므로 가운데 손가락(중지) 가 중앙값이 된다. - 자료의 개수가 짝수이면, 중앙값은 𝑛/2 번째 관측값과 𝑛/2+1 번째 관측값의 평균이다. ex) 자료의 개수가 4개이면 (2번째값 + 3번째값)/..
* 연속형 자료의 도수 분포표 작성방법 1. 자료의 범위 결정 : 자료의 최댓값과 최솟값을 찾아 자료의 범위(최댓값-최솟값, range)를 구한다. 2. 계급의 개수 및 계급구간의 폭 결정 : 계급의 개수가 대략 5개에서 15개 정도 되도록 정하고, 자료의 범위를 계급의 개수로 나누어 얻은 값보다 조금 큰 값을 계급구간의 폭으로 정한다. (계급의 개수 및 계급구간의 폭을 결정하는 식이 있으나 지금은 다루지 않겠다. ) 3. 계급구간의 결정 : 모든 관측값을 포함하도록 각 계급구간의 경계점을 구한다. 4. 도수 구하기 : 각 계급구간에 속하는 관측값의 개수를 세어 계급의 도수를 구한다. 5. 상대도수 구하기 : 각 계급의 도수를 전체 관측값의 개수로 나누어 계급의 상대도수를 구한다. ex) 아래의 데이터는..
#자료의 형태는 수량변수(quantitative variable, 수치변수)와 질적변수(qualitative variable, 범주형 변수) 로 나누어진다. * 수량변수: 관측결과가 수량으로 표현되는 변수----> 결과가 숫자로 나오는 변수. - 연속형 변수(continuous variable): 연속적인 값을 갖는 변수 ex) 키, 몸무게 - 이산형 변수(discrete variable): 셀 수 있는 값을 갖는 변수----> 끊어지는 숫자 ex) 나이 * 질적 변수: 어떤 특성을 묘사하는 형태로 표현되는 변수----ex> 고향이 어디?, 몇학년?, 학점이 뭐? - 순위형 변수(ordinal variable): 순서의 의미가 있는 변수ex) 학점 A+, A, B+, B, ... - 명목형 변수(nomi..
- Total
- Today
- Yesterday
- 보드고글
- ADIASEYEWEAR
- LIKEAFIRST
- 모집단
- 아디다스고글
- nas2dual
- 스키고글
- 아이다스아이웨어
- 처음처럼
- 아디다스백클랜드
- 아디다스
- 비발디파크
- 고글
- 보드웨어
- 아디다스아이웨어
- 블루미러렌즈
- 스키장고글
- ADIDASEYEWEAR
- IPTIME NAS
- 스키웨어
- 라프
- 스노우고글
- 출시
- BACKLAND
- 백클랜드
- 아디다스스노우고글체험단
- iptime ssh
- iptime putty
- 아디다스스노우고글
- iptime telnet
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |