수학/확률과 통계(기초)
통계학 - 기술통계학: 상자그림
Dlise
2022. 9. 30. 21:46
상자그림
상자그림은 수치 자료를 표현하는 그래프이다.
최댓값, 최솟값, 중앙값, 제1사분위수, 제2사분위수, 제3사분위수를 이용해 그린다.
위 그림이 상자그림인데, 작성 순서는 다음과 같다.
1. 사분위수 값 Q1, Q3과 중앙값 Me를 결정한다.
2. Q1과 Q3를 찾아 형태로 연결하고, 중앙값 Me의 위치에 선을 표시한다.
3. 사분위수 범위 (Q3 - Q1)을 계산하고, Q1과 Q3로부터 각각 오른쪽, 왼쪽으로 1.5(Q3 - Q1) 크기 범위 내의 인접 값을 실선으로 연결하여 표시한다.
4. 안 울타리로부터 1.5(Q3 - Q1) 크기의 범위를 바깥 울타리로 표시한다. 안 울타리와 바깥 울타리 사이의 값을 보통 극단값이라 하고, 그 값이 존재하면 ○로 표시한다.
5. 바깥 울타리 경계를 벗어난 값을 *로 표시하고, 이 점을 극단값으로 판정한다.
그림과 함께 보자.
먼저 사분위수 값 Q1, Q3과 중앙값 Me를 구해 값에 맞게 상자를 그린다.
다음으로 1.5(Q3 - Q1)를 구한 후 해당 값을 안 울타리로 정한 후, 안 울타리와 가장 인접한 값을 상자와 연결한다.
안 울타리에서부터 다시 1.5(Q3 - Q1) 밖을 바깥 울타리로 정한다.
안 울타리와 바깥 울타리 사이에 있는 값이 있다면 ○ 로 표시한다. 바깥 울타리 밖에 있는 값은 * 로 표시한다.
(○: 보통 극단값, *: 극단값)