● 다섯숫자요약(Five Number Summary)
평균과 표준편차만으로는 원자료의 전체적인 형태를 파악하기 어렵기 때문에 우리는 최소값, 중앙값, 최대값, 하위 25%값, 상위 25%값 등을 활용하며, 이를 다섯숫자요약(Five Number Summary)라고 부른다.
최소값이란 원자료 중 값의 크기가 가장 작은 값을 의미한다. 사례에 제시된 한달 평균 생활비를 예로 들면 우리는 최소값으로부터 한달동안 생활비를 가장 적게 쓰는 사람의 수준을 알 수 있을 것이다. 이와는 반대로 최대값이란 원자료 중 값의 크기가 가장 큰 값을 의미한다. 이로부터 우리는 한달동안 생활비를 가장 많이 쓰는 사람의 수준을 파악할 수 있을 것이다.
중앙값이란 정확하게 중간에 있는 값을 의미한다. 이는 관찰값을 최소값부터 최대값까지 크기에 의하여 배열하였을 때 순서상 중앙에 위치하는 관찰값을 말한다. 예를 들어 46.0, 46.9, 48.2, 48.5, 50.4의 학생 5명 가운데, 즉 세 번째 있는 학생의 체중인 48.2가 중앙값이 되며, 이는 평균값과는 다르다. 자료값 중 어느 하나가 너무 크거나 작을 때 자료의 특성을 잘 나타낸다.
하위 25%값과 상위 25%값은 원자료를 크기 순으로 배열하여 4등분한 값을 의미한다. 백분위 수의 관점에서 제25백분위수, 제75백분위수로 표기할 수도 있다. 사례에 제시된 한달 평균 생활비를 예로 들면 우리는 이러한 값으로부터 상위층과 하위층의 경계선을 파악할 수 있다.
● 평균값과 중앙값
우리는 흔히 평균값을 집단을 대표하는 값으로 활용한다. 그러나 평균값과 중앙값이 다를 경우에도 평균값이 집단을 대표하는 값이라고 볼 수 있는 것인가 하는 의문이 발생한다. 다음에 제시된 유형들로부터 올바르게 통계값을 제시하는 방법에 대해서 생각해볼 수 있을 것이다.
위에 제시된 4가지 자료제시 유형 중에서 A유형과 C유형은 잘못된 것이라 할 수 있다. 우리가 살펴보았듯이 평균값과 중앙값은 엄연히 다른 개념이고, 모두 중요한 개념이므로 평균값인지 중앙값인지에 대해서 명확하게 제시해주어야 할 것이다. 이는 원자료에 대한 대표값으로써 정책을 결정한다든지 평가를 받는다든지 할 때 중요한 역할을 하게 되기 때문이다. 또한, 우리가 통계값을 제시할 때에는 평균값과 중앙값 모두 똑같은 중요도를 갖고 활용할 필요가 있을 것이다.
===========================================================================
● 도표의 종류별 활용
① 선(절선) 그래프
선(절선) 그래프의 가장 기본적인 활용은 시간적 추이(시계열 변화)를 표시하는데 적합하다.
활용 예) 년도별 매출액 추이 변화 등
② 막대 그래프
막대 그래프는 비교하고자 하는 수량을 막대 길이로 표시하고, 그 길이를 비교하여 각 수량간의 대소관계를 나타내고자 할 때 가장 기본적으로 활용할 수 있는 그래프이다.
활용 예) 영업소별 매출액, 성적별 인원분포 등
③ 원 그래프
원 그래프는 일반적으로 내역이나 내용의 구성비를 분할하여 나타내고자 할 때 활용할 수 있는 그래프이다.
활용 예) 제품별 매출액 구성비 등
④ 점 그래프
점 그래프는 지역분포를 비롯하여 도시, 지방, 기업, 상품 등의 평가나 위치, 성격을 표시하는데 활용할 수 있는 그래프이다.
활용 예) 광고비율과 이익률의 관계 등
⑤ 층별 그래프
층별 그래프는 합계와 각 부분의 크기를 백분율로 나타내고 시간적 변화를 보고자 할 때, 합계와 각 부분의 크기를 실수로 나타내고 시간적 변화를 보고자 할 때 활용할 수 있는 그래프이다.
활용 예) 상품별 매출액 추이 등
⑥ 방사형그래프(레이더 차트, 거미줄 그래프)
방사형 그래프는 다양한 요소를 비교할 때, 경과를 나타낼 때 활용할 수 있는 그래프이다.
활용 예) 매출액의 계절변동 등
● 선(절선) 그래프
선(절선) 그래프란 주로 시간의 경과에 따라 수량에 의한 변화의 상황을 절선의 기울기로 나타내는 그래프이다. 선 그래프의 용도로는 경과․비교․분포(도수․곡선 그래프)를 비롯하여 상관관계 등을 나타낼 때(상관선 그래프․회귀선) 쓰인다.
아래의 그래프는 매출액의 추이를 나타낸 선 그래프, 즉 절선 그래프이다. 이것은 선 그래프에서 가장 기본적인 것으로 시간적 추이(시계열 변화)를 표시하는데 적합하다. 아래의 그래프는 4년간의 상품별 매출액의 추이를 나타내고 있다. 한 표에 너무 많은 선이 들어가면 복잡하여 알아보기 어렵다.
[선 그래프: 상품별 매출액 추이]
● 막대 그래프
막대 그래프는 봉 그래프라고도 한다. 비교하고자 하는 수량을 막대 길이로 표시하고 그 길이를 비교하여 각 수량간의 대소관계를 나타내는 것이다. 가장 간단한 형태이며, 선 그래프와 같이 각종 그래프의 기본을 이룬다. 막대 그래프는 내역․비교․경과․도수 등을 표시하는 용도로 쓰인다.
[막대 그래프: 영업소별 매출액(월평균)]
● 원 그래프
원 그래프는 일반적으로 내역이나 내용의 구성비를 원을 분할하여 작성한 것이다. 아래와 같은 파이 그래프도 원 그래프의 일종이다. 동심원을 두 개 그림으로써 투시점에서의 매출액 크기와 구성비를 비교해볼 수도 있다. 단, 원 그래프를 정교하게 작성할 때 까다로운 것은 수치를 각도로 환산하여야 한다는 점이다.
[원 그래프: 제품별 매출액 구성비]
● 점 그래프
점 그래프는 종축과 횡축에 2요소를 두고, 보고자 하는 것이 어떤 위치에 있는가를 알고자 하는데 쓰여진다. 아래의 점 그래프는 각 지역에서 쓰여지고 있는 광고비율과 이익률의 관계가 어떻게 되어 있는가를 표시한 것이다. 그래프에서 그어진 세로선과 가로선은 각기 이익률의 평균치, 광고비율의 평균치를 나타낸 것이다.
아래의 그래프를 보면 서울, 부산에서는 광고비는 높으나 이익률이 낮다. 반면 경기도, 강원도, 충청도는 광고비율이 낮으나 이익률은 높음을 알 수 있다. 점 그래프는 이와 같이 지역분포를 비롯하여 도시, 지방, 기업, 상품 등의 평가나 위치, 성격을 표시하는데 이용된다.
[점 그래프: 각 지역별 광고비율과 이익률의 관계]
● 층별 그래프
층별 그래프는 선 그래프의 변형으로 연속내역 봉 그래프라고 볼 수 있다. 선의 움직임보다는 선과 선 사이의 크기로써 데이터 변화를 나타내는 그래프이다.
층별 그래프는 크게 두 가지 용도로 활용되는데, 이는 ① 합계와 각 부분의 크기를 백분율로 나타내고, 시간적 변화를 보고자 할 때, ② 합계와 각 부분의 크기를 실수로 나타내고 시간적 변화를 보고자 할 때 등이다.
아래의 층별 그래프는 상품별 매출액 추이를 나타낸 것이다. 아래의 그래프로부터 전체 매출액 추이 변화와 함께 각 상품별 매출액의 추이변화를 알 수 있다.
[층별 그래프: 상품별 매출액 추이]
● 방사형 그래프
방사형 그래프(레이더 차트)는 원 그래프의 일종으로 거미줄 그래프라고도 한다. 비교하는 수량을 직경, 또는 반경으로 나누어 원의 중심에서의 거리에 따라 각 수량의 관계를 나타내는 그래프이다. 방사형 그래프는 대표적으로 비교하거나 경과를 나타내는 용도로 활용된다.
[방사형 그래프: 월별․상품별 매출액 추이]
'NCS이야기' 카테고리의 다른 글
NCS - 수리능력 - 연습문제(2) (0) | 2022.04.21 |
---|---|
NCS - 수리능력 - 연습문제(1) (0) | 2022.04.20 |
NCS - 수리능력 워크북(1) (0) | 2022.04.18 |
NCS - 의사소통능력 워크북(5) (0) | 2022.04.16 |
NCS - 의사소통능력 워크북(4) (0) | 2022.04.14 |