분산 측정


이전 주제에서는 데이터 배포의 중심 위치에 대한 측정 값을 살펴 보았습니다. 이제 데이터 세트에 존재하는 변동성을 측정하는 방법을 살펴 보겠습니다.

데이터 세트의 서술 적 연구에서 중요한 측면은 샘플의 중심 위치 측정에 대한 이러한 데이터의 변동성 또는 분산을 결정하는 것입니다.

위치의 가장 중요한 척도 인 평균이 분산의 주요 척도 인 분산을 정의하는 평균이라고 가정합니다.

차이

분산은 표본 관측치 편차의 제곱을 평균과 합한 다음 표본의 관측치 수에서 1을 뺀 값으로 정의됩니다.

표준 편차

분산에는 제곱의 합이 포함되므로이를 나타내는 단위는 데이터의 단위와 다릅니다. 따라서 데이터와 동일한 단위를 사용하여 변동성 또는 분산을 측정하기 위해 분산의 제곱근을 취하고 표준 편차를 얻습니다.

표준 편차는 음이 아닌 값만 가정 할 수있는 측정 값이며 값이 클수록 데이터 분산이 커집니다.

데이터 간의 변동성이 클수록 표준 편차가 커집니다.

예제 7을 보려면 여기를 클릭하십시오

다음 : 정규 분포