제곱합(sum of squares, 자승합,SS)는 표본 내의 각 사례의 변인 값과 평균 사이의 편차를 제곱한 값들의 총합으로, 표본 내의 변산성(variability)의 총량을 나타내는 수치이다.
- 제곱합은 0보다 크거나 같다.
- 표본 내 모든 사례의 Y값이 같다면 제곱합이 0이다.
- 제곱합이 0이라면 표본 내 모든 사례의 Y값이 같다.
분산분석의 목적은 독립변인이 종속변인에 미치는 효과를 알아보는 것이다. 실험에서 나타나는 전체 편차는 집단간 편차(처치 효과의 크기)와 집단내 편차(무선 오차)의 합으로 이루어지는데, 이들을 분리해내는 일을 분할이라 한다.
- SST : 전체 제곱합(total sum of squares, 총 제곱합), 로 표기하기도 한다.
- SSB : 집단간 제곱합(between-groups sum of squares, 간 제곱합), 로 표기하기도 한다.
- SSW : 집단내 제곱합(within-groups sum of squares 내 제곱합), 로 표기하기도 한다.
- 정리
n번 관측한 표본 로 구성된 선형 회귀 모형 이 주어지면,
총제곱합 을 다음과 같이 분해할 수 있다.
- 증명
- 오차의 기대치는 0 이다 라는 가정.
- 기대값의 정의에 따라 n이 확률 공간 안에서 모든 일어날 수 있는 경우의 수 일 경우에만 성립한다. (모집단)