자료 쌍들의 분포가 선형에 얼마나 가까운지 나타내는 계수 선형에 가까울수록 코릴레이션이 크다
n개의 자료쌍이 있을때 공식은 이렇게 왜운다
에쎅시 = 씨그마 i=1부터 n까지 진행될때 x빼x평* y빼y평
룻(x빼x평 제곱한거씨그마에 루트)룻(y빼y평 제곱한거 씨그마에 루트)
이걸 이미지해서 외우자
이 식도 생긴 모양이 수학에서 흔히 등장하는 큰 숫자가 등장할때 보정해주기위한 조작이 들어가서 논리없이 조잡해 보인다
원래는 분자만 있어야하는데 그러니까 숫자가 큰 값으로 왔다갔다했다는 거다
xy
룻xx룻yy
먼저 이걸 이미지화한다음 외우자
실제 문제 풀이를 할 때는 산점도 등이 등장하고 계산기로 시그마를 구하기 위해 핵노가다를 한다
이를 안하기 위해 그냥 R을 쓰면 끝난다