본문 바로가기

카테고리 없음

분산, 공분산, 상관계수 쉽게 이해하기

 

데이터 분석이나 투자 공부를 하다 보면
꼭 등장하는 개념이 바로 분산, 공분산, 상관계수입니다.

처음 보면 어렵지만, 핵심은 딱 3가지입니다.

✅ 1. 분산 (Variance) — 데이터가 얼마나 퍼져 있는가

분산은 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다.

👉 쉽게 말하면
“값들이 얼마나 들쭉날쭉한가?”

📌 예시

  • A: 170, 171, 169, 170 → 비슷함 → 분산 작음
  • B: 150, 180, 165, 190 → 차이 큼 → 분산 큼

👉 투자에서는?

  • 분산이 크다 = 가격 변동이 크다 = 리스크가 크다

✅ 2. 공분산 (Covariance) — 두 변수의 방향성

공분산은 두 데이터가 함께 움직이는 방향을 보여줍니다.

📌 해석

  • 양수 (+) → 같이 상승 / 같이 하락
  • 음수 (-) → 반대로 움직임
  • 0 → 관계 거의 없음

📌 예시

  • 공부시간 ↑ → 시험점수 ↑ → 양의 공분산
  • 운동시간 ↑ → 체지방 ↓ → 음의 공분산

👉 하지만 단점
값의 크기 자체는 해석하기 어렵습니다.


✅ 3. 상관계수 (Correlation) — 관계의 강도

상관계수는 공분산을 -1 ~ 1 사이 값으로 정규화한 것입니다.

👉 즉,
“얼마나 강하게 같이 움직이느냐”

📊 기준

  • +1 → 완전히 같은 방향
  • 0 → 관계 없음
  • -1 → 완전히 반대 방향

📌 예시

  • 공부시간 vs 점수 → 0.8 (강한 관계)
  • 키 vs 시험점수 → 0 (무관)

⚠️ 중요한 개념: 상관관계 ≠ 인과관계

아이스크림 판매량과 익사 사고는
둘 다 여름에 증가합니다.

👉 상관관계는 높지만
👉 원인-결과 관계는 아닙니다.


📈 엑셀로 계산하는 방법

✔️ 상관계수

=CORREL(범위1, 범위2)

✔️ 공분산

=COVARIANCE.S(범위1, 범위2)

✔️ 분산

=VAR.S(범위)

👉 Tip
가격이 아니라 수익률 기준으로 계산해야 정확합니다


💰 투자에서 활용하는 방법

1️⃣ 분산 = 리스크

  • 분산이 크다 → 변동성 큼 → 위험 높음

2️⃣ 상관계수 = 분산투자의 핵심

👉 핵심 전략
“같이 움직이지 않는 자산을 섞어라”


📊 포트폴리오 예시

❌ 나쁜 조합

  • 반도체 + 반도체 → 같이 폭락 가능

✅ 좋은 조합

  • 주식 + 채권 → 리스크 분산

🎯 한 줄 정리

  • 분산 → 퍼진 정도 (리스크)
  • 공분산 → 방향
  • 상관계수 → 강도

👉 투자에서는
“상관계수가 낮은 자산을 조합하는 것이 핵심”


🚀 마무리

이 3가지 개념만 이해해도
데이터 분석과 투자 실력이 한 단계 올라갑니다.

특히 투자에서는
👉 수익보다 리스크 관리가 더 중요합니다.