데이터 분석이나 투자 공부를 하다 보면
꼭 등장하는 개념이 바로 분산, 공분산, 상관계수입니다.
처음 보면 어렵지만, 핵심은 딱 3가지입니다.
✅ 1. 분산 (Variance) — 데이터가 얼마나 퍼져 있는가
분산은 데이터가 평균에서 얼마나 떨어져 있는지를 나타냅니다.
👉 쉽게 말하면
“값들이 얼마나 들쭉날쭉한가?”
📌 예시
- A: 170, 171, 169, 170 → 비슷함 → 분산 작음
- B: 150, 180, 165, 190 → 차이 큼 → 분산 큼
👉 투자에서는?
- 분산이 크다 = 가격 변동이 크다 = 리스크가 크다
✅ 2. 공분산 (Covariance) — 두 변수의 방향성
공분산은 두 데이터가 함께 움직이는 방향을 보여줍니다.
📌 해석
- 양수 (+) → 같이 상승 / 같이 하락
- 음수 (-) → 반대로 움직임
- 0 → 관계 거의 없음
📌 예시
- 공부시간 ↑ → 시험점수 ↑ → 양의 공분산
- 운동시간 ↑ → 체지방 ↓ → 음의 공분산
👉 하지만 단점
값의 크기 자체는 해석하기 어렵습니다.
✅ 3. 상관계수 (Correlation) — 관계의 강도
상관계수는 공분산을 -1 ~ 1 사이 값으로 정규화한 것입니다.
👉 즉,
“얼마나 강하게 같이 움직이느냐”
📊 기준
- +1 → 완전히 같은 방향
- 0 → 관계 없음
- -1 → 완전히 반대 방향
📌 예시
- 공부시간 vs 점수 → 0.8 (강한 관계)
- 키 vs 시험점수 → 0 (무관)
⚠️ 중요한 개념: 상관관계 ≠ 인과관계
아이스크림 판매량과 익사 사고는
둘 다 여름에 증가합니다.
👉 상관관계는 높지만
👉 원인-결과 관계는 아닙니다.
📈 엑셀로 계산하는 방법
✔️ 상관계수
=CORREL(범위1, 범위2)
✔️ 공분산
=COVARIANCE.S(범위1, 범위2)
✔️ 분산
=VAR.S(범위)
👉 Tip
가격이 아니라 수익률 기준으로 계산해야 정확합니다
💰 투자에서 활용하는 방법
1️⃣ 분산 = 리스크
- 분산이 크다 → 변동성 큼 → 위험 높음
2️⃣ 상관계수 = 분산투자의 핵심
👉 핵심 전략
“같이 움직이지 않는 자산을 섞어라”
📊 포트폴리오 예시
❌ 나쁜 조합
- 반도체 + 반도체 → 같이 폭락 가능
✅ 좋은 조합
- 주식 + 채권 → 리스크 분산
🎯 한 줄 정리
- 분산 → 퍼진 정도 (리스크)
- 공분산 → 방향
- 상관계수 → 강도
👉 투자에서는
“상관계수가 낮은 자산을 조합하는 것이 핵심”
🚀 마무리
이 3가지 개념만 이해해도
데이터 분석과 투자 실력이 한 단계 올라갑니다.
특히 투자에서는
👉 수익보다 리스크 관리가 더 중요합니다.