반응형
롯데V3
롯데 우승하는 그날까지 개발...ing
롯데V3
전체 방문자
오늘
어제
  • 분류 전체보기 (216)
    • Computer Science (0)
      • 운영체제 (0)
    • Problem Solving (160)
      • 프로그래머스 (93)
      • 백준 (60)
      • 리트코드 (2)
      • SQL (5)
    • 언어 (8)
      • 파이썬 (8)
    • 취준 (1)
      • 합격후기 (1)
    • 도서 리뷰 (21)
      • IT 도서 리뷰 (20)
      • 기타 도서 리뷰 (1)
    • 논문 리뷰 (1)
    • 회고 (5)
      • TIL (5)
    • 머신러닝 (9)
      • 통계 (3)
      • 전처리 (1)
      • 클러스터링 (3)
    • 딥러닝 (3)
      • 자연어처리 (1)
      • LLM (1)
    • 프로젝트 (5)
    • Util (0)
    • Tool (1)
      • Poetry (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • DP
  • 티스토리챌린지

최근 댓글

최근 글

티스토리

250x250
hELLO · Designed By 정상우.
롯데V3

롯데 우승하는 그날까지 개발...ing

[통계] 1종 오류와 2종 오류 & 오차행렬(confusion matrix)
머신러닝/통계

[통계] 1종 오류와 2종 오류 & 오차행렬(confusion matrix)

2022. 7. 27. 02:53
728x90
반응형

1. 정의

위키피디아에 따르면 다음과 같이 정의된다.

1종 오류: 귀무가설이 실제로 참이지만, 이에 불구하고 귀무가설을 기각하는 오류
2종 오류: 귀무가설이 실제로 거짓이지만, 이에 불구하고 귀무가설을 기각하지 못하는 오류

2. 설명

귀무가설은 아무일도 일어나지 않았음을 의미한다. 따라서 다음과 같이 생각할 수 있다.

1종 오류: 실제로는 아무 일도 일어나지 않았지만, 어떤일이 발생했을 것이라고 예측하는 오류
2종 오류: 실제로는 어떤 일이 발생했지만, 아무 일도 일어나지 않았을 것이라고 예측하는 오류

2-1. 예시

몇가지 예시를 들어본다.

화재 경보
- 귀무 가설: 아파트에 불이 나지 않았다.
- 1종 오류: 실제로는 아파트에 불이 나지 않았지만, 화재 경보가 울린 경우
- 2종 오류: 실제로는 아파트에 불이 났지만, 화재 경보가 울리지 않은 경우 
신용카드 사기 탐지
- 귀무 가설: 해당 결제 기록은 사기가 아닐 것이다.
- 1종 오류: 실제로는 사기가 아니지만, 사기라고 예측한 경우
- 2종 오류: 실제로는 사기지만, 사기가 아니라고 예측한 경우

3. 오차행렬 (confusion matrix)

이진 모델의 성능 평가지표인 오차행렬(confusion matrix)와 연관지어 생각할 수 있다.

TP (참 양성): 실제로 참인데, 예측도 참인 경우
FP (거짓 양성): 실제로 거짓인데, 예측은 참인 경우 (1종 오류)
FN (거짓 음성): 실제로 참인데, 예측은 거짓인 경우 (2종 오류) 
TN (참 음성): 실제로 거짓인데, 예측도 거짓인 경우 

3-1. 정확도 (Accuracy)

정확도는 예측이 맞은 경우의 수를 모든 경우의 수로 나눈 값이다. 식은 아래와 같다.

$$
\frac{TP+TN}{TP+FN+FP+TN}
$$

 

다만, 데이터가 편향된 경우에 좋은 지표가 되지 못하기 때문에 재현율, 정밀도, F1-Score 등을 활용한다.

 

3-2. 정밀도 (Precision)

정밀도는 예측을 참이라고 한 경우의 수 중 실제로 참일 확률이다. 따라서 정밀도는 1종 오류와 관련있는 지표이다.

$$
\frac{TP}{TP+FP}
$$

 

3-3. 재현율 (Recall)

재현율은 실제로 참인 것들 중에서 예측을 참이라고 했을 비율이다. 따라서 재현율은 2종 오류와 관련있는 지표이다.

$$
\frac{TP}{TP+FN}
$$

 

3-4. F1-Score

그렇게 F1-Score는 정밀도와 재현율의 조화평균으로 다음과 같이 계산된다. 

$$
\text{F1-Score }=2 \times \frac{\text { Precision } \times \text { Recall }}{\text { Precision }+\text { Recall }}
$$

 

4. Reference

  • https://angeloyeo.github.io/2021/01/26/types_of_errors.html
 

1종 오류와 2종 오류 - 공돌이의 수학정리노트

 

angeloyeo.github.io

  • https://velog.io/@hyundodo/ML-%EB%B6%84%EB%A5%98%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80-Confusion-Matrix-ROC-AUC
 

[ML] 분류모델 평가 | Confusion Matrix, ROC AUC

모델을 학습시키고 평가할 때, 해당 모델의 성능을 측정할 수 있는 평가지표에 대한 정리

velog.io

 

728x90
반응형
저작자표시 (새창열림)

'머신러닝 > 통계' 카테고리의 다른 글

[통계] 귀무가설과 대립가설  (0) 2022.07.20
[통계] 공분산과 상관계수  (0) 2022.07.11
    '머신러닝/통계' 카테고리의 다른 글
    • [통계] 귀무가설과 대립가설
    • [통계] 공분산과 상관계수
    롯데V3
    롯데V3

    티스토리툴바