Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- wordcloud
- Overfitting
- 코테
- 분산 시스템
- 알고리즘
- Python
- Tensor
- TF-IDF
- 코딩테스트
- 프로그래머스
- coursera
- pytorch
- recommendation system
- 데이터
- Cosine-similarity
- 데이터 엔지니어링
- 시각화
- selenium
- 파이썬
- 추천시스템
- 협업 필터링
- 웹스크래핑
- 추천 시스템
- 부스트캠프
- 백준
- 웹크롤링
- 딥러닝
- 머신러닝
- SGD
- codingtest
Archives
- Today
- Total
개발자식
[머신러닝] Confusion matrix_분류 모델 성능 평가 지표 본문
Confusion matrix (오차 행렬)
- 모델링 성과를 평가하는 지표 중 하나
- 분류에 한정되어 사용
- Actually는 실제 값을 뜻하며, Predicted는 예측한 결과물을 뜻한다.
- T는 TRUE, F는 False, P는 Positive, N은 Negative를 의미한다.
- TP, TN이 높을수록 좋은 성능을 보여준다.
- TP : 양성인 샘플이 이진 분류기에 의해 양성으로 옳게 분류됨
- FP : 음성인 샘플이 양성으로 잘못 분류됨
- FN : 양성인 샘플이 음성으로 잘못 분류됨
- TN : 음성인 샘플이 음성으로 옳게 분류됨
- TP : 암환자가 암환자로 판정나는 경우
- FP : 암환자가 아닌데 암환자로 판정 나는 경우
- FN : 암환자인데 암환자가 아닌 것으로 판정 나는 경우
- TN : 암환자가 아닌데 암환자가 아닌 것으로 판정 나는 경우
Accuracy (정확도)
- 전체 중 모델이 바르게 분류한 비율
Precision (정밀도)
- 모델이 Positive라 분류한 것 중 실제값이 Positive인 비율
Recall (재현도)
- 실제값이 Positive인 것 중 모델이 Positive라 분류한 비율
F1-Score
- Precision과 Recall 의 조화 평균
- 데이터가 불균형할 때, 정확도가 아닌 F1-Score를 사용한다.
* 다중 클래스에서 F1-Score 구하는 방법
: 각 클래스에 대한 Precision과 Recall을 구한 후, 평균값으로 F1-Score를 계산한다.
'AI > Machine Learning' 카테고리의 다른 글
[머신러닝] 선형 회귀 (Linear Regression) (0) | 2023.04.28 |
---|---|
[머신러닝] 감성분류 모델링, XGBoost (1) | 2022.05.20 |
[머신러닝] ROC Curve & AUC (0) | 2022.04.27 |
[머신러닝] 로지스틱 회귀 (Logistic Regression) (0) | 2022.04.24 |
[머신러닝] 교차 검증(CV_K-fold) (0) | 2022.04.24 |
Comments