본문 바로가기
public void static main/AI

[AI] 챕터08 - 과적합과 일반

by 햄리뮤 2025. 7. 24.
반응형

공부할 챕터

챕터 주제 간단 설명
1 머신러닝이란 무엇인가 머신러닝의 정의, 동작 원리, AI와의 관계
2 머신러닝의 분류 지도학습, 비지도학습, 강화학습의 차이
3 데이터와 전처리 데이터가 왜 중요한가, 어떻게 다듬는가
4 특징(Feature)과 레이블(Label) 입력과 출력의 개념, 특징 추출
5 학습과 예측 모델 훈련(training), 예측(predict)의 의미
6 성능 평가 정확도, 정밀도, 재현율, F1 Score 등
7 대표 알고리즘 이해 회귀, 분류, 군집 등 알고리즘 소개
8 과적합과 일반화 학습을 너무 많이/적게 했을 때 문제
9 실습과 프로젝트 간단한 실전 예제, 모델 만들기

오늘도 지친몸을 이끌고 책상에 앉았다 잘했다!!! 강의는 듣고있는데 뭐라는지 하나도 모르겠지만! 계속 들어야지뭐!

 

과적합과 일반화(Overfitting & Generalization)

모델을 학습시킨 목적은 테스트 데이터나 실제 데이터에 잘 작동하게 하는 것이다. 근데 모겔이 학습 데이터를 너무 열심히 외워버리면 새로운 데이터엔 약해진다. 이것이 바로 과적합이다!

반대로 너무 단순해서 패턴을 제대로 못 배우면 과소적합이 된다!

과접합의 징후?

과적합의 징후로 보면 훈련 정확도는 매우 높다. 대신 테스트 정확도는 낮다. 

검증 세트에서 성능이 점점 나빠지고 loss가 학습에서는 내려가는데 검증에서는 다시 올라간다!

과적합을 방지하려면?

방법 설명
데이터 모으기 가장 확실한 방법이다!
정규화 (Regularization) 너무 큰 가중치를 벌주는 기법
교차 검증(Cross-validation) 데이터 여러 조각으로 나눠서 평가
Dropout 신경망에서 일부 뉴런을 학습 중 임의로 끔
Early Stopping 검증 성능이 더 안좋아지면 학습 조기 종료
모델 단순화 트리 깊이 제한, 뉴런 수 줄이기
데이터 증강 이미지/텍스트 변형으로 데이터 늘리

 

그럼 일반화(Generalization) 는 뭔데!

새로운 데이터를 얼마나 잘 예측하는가!!? 일반화가 잘되려면 모델은 학습 데이터에서 의미있는 패턴만 잘 학습해야하고 노이즈나 우연한 특성은 무시해야한다!!


일단 복습겸 가볍게! 실습하면서 더 익혀보자!

 

https://databasecamp.de/en/ml/overfitting-en

 

What is Overfitting? | Data Basecamp

Prevent overfitting in machine learning models with effective techniques to improve generalization and model performance.

databasecamp.de

 

 

https://www.superannotate.com/blog/overfitting-and-underfitting-in-machine-learning

 

Overfitting and underfitting in machine learning | SuperAnnotate

Get to know the differences between overfitting and underfitting in machine learning, learn how to detect and prevent them, and much more.

www.superannotate.com

 

 

** 그냥 하루하루 개인 공부한 것을 끄적 거리는 공간입니다.

이곳 저곳에서 구글링한 것과 강의 들은 내용이 정리가 되었습니다.

그림들은 그림밑에 출처표시를 해놓았습니다.

문제가 될시 말씀해주시면 해당 부분은 삭제 하도록하겠습니다. **

반응형

댓글