회귀 분석을 알고 가야지 시험도 잘 칠수 있겠지?
회귀분석(Regression Analysis)
회귀분석은 데이터를 분석해서 특정 변수들(원인)이 결과 변수(결과)에 어떤 영향을 주는지 알아내는 통계 기법이다!
"특정 요인들이 결과에 어떤 영향을 미칠까?" 를 알아보기위해 데이터를 기반으로 방정식을 만드는 과정이다!
기본 개념
- 목표: 독립변수(입력)와 종속변수(출력) 사이의 관계를 알아내고, 이를 통해 새로운 데이터를 예측하는 것이 목표다!
- 예시: 집 크기(독립변수)가 집 가격(종속변수)에 어떤 영향을 미치는지 분석!
종류
- 단순 회귀(Simple Linear Regression):
- 하나의 원인 변수(독립 변수)가 하나의 결과 변수(종속 변수)에 영향을 미칠 때.
- 예: 거리(Distance)가 시간(Time)에 미치는 영향.
- 수식: y = mx + b
- y: 종속변수(예측값)
- x: 독립변수(입력값)
- m: 기울기(독립변수가 종속변수에 미치는 영향)
- b: 절편 (독립변수가 0일 때 종속변수의 값)
- 다중 회귀(Multiple Linear Regression):
- 여러 원인 변수(독립 변수)가 결과 변수에 영향을 미칠 때.
- 예: 크기(Size), 무게(Weight), 거리(Distance)가 시간(Time)에 미치는 영향.
- 수식: y = b0 + b1x1 + b2x2 + ... +bnxn
회귀분석의 주요 목적
- 미래 예측:
데이터를 이용해 새로운 상황에서 결과를 예측할 수 있다.
예: 크기=2, 무게=3, 거리=4라면 Time을 계산할 수 있음. - 변수 간의 관계 이해:
어떤 변수가 결과에 가장 큰 영향을 주는지 알 수 있어.
예: 크기(Size)가 무게(Weight)보다 더 큰 영향을 준다면, 물건의 크기를 줄이는 게 시간을 절약하는 데 더 중요하다는 걸 알 수 있겠다!
정리
회귀분석은 과거 데이터를 기반으로 원인과 결과 사이의 관계를 파악해서, 미래를 예측하거나 중요한 요인을 이해하기 위한 방법이다!
회귀분석 글 찾으니까 정보가 너무많았고 공부할께 어어어엄청 많은걸 확인하자마자 기본이 최고지! 하고 이정도로만 정리했다!
참고 문헌:
https://modulabs.co.kr/blog/linear-regression-analysis?utm_source=chatgpt.com
선형회귀 분석의 기본 가정 (선형성, 독립성, 등분산성, 정규성)
선형회귀 분석의 네 가지 주요 가정인 선형성(Linearity), 독립성(Independence), 등분산성(Homoscedasticity), 그리고 정규성(Normality)을 자세히 알아봅시다.
modulabs.co.kr
** 그냥 하루하루 개인 공부한 것을 끄적 거리는 공간입니다.
이곳 저곳에서 구글링한 것과 강의 들은 내용이 정리가 되었습니다.
그림들은 그림밑에 출처표시를 해놓았습니다.
문제가 될시 말씀해주시면 해당 부분은 삭제 하도록하겠습니다. **
'public void static main > AI' 카테고리의 다른 글
[Discussion] KNN(K-Nearest Neighbors)알고리즘에서 스케일링(Scaling)이 중요한 이유 (0) | 2025.01.14 |
---|---|
[Discussion] SVM(Support Verctor Machine)과 KNN(K-Nearest Neighbors) (1) | 2025.01.14 |
[Discussion] Scaling이 적합한 상황과 Standardization이 적합한 상황 (2) | 2025.01.13 |
[Discussion] SVM은 왜 larger margin을 선호할까? (0) | 2025.01.12 |
[DataModeling] Week01-데이터 모델링 기본 용어 및 개념 (0) | 2025.01.10 |
댓글