IT정보

뒤로가기

[데이터분석] 선형 회귀분석 알아보기

5점
2021-12-11 23:41:14 추천 1

선형회귀분석에 대해 알아보자



1. 선형 회귀분석


선형 회귀분석은 종속변수 Y와 한개 이상의 독립변수 X들의 선형관계를 분석하는 것입니다. 선형회귀분석을 하면 Y변수와 X변수간의 관계를 표본으로부터 도출해 낼 수 있고 이 관계를 통해 표본에 없는 Y변수 값을 예측할 수 있습니다. 선형회귀분석에서 가장 중요한 것은 기울기와 절편입니다. 절편과 기울기를 알면 하나의 함수를 도출해낼 수 있기 때문입니다. 


sklearn의 linear_model.LinearRegression함수를 사용하면 쉽게 선형회귀분석이 가능해집니다.



2. 기울기


기울기는 X가 한 단위 변할 때 Y가 얼마나 변할 것인지에 대해 알려주는 정보입니다. 선형회귀분석에서 기울기는 잔차를 최소화 시켜주는 값이라는 의미도 갖습니다. 기울기를 알고 있으면 Y값에 대한 예측을 할 수 있기 때문에 딥러닝에서 매우 중요하고도 중요한 정보입니다. 기울기를 잘 잡는 것이 딥러닝의 정확도에 핵심이 되기 때문입니다.

3. 잔차


데이터를 표에 찍으면 완전한 일직선으로 나타나지는 않습니다. 그런 데이터들의 정보를 가지고 선형식을 도출해 낼 때에는 잔차를 최소로 하는 직선식을 선택해야 합니다. 잔차는 어떤 직선을 그었을 때 직선 상의 Y값과 실제 데이터의 Y값과의 차이를 말합니다. 잔차가 가장 극소화된 직선이 자료를 가장 잘 대표한다고 말할 수 있습니다.

4. 결정계수


선형회귀분석을 통해 도출한 선형회귀모형이 데이터를 얼마나 잘 설명하는지를 나타냅니다. 0~1사이의 값으로 나타납니다. 1에 가까울 수록 좋은 설명력을 가진다고 할 수 있습니다.

5. 선형회귀모형을 통한 예측


선형회귀 분석을 통해서 모형을 도출하고 나면 갖고 있지 않은 Y데이터에 대한 예측을 할 수 있습니다.


6. 평균제곱오차(Mean Squared Error)


선형회귀모형으로 예측을 할 때 그 예측값이 얼마나 정확할 것인지에 대해 관심을 가질 수 밖에 없습니다. 평균제곱오차는 선형회귀모형이 얼마나 잘 예측을 하는지에 대한 판단을 하기 위해 구합니다.



▼ MSE 계산하기

테스트 데이터들로부터 모형과의 오차들을 구하고 오차들을 제곱 한 다음 평균시켜줍니다. 이때 제곱을 해준뒤 평균으로 만들어 주는 것은 오차들의 합이 0이 될 가능성이 있기 때문입니다. 제곱을 했기 때문에 오차의 크기가 커졌기 때문에 정확한 판단이 아니라고 할 수 있는데 루트를 씌워줘서 Roo MSE를 구하기도 합니다. 마치 분산과 표준편차와 유사합니다.


비밀번호 입력후 수정 혹은 삭제해주세요.


댓글목록

등록된 댓글이 없습니다.
댓글 수정 댓글 수정
0/500 byte
댓글쓰기 댓글쓰기

영문 대소문자/숫자/특수문자 중 2가지 이상 조합, 10자~16자

0/500 byte
평점

위에 보이는 문자를 공백없이 입력하세요. (대소문자구분)

에게만 댓글 작성 권한이 있습니다.