다중선형회귀모형은 여러 입력 변수를 이용하여 예측을 수행하는 회귀 분석 기법입니다.
비용함수는 예측 값과 실제 값의 차이를 기반으로 하여 모델의 성능을 평가하는 데 사용됩니다.
다중선형회귀에서는 행렬과 벡터를 사용하여 데이터와 가중치를 표현하고 계산합니다.
경사하강법은 비용함수를 최소화하기 위해 가중치를 업데이트하는 최적화 알고리즘입니다.
미니배치 기법은 전체 데이터를 작은 배치로 나누어 경사하강법을 적용하여 수렴 속도를 높이는 방법입니다.
입력 스케일링은 변수들의 범위를 조정하여 모델의 성능을 향상시키는 중요한 과정입니다.
다중공선성은 독립 변수 간의 상관관계가 높아져 모델의 정확도를 떨어뜨리는 문제입니다.
과적합은 모델이 학습 데이터에 지나치게 맞춰져 새로운 데이터에서 성능이 떨어지는 현상입니다.
오버피팅은 모델이 학습 데이터에 너무 잘 맞춰져서 일반화 능력이 떨어지는 문제를 의미합니다.
입력 변수 선택의 중요성
시작 시간 35:30
모델에 포함될 독립 변수를 신중하게 선택하는 것이 중요하며, 상관성이 큰 변수는 제거해야 합니다.