[ 기본 용어 ]
- 학습 : '양질의 학습 Data + 학습방법 Algorithm' -> 모델에 학습
- 모델 : 뭔가를 해내는 대상임
- EDA (Exploratory Data Analysis) : 탐색적 데이터 분석. 데이터를 본격적으로 처리하기 전에, 다양한 각도에서 데이터 분석
- 양적 변수 : 양적으로 늘어나는 변수 (ex. 10, 20, 30 ...)
- 질적 변수 : 카테고리를 구분하기 위해 이용됨. 실제로 양적으로 두 배는 아님 (ex. 여자 1, 남자 2)
※ '순서'는 질적 변수이므로 혼동하지 말기. (ex. 2월은 1월의 두 배가 아님. 카테고리 구분용이므로 양적이 아닌 질적 변수임)
[ 머신러닝 ]
- 머신러닝 : Tree구조, CPU로 처리 가능
- 인간이 개입하여 '정형 데이터 Structured Data'로 추출을 해야됨.
- 분야 : 금융사기탐지, 추천시스템, 주가예측, 질병진단 등 다양한 분야에서의 예측, 보편적임
- 알고리즘: 선형회귀, 로지스틱회귀, 의사결정나무, 랜덤포레스트, SVM, KNN, XGBoost
[ 딥러닝 ]
- 딥러닝 : 사람의 신경망을 모방한 다중신경망 구조, GPU 필요함
- 특징정보 추출 등 데이터 추출부터 모델이 알아서 함 (인간개입 x)
- 분야 : 이미지, 음성인식, 자연어처리(NLP), 자율주행 등 복잡한 문제
- 알고리즘 : CNN, RNN, Transformer, GAN (N=Network)
(참고)
보통 딥러닝은 GPU를 돌려야 하기 때문에, 보통 머신러닝 강의는 많으나 딥러닝 강의는 거의 없음.
환경조성부터 어렵기 때문.
'머신러닝 (Python)' 카테고리의 다른 글
| [ 머신러닝 ] xgboost 설치방법 (ModuleNotFoundError: No module named 'xgboost' 에러) (0) | 2026.06.29 |
|---|---|
| [ 머신러닝 ] Anaconda 및 Jupyter Notebook 이용법 (0) | 2026.06.29 |
