머신러닝 (Python)2026. 6. 29. 22:47
728x90

[ 문제 원인 ]

xgboost 모듈은 아나콘다에서 미제공하므로, pip install로 설치가 필요하다.

만약, 설치되어 있지 않다면 아래코드 실행시 오류 발생한다.

- (참고) 라이브러리 > 모듈 > 함수 개념이다.

- 설치필요 모듈 : xgboost, lightgbm

 

# import models (Classification)

#단일모델
from sklearn.linear_model import LogisticRegression #로지스틱회귀
from sklearn.tree import DecisionTreeClassifier     #결정트리
from sklearn.neighbors import KNeighborsClassifier  #kNN

#앙상블 (Bagging - 병렬구조)
from sklearn.ensemble import RandomForestClassifier #랜덤포레스트
from sklearn.ensemble import ExtraTreesClassifier   #엑스트라 트리

#앙상블 (Boosting - 직렬구조)
from xgboost import XGBClassifier                   #XGB
from lightgbm import LGBMClassifier                 #LGBM

 

ModuleNotFoundError: No module named 'xgboost'

 

 

[ 해결방법 ]

pip install 명령어로 xgboost 설치하면 해결된다.

참고로, pip명령어는 파이썬 문법이 아니다. 그래서 원래는 cmd같은 os터미널에서 처리해야되는 명령어이다.

특수기호 !(느낌표)를 붙임으로써, 파이썬코드가 아닌 컴퓨터 터미널(cmd)에 명령을 주피터노트북에서 바로 내릴 수 있다.

 

!pip install xgboost #os 터미널에 명령을 내림

#pip install xgboost #(참고) 요즘에는 !없어도 정상동작

 

 

참고로, 요즘에는 주피터 노트북이 업그레이드되어서 !pip가 아닌 그냥 pip로도 정상 동작한다.

 

아래 명령어 입력 -> Shift+Enter해보면, pip명령어 앞에 접두사(prefix)가 필요없다고 나오는 것에서 확인할 수 있다.

lsmagic

 

 

 

(참고) !pip install 실행결과

lightgbm 역시 에러가 발생하므로, pip install 해줘야 된다.

해당 셀의 헤더(파란색 부분) 클릭 -> 'a' 버튼으로 위에 셀을 하나 생성해주고, pip insall 해준다.

ModuleNotFoundError: No module named 'lightgbm'

 

 

설치 후, 에러 없이 잘 동작함을 확인할 수 있다.

 

!pip install lightgbm #os 터미널에 직접 명령(!)

반응형
Posted by mminky
머신러닝 (Python)2026. 6. 29. 21:00
728x90

- 아나콘다(Anaconda) : 머신러닝 등 파이썬 개발에 필요한 패키지를 모아둔 종합 배포판

- 주피터 노트북(Jupyter Notebook) : 웹에서 파이썬 실행 가능함, 셀 단위로 실행하고 즉시 결과 확인 가능함

 

사실, 위의 개념을 이해하고 시작하긴 어렵고

아나콘다를 설치해서 머신러닝 및 파이썬을 할수 있다 정도로 이해하면 된다.

 

 

[ 아나콘다 설치 ]

https://www.anaconda.com/download/success?reg=skipped

 

회원가입 할 필요 없이 'Skip Registeration' 선택하면 된다.

 

그리고, Anaconda Distribution에서 Window 64-Bit 파일을 다운로드 받아서 설치하면 된다.

 

 

 

[ Jupyter Notebook 실행 ]

작업표시줄 - Juypter Notebook 검색 - 클릭해서 실행

 

 

아래와 같은 cmd 창이 뜬다.

이 창은 네트워크 연결해주는 역할을 하므로, 끄지 말고 최소화만 해두기

 

그리고, 이제 인터넷에서 주피터 노트북이 뜬다.

나는 바탕화면에 있는 폴더에서 작업할 것이므로, 'Desktop - 원하는 폴더'로 클릭해서 이동한다. 

 

(참고)

아나콘다 프롬프트를 이용하여 띄우는 법도 있다.

https://mminky.tistory.com/113

 

주피터 노트북 실행 (jupyter notebook)

우선 아나콘다 프롬프트를 실행한다. cd 명령어를 이용해 원하는 폴더로 이동한다. 이 폴더에서 저장되고 동작되기 때문에 빈 폴더를 추천한다! 주피터 노트북을 입력하면 자동으로 실행된다. ju

mminky.tistory.com

 

 

[ Jupyter Notebook 단축키 ]

- 실행 : Shift + Enter

- 주석 : #


- 상단셀 생성 :
셀 클릭해두고 a

- 하단셀 생성 : 셀 클릭해두고 b

 

- 코드 복구(1회만 가능) : Ctrl + z

- 해당 셀 제거 : 연속으로 dd키 누르기

- 셀 분리 : 커서를 두고 Ctrl + Shift + -

 

- 셀 타입 변경 : 헤더 눌러서 command모드로 만들고, 단축키 누르기 (M / R / Y)

  1) Markdown (M) : 꾸밀 수 있는 셀. ex. ###글자크기3 ##글자크기2 #글자크기1 등

  2) Raw (R) : 적는 그대로 나오는 칸

  3)  Code (Y) : 코드를 실행하는 칸

파란색바(헤더) 클릭 후, 'M' 입력 -> Markdown

 

 

- 현재 선택한 셀 바로 위까지 run 하고 싶을 때 : Run - Run All Above Selected Cell

반응형
Posted by mminky
머신러닝 (Python)2026. 6. 29. 20:48
728x90

[ 기본 용어 ]

- 학습 : '양질의 학습 Data + 학습방법 Algorithm' -> 모델에 학습

- 모델 : 뭔가를 해내는 대상임

- EDA (Exploratory Data Analysis) : 탐색적 데이터 분석. 데이터를 본격적으로 처리하기 전에, 다양한 각도에서 데이터 분석

- 양적 변수 : 양적으로 늘어나는 변수 (ex. 10, 20, 30 ...)

- 질적 변수 :  카테고리를 구분하기 위해 이용됨. 실제로 양적으로 두 배는 아님 (ex. 여자 1, 남자 2)

   ※ '순서'는 질적 변수이므로 혼동하지 말기. (ex. 2월은 1월의 두 배가 아님. 카테고리 구분용이므로 양적이 아닌 질적 변수임)

 

 

[ 머신러닝 ]

- 머신러닝 : Tree구조, CPU로 처리 가능

- 인간이 개입하여 '정형 데이터 Structured Data'로 추출을 해야됨.

- 분야 : 금융사기탐지, 추천시스템, 주가예측, 질병진단 등 다양한 분야에서의 예측, 보편적임

- 알고리즘:  선형회귀, 로지스틱회귀, 의사결정나무, 랜덤포레스트, SVM, KNN, XGBoost

 

[ 딥러닝 ]

- 딥러닝 : 사람의 신경망을 모방한 다중신경망 구조, GPU 필요함

- 특징정보 추출 등 데이터 추출부터 모델이 알아서 함 (인간개입 x)

- 분야 : 이미지, 음성인식, 자연어처리(NLP), 자율주행 등 복잡한 문제

- 알고리즘 : CNN, RNN, Transformer, GAN (N=Network)

 

 

(참고)

보통 딥러닝은 GPU를 돌려야 하기 때문에, 보통 머신러닝 강의는 많으나 딥러닝 강의는 거의 없음.

환경조성부터 어렵기 때문.

 

반응형
Posted by mminky