카테고리 | 산탄데르 고객만족도 예측

분류는 다양한 기계 학습 알고리즘을 구현할 수 있습니다.

– 베이지안 통계 및 생성 모델 기반의 나이브 베이즈
– 독립 변수와 종속 변수 간의 선형 관계에 기반한 로지스틱 회귀
– 데이터 일관성에 기반한 규칙 기반 의사 결정 트리
– 클래스 간의 최대 분류 마진을 효율적으로 찾을 수 있는 지원 벡터 머신
– 접근거리 기반 최소접근 알고리즘
– 딥 커넥션 기반의 신경망
– 서로 다른 기계 학습 알고리즘의 앙상블 결합

그 중 앙상블은 일반적으로 배깅(bagging) 방식과 부스팅(boosting) 방식으로 나뉜다. 대표적인 배깅 방법은 예측 성능이 뛰어나고 실행 시간이 비교적 빠르며 유연성이 뛰어나 인기가 있는 랜덤 포레스트(Random Forest)입니다. 그러나 최근 부스팅 방법으로 앙상블 방법이 개발되었다. 그래디언트 부스팅은 부스팅의 시작이라고 할 수 있는데, 예측 성능은 뛰어나지만 실행 시간이 오래 걸리기 때문에 XgBoost, LightGBM 등의 알고리즘이 성능 향상과 실행 시간 단축을 위해 등장했으며, 구조화된 데이터 분류 분야. 고급 알고리즘으로 설정되었습니다.

의사 결정 트리
의사 결정 트리

학습을 통해 데이터에서 자동으로 규칙을 찾아 트리 기반의 분류 규칙을 생성하는 앙상블의 기본 알고리즘으로 사용되는 알고리즘입니다. Scikit-Learn에서 결정 트리 알고리즘을 구현한 DecisionTreeClassifier는 기본적으로 지니 계수를 사용하여 데이터 세트를 나눕니다. DecisionTreeClassifier 클래스와 DecisionTreeRegressor 클래스는 동일한 매개변수를 사용합니다.

매개변수 이름 설명하다
min_samples_split 과적합을 제어하는 ​​데 사용되는 노드 분할을 위한 최소 샘플 데이터 수, 기본값은 2입니다.
min_samples_leaf 최소 샘플 데이터를 터미널 노드로 사용하여 과적합을 제어하는 ​​데 사용됩니다.
가장 큰 특징 최적의 분할을 위해 고려할 최대 기능 수입니다. 기본값은 없음입니다. 세분화를 위해 데이터 세트의 모든 기능을 사용합니다.
최대 깊이 트리의 최대 깊이를 지정합니다. 기본값은 없음입니다.
가장 큰 리프 노드 최대 엔드포인트 수

의사 결정 트리 모델은 Graphviz 패키지를 사용하여 시각화할 수 있습니다. Scikit-Learn은 export_graphviz() API를 제공하는데 학습된 estimator, feature 이름 목록, label 이름 목록을 함수 매개변수로 입력하면 학습된 의사 결정 트리 규칙이 실제 트리 형태로 시각화됩니다.

Python에서 개발한 패키지가 아니므로 Graphviz 인터페이스를 설치한 후 별도로 Python Wrapper 모듈을 설치해야 합니다.

인간 활동 인식
의사 결정 트리 실습

https://colab.research.google.com/drive/1rS2rBJighARC9mLiRbc4Lx0xmMOxpqsY?hl=ko

Google 랩 노트

Python 노트북 실행, 공유 및 편집

colab.research.google.com

통합 학습
통합 학습

.

.

.

Santander 고객 만족도 예측

산탄데르 고객 만족 | 그리드

www.kaggle.com

클래스 레이블 이름은 TARGET이며 이 값이 1이면 불만족 고객, 0이면 만족 고객입니다. 모델의 성능평가는 ROC-AUC(ROC 곡선면적)로 평가한다.



? ? ? 이 오류 메시지는 강제 종료될 때까지 무기한 생성됩니다.

https://xgboost.readthedocs.io/en/latest/python/python_api.html#xgboost.XGBClassifier

Python API 참조 — xgboost 2.0.0-dev 문서

interaction_constraints (Optional(Union(str, List(tuple(str))))) – 상호 작용을 허용하는 상호 작용 제약 조건을 나타냅니다.제약 조건은 ((0, 1), (2, 3, 4))와 같은 중첩 목록 형식으로 지정해야 합니다. 여기서 각 내부 목록은 그룹입니다.

xgboost.readthedocs.io

Stack Overflow에 대한 이 문서를 참조하고 있습니다.

.

.

.