본문 바로가기

SK네트웍스 Family AI캠프 10기/단위 프로젝트

단위 프로젝트 2. 가입 고객 이탈 예측

0. Github & Data

 

 

 

1. 프로젝트 일정

 

 

1-1. 프로젝트 회의 (2025. 02. 21)

 

 

1-2. 데이터 전처리 (2025. 02. 22 - 2025. 03. 04)

 

  • EDA

 

  • Data Preprocessing
    • Data Encoding
    • Feature Extraction

 

 

1-3. 모델링 및 학습 (2025. 02. 24 - 2025. 03. 04)

 

  • 데이터 모델링
    • XGBoost
    • LightGBM

 

  • 모델 학습

 

 

1-4. 모델 평가 및 페이지 구현 (2025. 03. 04 - 2025. 03. 05)

 

  • 테스트 점수
    • Accuracy: 81.1%
    • AUC: 84.6%
    • Precision: 68.0%
    • Recall: 54.5%
    • F1 Score: 60.5%

 

 

 

2. 프로젝트 회고

 

 

2-1. 담당 역할

 

모델 개발 및 페이지 구현

 

 

 

2-2. 사용 기술 스택

 

Python

  • 개인
    • 모델 설계: XGBoost
  • 공통
    • Numpy
    • Pandas
    • Scikit-Learn
    • 모델 설계: LightGBM
    • 페이지 구현: Streamlit

 

 

2-3. 프로젝트 담당 업무

 

프로젝트 관리

  • 프로젝트 개요 작성
  • 서비스 사용 방법 정리
  • 데이터 분석 및 모델 정리

 

모델 개발

  • XGBoost
    • 정확도 80.9%로 모델 폐기

 

통신사 가입 고객 이탈 예측 서비스 페이지 개발

  • 페이지 구현: Streamlit

 

테스트 진행

  • 형상 관리: Git
  • 단위 테스트
    • 데이터 입력 방식 수정
    • 딥러닝 인코딩 수정
  • 통합 테스트
    • 모델에 맞는 feature 생성

 

 

2-4. 회고

 

이번 프로젝트는 내가 관심 있는 데이터 분석의 분야였기 때문에 더 열심히 하려고 노력했다. 하지만 생각보다 모델을 설계하는 것이 힘들었다. 분석 과정을 거쳐 어떠한 근거로 이런 전처리를 했는지 꼼꼼하게 하고 싶었는데 그에 따라가지 못해서 좀 아쉬움이 남는 프로젝트였다. 모델 정확도 점수를 조금만 더 높였으면 내 모델로 서비스를 만들 수 있었는데 그러지 못한 게 아쉬움이 크다. 그래서 프로젝트가 끝난 후에 따로 개인 공부를 더 해서 데이콘 같은 대회에 참가할 예정이다. 그래도 내가 부족했지만 다른 팀원들이 열심히 해주셔서 많이 배울 수 있던 프로젝트였다.