0. Github & Data
1. 프로젝트 일정
1-1. 프로젝트 회의 (2025. 02. 21)
1-2. 데이터 전처리 (2025. 02. 22 - 2025. 03. 04)
- EDA
- Data Preprocessing
- Data Encoding
- Feature Extraction
1-3. 모델링 및 학습 (2025. 02. 24 - 2025. 03. 04)
- 데이터 모델링
- XGBoost
- LightGBM
- 모델 학습
1-4. 모델 평가 및 페이지 구현 (2025. 03. 04 - 2025. 03. 05)
- 테스트 점수
- Accuracy: 81.1%
- AUC: 84.6%
- Precision: 68.0%
- Recall: 54.5%
- F1 Score: 60.5%
2. 프로젝트 회고
2-1. 담당 역할
모델 개발 및 페이지 구현
2-2. 사용 기술 스택
Python
- 개인
- 모델 설계: XGBoost
- 공통
- Numpy
- Pandas
- Scikit-Learn
- 모델 설계: LightGBM
- 페이지 구현: Streamlit
2-3. 프로젝트 담당 업무
프로젝트 관리
- 프로젝트 개요 작성
- 서비스 사용 방법 정리
- 데이터 분석 및 모델 정리
모델 개발
- XGBoost
- 정확도 80.9%로 모델 폐기
통신사 가입 고객 이탈 예측 서비스 페이지 개발
- 페이지 구현: Streamlit
테스트 진행
- 형상 관리: Git
- 단위 테스트
- 데이터 입력 방식 수정
- 딥러닝 인코딩 수정
- 통합 테스트
- 모델에 맞는 feature 생성
2-4. 회고
이번 프로젝트는 내가 관심 있는 데이터 분석의 분야였기 때문에 더 열심히 하려고 노력했다. 하지만 생각보다 모델을 설계하는 것이 힘들었다. 분석 과정을 거쳐 어떠한 근거로 이런 전처리를 했는지 꼼꼼하게 하고 싶었는데 그에 따라가지 못해서 좀 아쉬움이 남는 프로젝트였다. 모델 정확도 점수를 조금만 더 높였으면 내 모델로 서비스를 만들 수 있었는데 그러지 못한 게 아쉬움이 크다. 그래서 프로젝트가 끝난 후에 따로 개인 공부를 더 해서 데이콘 같은 대회에 참가할 예정이다. 그래도 내가 부족했지만 다른 팀원들이 열심히 해주셔서 많이 배울 수 있던 프로젝트였다.
'SK네트웍스 Family AI캠프 10기 > 단위 프로젝트' 카테고리의 다른 글
| 단위 프로젝트 4. LLM을 연동한 내외부 문서 기반 질의 응답 웹페이지 개발 (0) | 2025.05.13 |
|---|---|
| 단위 프로젝트 3. LLM을 연동한 내외부 문서 기반 질의 응답 시스템 (0) | 2025.04.15 |
| 단위 프로젝트 1. 전국 자동차 등록 현황 및 기업 FAQ 조회 시스템 (0) | 2025.01.24 |