[혼공분석] 3주차. 데이터 정제하기

2025. 7. 20. 10:00·[한빛미디어] 혼공학습단/혼자 공부하는 데이터 분석 with 파이썬

혼공분석 3주 차 학습

 
 

# 진도 기본 숙제 추가 숙제
3주차
(07. 14 ~ 07. 20)
Chapter 03 p.182 확인 문제 2번 p. 219 확인문제 5번

 
 

기본 숙제

 

혼자 공부하는 데이터 분석 with 파이썬 p. 150

 

  • 특정 열의 합 구하기
    • df['col1'].sum()
      • 'col1' Series를 선택하여 합을 계산한다.
    • df[['col1']].sum()
      • 'col1' 열만 존재하는 DataFrame에서 합을 계산한다.
    • df.loc[:, df.columns == 'col1'].sum()
      • df.columns == 'col1'은 [True, False, False] 형태의 불리언 배열을 만들기 때문에 첫 번째 열(col1)이 선택된다.
      • 따라서 첫 번째 열(col1)의 합을 계산한다.
    • df.loc[:, [False, False, True]].sum()
      • [False, False, True]을 통해 세 번째 열(col3)이 선택된다.
      • 따라서 세 번째 열(col3)의 합을 계산한다.

 

  • 특정 행 선택하기
    • df[2:3]
      • [] 연산자에 슬라이싱을 사용하면 행 단위로 지정한 범위의 행을 선택하며, 마지막 값은 포함되지 않는다.
      • 따라서 인덱스가 2인 행(세 번째 행)이 선택된다.
    • df[df['col3'] > 100]
      • 'col3' 열이 100보다 큰 행을 필터링한다.
    • df.loc[2:2]
      • loc 메서드는 인덱스 라벨 기반 인덱싱으로, 마지막 값도 포함된다.
      • 따라서 인덱스 라벨이 2인 행(세 번째 행)이 선택된다.
    • df.iloc[2:3]
      • iloc 메서드는 정수 위치 기반 인덱싱으로, 마지막 값은 포함되지 않는다.
      • 따라서 세 번째 위치의 행이 선택된다.


 

추가 숙제

 

혼자 공부하는 데이터 분석 with 파이썬 p. 150

 

  • 정규표현식
    • DataFrame.replace(regex=True)
      • 문자열을 정규표현식 패턴으로 바꿀 수 있다.
    • . : 임의의 문자 1개
    • * : 0개 이상 반복
    • \d : 숫자 1개 (0~9)
    • \D : 숫자가 아닌 문자 1개

 

  • DataFrame.fillna()
    • 누락된 값을 지정한 방식으로 채운다.
    • method='ffill'
      • 누락된 값 이전에 등장하는 유효한 값으로 현재 누락된 값을 채운다.
    • method='bfill'
      • 누락된 값 이후에 등장하는 유효한 값으로 현재 누락된 값을 채운다.
    • axis=0
      • 행(세로) 방향으로 누락된 값을 채운다.
    • axis=1
      • 열(가로) 방향으로 누락된 값을 채운다.

 


혼공분석 3주 차 회고

 

loc 메서드와 iloc 메서드에 대해서 다시 되짚어볼 수 있었다. 그 외에도 좀 헷갈리는 부분이 있었지만 이번 기회에 다시 되짚어볼 수 있어서 좋았다.

 

 

'[한빛미디어] 혼공학습단 > 혼자 공부하는 데이터 분석 with 파이썬' 카테고리의 다른 글

[혼공분석] 6주차. 복잡한 데이터 표현하기  (2) 2025.08.17
[혼공분석] 5주차. 데이터 시각화하기  (1) 2025.08.10
[혼공분석] 4주차. 데이터 요약하기  (4) 2025.07.27
[혼공분석] 2주차. 데이터 수집하기  (2) 2025.07.13
[혼공분석] 1주차. 데이터 분석을 시작하며  (2) 2025.07.06
'[한빛미디어] 혼공학습단/혼자 공부하는 데이터 분석 with 파이썬' 카테고리의 다른 글
  • [혼공분석] 5주차. 데이터 시각화하기
  • [혼공분석] 4주차. 데이터 요약하기
  • [혼공분석] 2주차. 데이터 수집하기
  • [혼공분석] 1주차. 데이터 분석을 시작하며
초코수플레
초코수플레
데이터 관련 직무를 목표로 하고 있습니다.
  • 초코수플레
    초코수플레의 개발 노트
    초코수플레
  • 전체
    오늘
    어제
    • 분류 전체보기 (158)
      • BDAI (15)
        • 진짜 내 알고리즘으로 코테 합격하기 (with 파.. (5)
        • 데이터 분석 실전반 (지표설계 및 고객분석) (5)
        • 데이터 분석 실전반 (프로덕트 분석을 위한 Amp.. (5)
      • [길벗] 코딩 자율학습단 (5)
        • 코딩 자율학습 SQL 데이터베이스 입문 (5)
      • [한빛미디어] 혼공학습단 (7)
        • 혼자 공부하는 데이터 분석 with 파이썬 (7)
      • 인프런 (16)
        • [백문이불여일타] 데이터 분석을 위한 기초 SQL (3)
        • [백문이불여일타] 데이터 분석을 위한 중급 SQL (4)
        • [백문이불여일타] 데이터 분석을 위한 중급 SQL.. (5)
        • [백문이불여일타] 데이터 분석을 위한 고급 SQL (4)
      • SK네트웍스 Family AI캠프 10기 (115)
        • Daily 회고 (78)
        • Weekly 회고 (26)
        • Monthly 회고 (6)
        • 단위 프로젝트 (4)
        • 최종 프로젝트 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    GA4
    혼자 공부하는 데이터 분석 with 파이썬
    인프런
    코딩테스트
    BDAI
    AWS
    혼공분석
    [백문이불여일타] 데이터 분석을 위한 중급 SQL
    Python
    데이터분석학회
    [백문이불여일타] 데이터 분석을 위한 중급 SQL 문제풀이
    deep learning
    코딩 자율학습 SQL 데이터베이스 입문
    혼공학습단
    대외활동
    데이터분석
    django
    대학생학회
    취업준비
    CNN
    수업후기
    대학생활
    [백문이불여일타] 데이터 분석을 위한 고급 SQL
    pytorch
    Amplitude
    SQL
    취업
    sk네트웍스 family ai캠프
    Rag
    코딩 자율학습단
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
초코수플레
[혼공분석] 3주차. 데이터 정제하기
상단으로

티스토리툴바