내일배움캠프(QA,QC_5기)

[내일배움캠프] QA/QC_5기 ( 3일차 )

lshxkwh 2026. 3. 11. 19:31

 

 

안녕하세요.. 오늘 하루를 정리 해보도록 하죠...


데이터 분석 종합반 ( 3주차 )

- "Pandas" 와 "Matplotlib"을 활용하여 실제 직장에서 발생 할 법한 상황들로 파이썬 데이터 분석 해보기!!

★  3주차 핵심 ★

- 데이터 전처리 -> 분석하기 (Pandas) -> 시각화 하기 (Matplotlib) 



< 목표 > : 수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기


Missoin 01 . 최적의 타이밍에 완주를 독려하는 고객 관리 메세지를 보내야 할까?

  1. 데이터 분석 기본 세팅 
  •  Pandas 사용 선언하기 - import Pandas as pd
  • 수강 데이터 불러오기 - 변수 = pd.read_table('파일 경로' , sep = ',')
  • 데이터 살펴보기 = 변수.head()

 

 2. 분석 준비하기  [  "어떤"수강생들이 , "언제" 강의를 듣는지 알아야 한다! ]

  • 그러므로 위 자료에서 봐야할 정보는 "접속시간(access_date)" 와 "유저ID(user_id)"만 있으면 된다.

  2 - 1. 시간 데이터 전처리 해주기

  • access_date의 데이터 종류 알아보기

   - print(type(sparta_data['access_date'][0])

 

type 은 데이터의 종류 [ int(정수) , str(문자열) ]  인지 알아내는 파이썬 명령어 이다. ※

  • 원하는 데이터 형태로 변경하기

   - format = '%Y-%m-%d %H:%M:%S'

    sparta_data['access_date_time'] = pd.to_datetime(sparta_data['access_date'], format=format, errors='coerce')

 

to_datetime() 은 괄호 안, 해당 열의 데이터를 날짜와 시간 데이터로 변경 해주는 친구 . ※

 

  • 요일 추가하기

   - sparta_data['access_date_time_weekday'] = sparta_data['access_date_time'].dt.day_name()

     sparta_data.tail(5)

 

  • 요일 별 접속한 수강생 수 구하기

   - weeks = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']

     weekdata = sparta_data.groupby('access_date_time_weekday')['user_id'].count()

     weekdata

 

groupby() 를 사용하면데이터를 특정 기준으로 그룹화하여 처리할 수 있습니다! . ※

이렇게 하면 각 요일에 따른 접속자의 수를 구할수 있어요! 😊 시

  • 시간 별 접속한 수강생 수 전처리 하기

   - sparta_data['access_date_time_hour'] = sparta_data['access_date_time'].dt.hour

     hourdata = sparta_data.groupby('access_date_time_hour')['user_id'].count()

     hourdata = hourdata.sort_index()

     hourdata

 

 sort_index() 는 해당 데이터를 오름차순(ascending)으로 정렬 해주는 기능을 합니다!

  내림 차순은 sort_index(ascending = False) . ※

 

어렵고.... 힘들고.... 엉덩이는 아프고.....

 

 

 3. 분석 및 시각



 

< 시각화 >



< 실습 > 최적의 즉문즉답 시간대를 찾아라 ! 


 - 결론 : 수강 생들이 수강완료를 가장 많이 하는 시점은 "주말" 이 아닌 "화요일" 입니다.
따라서 "수요일", "목요일"에 선생님들을 많이 배치 해 놓으면 좋을거 같습니다.

 

강의듣고 정리하고 TIL 쓰는데만 시간을 너무 많이 썼다....

어렵지만 잘 따라가보자.. 오늘 이상..끝...       이 아니다.. 젠장

 

< 커리어 스터디 PPT 초안 작성 >




힘들었다.. 진짜 끝