내일배움캠프(QA,QC_5기)

[내일배움캠프] QA/QC_5기 ( 2일차 )

lshxkwh 2026. 3. 10. 20:04

데이터 분석 종합반 (2주차)

- 타이타닉 상관관계 분석을 파이썬으로 !

 

★ 2주차 핵심 ★

- 판다스(Pandas) & 맷플로립(Matplotlib) 사용법 익히기


 

(1) Colab

  •   Cloab 이란 ?

        - 온라인에서 파이썬 데이터 분석을 학습할 수 있는 환경 ! ( 이라고 하는데 오늘 처음 들어봄,,)

 

(2)  데이터 분석에 꼭 필요한 파이썬 문법

  1. 변수

      - 데이터를 담는 컨테이너 라고 생각하면 쉽다!

 

   2. 리스트(★)

      - 순서가 있는 데이터들의 모음집

      - ' 대괄호( [] ) ' 를 사용한다 !!

  • 인덱스 개념 잡고가기

      - 인덱스 : 리스트 안에 데이터들의 번호 , 즉 순서 ( 0부터 시작 )


Quiz 01. 리스트 인덱스를 이용하여 5를 꺼내보아라

list_exercise = [3,4,[5,6],8]
 
print(list_exercise[2][0])

 


아직 익숙하지 않다.... 그래도 계속 해보자..

   

    3. 딕셔너리(★)

      - ' 중괄호( {} ) ' 를 사용한다 !!


Quiz 02. 딕셔너리를 이용하여 값을 호출하여 봐라.

 

dic_exercise = {'name':'sunghoon','age':261,'height':182}
 
print(dic_exercise["age"])
print(dic_exercise["name"])
print(dic_exercse["height"])

(3) Pandas를 이용하여 데이터 분석하기

    - Pandas는 [데이터 분석 기본세팅하기] , [데이터 분석하기] 단계에 사용

 

     < 상관관계 분석을 위한 Pandas 사용 방법 >

  1.  Pandas 사용 선언 - import pandas as pd
  2.  데이터 가져오기 - 이름지정 = pd.read_table('파일경로',sep=',')
  3. 데이터 확인 -  이름지정.head()
  4. 공백란 제거 - 공백란 확인 [ print(이름지정.isnull().sum()) ] 후 공백란 제거 [ 이름지정 = 이름지정.dropna() ]
  5. 상관관계 분석하기 - corr = 이름지정.corr(method = 'pearson')
  6. 상관관계가 1인 값 없애기 - corr = corr[corr.Survived !=1]

무슨말인지 모르겠죠..? 저도 몰라요..ㅠㅠ

 

(4) Matplotlib을 이용하여 데이터 분석 결과 시각화 하기

 < 그래프 생성 >

  1. Matplotlib 사용 선언하기 - import Matplotlib,pyplot as pit
  2. 그래프 그리기 - corr['Survived'].plot()
  3. 그래프로 사용할 부분만 남기기 - corr = corr.drop(['passengerid'],axis = 'rows')
  4. 원하는 그래프로 변경 - plot.bar()



< 2주차 과제 > 

- 당뇨병 데이터 세트를 'Pandas'와 'Matplotlib'을 이용하여 상관관계 분석


 

- 결론 : 당뇨병에 가장 큰 영향을 미치는 요인은 "Glucose" 이다.



 

< 커리어 스터디 > 

 

커리어 스터디 - 직무조사.hwp
0.16MB


< 아티클 스터디 >

 - 주제 : [데이터 분석] 데이터 분석가는 어떤 일을 하나요?

[데이터분석] 데이터 분석가는 어떤 일을 하나요? | by 코크리 | 모두의연구소 기술 블로그

 

[데이터분석] 데이터 분석가는 어떤 일을 하나요?

데이터 분석가의 업무와 필요한 역량에 대해 설명합니다.

medium.com

 

  •  요약
  1. 데이터 분석가의 역할, 업무, 필요한 역량을 설명하고, 데이터 분석가는 데이터를 통하여 비즈니스 문제를 해결하고 의사결정을 돕는 역할이다.
  2. 데이터 분석가는 단순히 데이터를 보는 사람이 아닌 데이터 분석, 통계 지식, 비즈니스 이해를 결합하여 데이터 안 패턴과 의미를 발견하고 이를 통해 기업의 목표 달성에 기여하는 직무이다.
  3. Data Scientist , Data Engineer 와 달리 개발 중심 보다 비즈니스 기획에 가까운 역할

< 글에서 말하는 데이터 분석가의 역할 >

1 데이터 분석 데이터를 분석하여 패턴과 의미를 찾는 작업
2 비즈니스 문제 해결 데이터를 활용해 기업의 문제 해결
3 인사이트 도출 데이터 분석 결과를 통해 의미 있는 결론 도출
4 지표 분석 데이터를 지표(Metric)로 나누어 분석
  • 주요 포인트

① 데이터 분석가는 “비즈니스 문제 해결자”

데이터 분석가는 단순히 데이터를 보는 사람이 아니라

데이터를 통해 기업의 문제를 해결하는 역할이다

② 비즈니스(도메인) 이해가 매우 중요

데이터를 제대로 해석하려면

해당 산업과 서비스에 대한 이해가 필요하다

③ 데이터 분석은 “지표 설정”이 중요

데이터 분석에서는 목표 지표를 설정하는 것이 중요하다

  • OMTD(One Metric That Matters)★

④ 허영 지표(Vanity Metric)를 구분해야 함

겉으로 좋아 보이는 지표가 아니라

실제 성과와 연결되는 지표를 분석해야 한다.

 

이상으로 오늘 TIL 끝.. 휴