데이터 분석 종합반 (2주차)
- 타이타닉 상관관계 분석을 파이썬으로 !
★ 2주차 핵심 ★
- 판다스(Pandas) & 맷플로립(Matplotlib) 사용법 익히기
(1) Colab
- Cloab 이란 ?
- 온라인에서 파이썬 데이터 분석을 학습할 수 있는 환경 ! ( 이라고 하는데 오늘 처음 들어봄,,)
(2) 데이터 분석에 꼭 필요한 파이썬 문법
- 변수
- 데이터를 담는 컨테이너 라고 생각하면 쉽다!
2. 리스트(★)
- 순서가 있는 데이터들의 모음집
- ' 대괄호( [] ) ' 를 사용한다 !!
- 인덱스 개념 잡고가기
- 인덱스 : 리스트 안에 데이터들의 번호 , 즉 순서 ( 0부터 시작 )
Quiz 01. 리스트 인덱스를 이용하여 5를 꺼내보아라
아직 익숙하지 않다.... 그래도 계속 해보자..

3. 딕셔너리(★)
- ' 중괄호( {} ) ' 를 사용한다 !!
Quiz 02. 딕셔너리를 이용하여 값을 호출하여 봐라.
(3) Pandas를 이용하여 데이터 분석하기
- Pandas는 [데이터 분석 기본세팅하기] , [데이터 분석하기] 단계에 사용
< 상관관계 분석을 위한 Pandas 사용 방법 >
- Pandas 사용 선언 - import pandas as pd
- 데이터 가져오기 - 이름지정 = pd.read_table('파일경로',sep=',')
- 데이터 확인 - 이름지정.head()
- 공백란 제거 - 공백란 확인 [ print(이름지정.isnull().sum()) ] 후 공백란 제거 [ 이름지정 = 이름지정.dropna() ]
- 상관관계 분석하기 - corr = 이름지정.corr(method = 'pearson')
- 상관관계가 1인 값 없애기 - corr = corr[corr.Survived !=1]
![]() |
![]() |
무슨말인지 모르겠죠..? 저도 몰라요..ㅠㅠ
(4) Matplotlib을 이용하여 데이터 분석 결과 시각화 하기
< 그래프 생성 >
- Matplotlib 사용 선언하기 - import Matplotlib,pyplot as pit
- 그래프 그리기 - corr['Survived'].plot()
- 그래프로 사용할 부분만 남기기 - corr = corr.drop(['passengerid'],axis = 'rows')
- 원하는 그래프로 변경 - plot.bar()
![]() |
![]() |
< 2주차 과제 >
- 당뇨병 데이터 세트를 'Pandas'와 'Matplotlib'을 이용하여 상관관계 분석
![]() |
![]() |
- 결론 : 당뇨병에 가장 큰 영향을 미치는 요인은 "Glucose" 이다.
< 커리어 스터디 >
< 아티클 스터디 >
- 주제 : [데이터 분석] 데이터 분석가는 어떤 일을 하나요?
[데이터분석] 데이터 분석가는 어떤 일을 하나요? | by 코크리 | 모두의연구소 기술 블로그
[데이터분석] 데이터 분석가는 어떤 일을 하나요?
데이터 분석가의 업무와 필요한 역량에 대해 설명합니다.
medium.com
- 요약
- 데이터 분석가의 역할, 업무, 필요한 역량을 설명하고, 데이터 분석가는 데이터를 통하여 비즈니스 문제를 해결하고 의사결정을 돕는 역할이다.
- 데이터 분석가는 단순히 데이터를 보는 사람이 아닌 데이터 분석, 통계 지식, 비즈니스 이해를 결합하여 데이터 안 패턴과 의미를 발견하고 이를 통해 기업의 목표 달성에 기여하는 직무이다.
- Data Scientist , Data Engineer 와 달리 개발 중심 보다 비즈니스 기획에 가까운 역할
< 글에서 말하는 데이터 분석가의 역할 >
| 1 | 데이터 분석 | 데이터를 분석하여 패턴과 의미를 찾는 작업 |
| 2 | 비즈니스 문제 해결 | 데이터를 활용해 기업의 문제 해결 |
| 3 | 인사이트 도출 | 데이터 분석 결과를 통해 의미 있는 결론 도출 |
| 4 | 지표 분석 | 데이터를 지표(Metric)로 나누어 분석 |
- 주요 포인트
① 데이터 분석가는 “비즈니스 문제 해결자”
데이터 분석가는 단순히 데이터를 보는 사람이 아니라
데이터를 통해 기업의 문제를 해결하는 역할이다
② 비즈니스(도메인) 이해가 매우 중요
데이터를 제대로 해석하려면
해당 산업과 서비스에 대한 이해가 필요하다
③ 데이터 분석은 “지표 설정”이 중요
데이터 분석에서는 목표 지표를 설정하는 것이 중요하다
- OMTD(One Metric That Matters)★
④ 허영 지표(Vanity Metric)를 구분해야 함
겉으로 좋아 보이는 지표가 아니라
실제 성과와 연결되는 지표를 분석해야 한다.
이상으로 오늘 TIL 끝.. 휴
'내일배움캠프(QA,QC_5기)' 카테고리의 다른 글
| [내일배움캠프] QA/QC_5기 ( 6일차 ) (1) | 2026.03.16 |
|---|---|
| [내일배움캠프] QA/QC_5기 ( 5일차 ) (1) | 2026.03.13 |
| [내일배움캠프] QA/QC_5기 ( 4일차 ) (0) | 2026.03.12 |
| [내일배움캠프] QA/QC_5기 ( 3일차 ) (0) | 2026.03.11 |
| [내일배움캠프] QA/QC_5기 ( 1일차 ) (0) | 2026.03.09 |





