코딩뿌셔

[01] 데이터 수집 및 분석 준비 본문

Data Analysis/포항시 버스사용자 교통카드 내역 분석

[01] 데이터 수집 및 분석 준비

He__o 2022. 6. 19. 01:21

1. 데이터 다운로드

2. 데이터 파일 확인

3. 데이터 컬럼명 변경 ( 영문 → 한글 )


1. 데이터 다운로드

 

포항시 버스사용자 교통카드 내역 데이터를 가져와 데이터 분석 연습을 해보겠습니다.

 

데이터는 국가교통 데이터 오픈마켓에서 '포항시'를 검색하면 

포항시 BIS 교통카드 사용내역 데이터를 확인할 수 있습니다.

 

사이트 로그인 후 무료 구매 가능하니 구매 후 다운로드 해줍니다.

전체 선택 후 다운로드 하시면 80개 파일이 다운로드 됩니다.

 

 

 

 

2. 데이터 파일 확인

 

파일 이름에 공백이 있으므로 전체 선택 후 파일명을 변경해봅시다.

전체 선택 후 첫번째 파일 이름을 공백 제거한 trfcard(0)으로 변경하고 엔터해줍니다.

이후는 자동으로 변경됩니다.

 

 

 

파일을 열어보면 보두 동일한 이름의 데이터 파일과 데이터 정의서가 존재합니다.

데이터 파일은 csv, 데이터 정의서 파일은 xlsx 형식임을 확인할 수 있습니다.

나머지 파일들도 동일한 형식임을 확인합니다.

 

 

 

데이터를 확인해보면 컬럼명이 영어로 되어있어 어떤 내용의 데이터인지 확인하기 어렵습니다.

 

 

 

데이터 정의서 파일에서 한글 컬럼명을 확인할 수 있습니다.

 

 

 

 

3. 데이터 컬럼명 변경 ( 영문 → 한글 )

 

원활한 데이터 분석을 위해 80개의 데이터 파일을 합친 후 컬럼명을 한글로 변경해줍니다.

우선 한개의 데이터로 먼저 연습을 해보겠습니다.

 

 

컬럼명을 한글로 변경한 데이터는 df_kor.csv로 따로 저장하겠습니다.

df.to_csv('./data/df_kor.csv', index=False)
Comments