목록데이터분석 (10)
코딩뿌셔
1. 변수 생성 및 출력 R에서는 어떠한 값을 변수에 할당하기 위해
1. 산술연산자 # 덧셈/뺄셈/곱셉/나눗셈 9+4 [1] 13 9-4 [1] 5 9*4 [1] 36 9/4 [1] 2.25 # 나눗셈의 나머지 9%%4 [1] 1 # 제곱 2^3 [1] 8 2. 산술연산 함수 # 로그함수 log(10) log(10, base = exp(1)) # 로그 밑 default [1] 2.302585 log(10, base = 2) [1] 3.321928 # 제곱근 sqrt(36) [1] 6 # 최댓값 max(3,6,9) [1] 9 # 최솟값 min(3,6,9) [1] 3 # 절댓값 abs(-10) [1] 10 # 팩토리얼 factorial(5) # 5*4*3*2*1 [1] 120

1. 분석 마스터 플랜 수립 프레임 워크 1) 마스터 플랜 수립 우선순위 고려요소 적용범위 / 방식 고려요소 ① 전략적 중요도 적용 우선 순위 설정 ① 업무 내재화 적용 수준 Analytics 구현 로드맵 수립 ② 비즈니스 성과 / ROI ② 분석 데이터 적용 수준 ③ 실행 용이성 ③ 기술 적용 수준 2) 수행 과제 도출 및 우선순위 평가 과제 우선순위 평가기준 전략적 중요도 전략적 필요성 - 전략적 목표 및 본원적 업무에 직접적인 연관관계가 밀접한 정도 시급성 - 사용자 요구사항, 업무능률 향상을 위해 시급히 수행되어야 하는지에 대한 정도 - 향후 경쟁우위 확보를 위한 중요성 정도 실행 용이성 투자용이성 - 기간 및 인력 투입 용이성 정도, 비용 및 투자예산 확보 가능성 정도 기술용이성 - 적용 기술의..

1. 분석 기획 방향성 도출 1) 분석 기획 분석 수행 전 과제 정의 및 결과 도출 관리 방안을 사전에 계획하는 일련의 작업 어떠한 목표(what)를 달성하기 위해(why) 어떠한 데이터를 가지고 어떤 방식으로(how) 수행할 지에 대한 계획 수립 2) 데이터 사이언티스트 역량 수학/통계학적 지식(Math & Statistics) 정보IT 기술(Information Technology) 비즈니스에 대한 이해와 전문성(Domain Knowledge) 3) 분석 대상과 방법 Optimization → Solution : 하향식 접근(Top down Approach) Discovery → Insight : 상향식 접근(Bottom up Approach) 분석 방법(How) 분석 대상 (What) Known U..
1. 기준일 및 시간대별 버스 이용량 분석 2. 기준시간(시) 및 시간(분)별 버스 이용량 분석 정제가 끝난 데이터를 불러와 주제별 분석 실습을 진행하겠습니다. import pandas as pd file_path = './data/df_kor.csv' df = pd.read_csv(file_path) df 승차시각 하차시각 노선명 노선설명 승객연령 환승여부 추가운임여부 승차정류장 승차정류장 GPS X 승차정류장 GPS Y 하차정류장 하차정류장 GPS X 하차정류장 GPS Y 0 20200102051049 20200102051844 131 양덕-송도-시청-양학-양덕 일반 N N 양덕차고지 129.401693 36.077258 동부초등학교 129.380866 36.062209 1 20200102051338..