Python 구글맵 API, 피벗테이블, 데이터정규화를 이용하여 서울시 범죄 데이터 분석하기
데이터 분석 개요 🧮서울시 5대 범죄(강간, 강도, 살인, 절도, 폭력) 데이터를 기반으로, 각 구별 범죄 발생과 검거율 데이터를 분석하고 시각화합니다.이 글에서는 데이터 처리, 변환, 그리고 원하는 데이터 분석을 얻기 위한 주요 기술과 실습 내용을 공유합니다. 📊✨ 데이터 로드와 초기 처리 🗂️숫자 데이터 처리CSV 파일에서 쉼표(,)로 구분된 숫자를 바로 정수(int)로 변환하려면 pandas의 read_csv 함수에서 thousands=',' 옵션을 사용합니다.이를 통해 숫자 데이터를 정수형으로 처리할 수 있습니다. ✅import pandas as pddf = pd.read_csv('crime_in_Seoul.csv', encoding='euc-kr', thousands=',') 아래 방법으..
2025. 1. 24.
Python Pandas: CONCAT과 MERGE로 데이터 합치기
Python의 데이터 분석 라이브러리인 Pandas는 데이터를 병합하거나 연결할 때 매우 강력한 기능을 제공합니다. 이번 글에서는 Pandas에서 concat과 merge를 사용해 데이터를 합치는 방법을 예제와 함께 살펴보겠습니다. 💡 데이터 준비 📃먼저, 예제로 사용할 세 개의 데이터프레임을 만들어보겠습니다. import pandas as pd# 첫 번째 데이터프레임 (엔지니어링 부서의 직원 정보)raw_data = { 'Employee ID': ['1', '2', '3', '4', '5'], 'first name': ['Diana', 'Cynthia', 'Shep', 'Ryan', 'Allen'], 'last name': ['Bouchard', 'Ali', 'Rob', 'Mitch..
2025. 1. 23.
Python 데이터 분석을 위한 강력한 도구 Pandas
Pandas Series 데이터 생성하기Series란 무엇인가?Pandas의 Series는 일차원 데이터 구조로, 리스트와 유사하지만, 데이터에 대해 인덱스를 사용할 수 있는 점이 큰 특징입니다. 각 데이터 요소는 고유한 레이블(인덱스)을 가지며, 이를 통해 데이터를 보다 쉽게 관리하고 접근할 수 있습니다.import pandas as pd# Series 생성 예시data = [10, 20, 30, 40]series = pd.Series(data, index=['a', 'b', 'c', 'd'])print(series)출력:Accessing and Deleting Elements in Pandas Series레이블과 인덱스를 통한 접근Series에서는 데이터에 레이블(또는 인덱스)을 사용해 접근할 수 있..
2025. 1. 22.