[Python] pandas로 CSV, JSON, Excel 완전 정복 – 파일 불러오기부터 저장까지 실전 예제
파이썬으로 데이터 분석을 시작한다면 CSV, JSON, Excel 파일을 다루는 법은 필수입니다.
이 글에서는 pandas 라이브러리를 활용해 세 가지 주요 파일 형식을 불러오고 가공한 뒤 저장하는 방법을 실제 코드와 함께 소개합니다.
업무 자동화나 데이터 전처리에 필요한 기본기를 정리해봤습니다.
✅ 1. pandas로 다양한 파일 불러오기
import pandas as pd
# CSV 불러오기
df_csv = pd.read_csv("data.csv")
# JSON 불러오기
df_json = pd.read_json("data.json")
# Excel 불러오기 (sheet 지정 가능)
df_excel = pd.read_excel("data.xlsx", sheet_name="Sheet1")
# 데이터 미리보기
print(df_csv.head())
✅ 2. 가공한 데이터 저장하기 (to_*)
# CSV로 저장
df_csv.to_csv("output.csv", index=False)
# JSON으로 저장 (한글 깨짐 방지)
df_json.to_json("output.json", orient="records", force_ascii=False, indent=2)
# Excel로 저장
df_excel.to_excel("output.xlsx", index=False)
✅ 3. 실전 예제 – 웹 JSON 데이터를 엑셀로 저장
import requests
# API로 JSON 데이터 받아오기
url = "https://jsonplaceholder.typicode.com/users"
response = requests.get(url)
data = response.json()
# pandas로 변환 후 저장
df = pd.DataFrame(data)
df.to_excel("users.xlsx", index=False)
✅ 4. 자주 발생하는 오류 해결 팁
UnicodeDecodeError
발생 시 →encoding='utf-8-sig'
또는'cp949'
로 인코딩 지정- Excel 저장 시 오류 발생 →
pip install openpyxl
설치 필요 - JSON 한글 깨짐 방지 →
force_ascii=False
옵션 사용
📌 마무리
pandas를 활용하면 파일 형식에 관계없이 데이터를 유연하게 다룰 수 있습니다.
기초적인 입출력 기능을 익혀두면 분석, 리포트 자동화, 외부 시스템 연동 작업에서도 확실한 기반이 됩니다.
데이터를 다루는 모든 작업의 시작은 파일 입출력입니다. 필요할 때 참고할 수 있도록 저장해두시면 좋습니다.
반응형
'프로그래밍 > Python' 카테고리의 다른 글
[Python] 내 컴퓨터 중복 파일 찾기 – 해시값 비교로 이미지/문서 정리하기 (2) | 2025.03.28 |
---|---|
[Python] 나만의 명언 봇 만들기 – JSON으로 랜덤 출력하기 (2) | 2025.03.28 |
[Python] 파이썬으로 PDF 내용 추출하는 방법 – PyMuPDF(fitz) 활용 (0) | 2025.03.26 |
[python] FastAPI에서 async/await으로 비동기 API 만들기 - 느린 작업도 빠르게 처리하기 (0) | 2025.03.20 |
FastAPI에서 POST 요청 처리하기 - 사용자 입력 데이터 받기 예제 (0) | 2025.03.20 |