[Python] pandas로 CSV, JSON, Excel 완전 정복 – 파일 불러오기부터 저장까지 실전 예제
·
프로그래밍/Python
[Python] pandas로 CSV, JSON, Excel 완전 정복 – 파일 불러오기부터 저장까지 실전 예제파이썬으로 데이터 분석을 시작한다면 CSV, JSON, Excel 파일을 다루는 법은 필수입니다.이 글에서는 pandas 라이브러리를 활용해 세 가지 주요 파일 형식을 불러오고 가공한 뒤 저장하는 방법을 실제 코드와 함께 소개합니다.업무 자동화나 데이터 전처리에 필요한 기본기를 정리해봤습니다.✅ 1. pandas로 다양한 파일 불러오기import pandas as pd# CSV 불러오기df_csv = pd.read_csv("data.csv")# JSON 불러오기df_json = pd.read_json("data.json")# Excel 불러오기 (sheet 지정 가능)df_excel = pd.r..
[Python] 내 컴퓨터 중복 파일 찾기 – 해시값 비교로 이미지/문서 정리하기
·
프로그래밍/Python
[Python] 내 컴퓨터 중복 파일 찾기 – 해시값 비교로 이미지/문서 정리하기컴퓨터에 파일이 많다 보면 중복된 파일이 생기기 쉽습니다.이 글에서는 Python을 사용해 폴더 내 중복 파일을 자동으로 찾아내는 방법을 소개합니다.`hashlib`으로 MD5 해시값을 비교하여 이름이 달라도 내용이 같은 파일을 식별할 수 있습니다.✅ 1. Python 코드 – 중복 파일 탐색기import osimport hashlibfrom collections import defaultdictdef get_file_hash(filepath): hasher = hashlib.md5() with open(filepath, 'rb') as f: while chunk := f.read(8192): ..
[Python] 나만의 명언 봇 만들기 – JSON으로 랜덤 출력하기
·
프로그래밍/Python
[Python] 나만의 명언 봇 만들기 – JSON으로 랜덤 출력하기하루의 시작을 짧고 강렬한 명언으로 시작하면 동기부여도 되고 기분도 좋아지죠 😊이번 글에서는 Python을 이용해 나만의 명언 랜덤 출력기를 만드는 방법을 소개합니다.JSON 파일을 활용하여 명언을 관리하고, 매 실행마다 다른 명언이 출력되도록 만들 수 있습니다.✅ 1. 명언 데이터 (quotes.json)[ { "quote": "지금 이 순간을 살아라", "author": "괴테" }, { "quote": "성공은 준비된 자에게 온다", "author": "루이 파스퇴르" }, { "quote": "행동은 말보다 강하다", "author": "세르반테스" }]JSON 파일은 quotes.json 같은 이름으로 저장하면 됩니..
[Python] 파이썬으로 PDF 내용 추출하는 방법 – PyMuPDF(fitz) 활용
·
프로그래밍/Python
[Python] 파이썬으로 PDF 내용 추출하는 방법 – PyMuPDF(fitz) 활용Python으로 PDF 파일을 자동 처리하고 싶을 때, PyMuPDF(fitz)는 가장 강력하고 빠른 라이브러리 중 하나입니다.텍스트 추출, 이미지 추출, 페이지 분리 등 문서 자동화 업무에 바로 활용할 수 있는 실용적인 기능을 제공합니다.이 글에서는 PyMuPDF(fitz)를 이용해 PDF에서 텍스트를 추출하는 방법과 이미지 저장, 특정 페이지 추출 등 실무 예제를 함께 정리해드립니다.✅ 1. PyMuPDF 설치 방법pip install pymupdf→ 설치하면 fitz라는 이름으로 import해서 사용합니다.✅ 2. PDF 전체 텍스트 추출하기import fitz # PyMuPDFdoc = fitz.open(..