[Python] 내 컴퓨터 중복 파일 찾기 – 해시값 비교로 이미지/문서 정리하기
·
프로그래밍/Python
[Python] 내 컴퓨터 중복 파일 찾기 – 해시값 비교로 이미지/문서 정리하기컴퓨터에 파일이 많다 보면 중복된 파일이 생기기 쉽습니다.이 글에서는 Python을 사용해 폴더 내 중복 파일을 자동으로 찾아내는 방법을 소개합니다.`hashlib`으로 MD5 해시값을 비교하여 이름이 달라도 내용이 같은 파일을 식별할 수 있습니다.✅ 1. Python 코드 – 중복 파일 탐색기import osimport hashlibfrom collections import defaultdictdef get_file_hash(filepath): hasher = hashlib.md5() with open(filepath, 'rb') as f: while chunk := f.read(8192): ..
[Python] 나만의 명언 봇 만들기 – JSON으로 랜덤 출력하기
·
프로그래밍/Python
[Python] 나만의 명언 봇 만들기 – JSON으로 랜덤 출력하기하루의 시작을 짧고 강렬한 명언으로 시작하면 동기부여도 되고 기분도 좋아지죠 😊이번 글에서는 Python을 이용해 나만의 명언 랜덤 출력기를 만드는 방법을 소개합니다.JSON 파일을 활용하여 명언을 관리하고, 매 실행마다 다른 명언이 출력되도록 만들 수 있습니다.✅ 1. 명언 데이터 (quotes.json)[ { "quote": "지금 이 순간을 살아라", "author": "괴테" }, { "quote": "성공은 준비된 자에게 온다", "author": "루이 파스퇴르" }, { "quote": "행동은 말보다 강하다", "author": "세르반테스" }]JSON 파일은 quotes.json 같은 이름으로 저장하면 됩니..
[Python] 파이썬으로 PDF 내용 추출하는 방법 – PyMuPDF(fitz) 활용
·
프로그래밍/Python
[Python] 파이썬으로 PDF 내용 추출하는 방법 – PyMuPDF(fitz) 활용Python으로 PDF 파일을 자동 처리하고 싶을 때, PyMuPDF(fitz)는 가장 강력하고 빠른 라이브러리 중 하나입니다.텍스트 추출, 이미지 추출, 페이지 분리 등 문서 자동화 업무에 바로 활용할 수 있는 실용적인 기능을 제공합니다.이 글에서는 PyMuPDF(fitz)를 이용해 PDF에서 텍스트를 추출하는 방법과 이미지 저장, 특정 페이지 추출 등 실무 예제를 함께 정리해드립니다.✅ 1. PyMuPDF 설치 방법pip install pymupdf→ 설치하면 fitz라는 이름으로 import해서 사용합니다.✅ 2. PDF 전체 텍스트 추출하기import fitz # PyMuPDFdoc = fitz.open(..
[python] FastAPI에서 async/await으로 비동기 API 만들기 - 느린 작업도 빠르게 처리하기
·
프로그래밍/Python
FastAPI에서 async/await으로 비동기 API 만들기 - 느린 작업도 빠르게 처리하기FastAPI는 Python의 async/await 구문을 완벽하게 지원하는 웹 프레임워크입니다.이를 통해 느린 작업(예: 파일 처리, 외부 API 호출, 데이터베이스 쿼리 등)도 효율적이고 빠르게 처리할 수 있습니다.✅ 비동기 함수란?async def로 선언된 함수는 비동기 함수이며, await를 통해 다른 작업이 완료될 때까지 기다리는 동안 블로킹 없이 다른 요청을 처리할 수 있습니다.즉, 하나의 요청이 처리되는 동안 서버가 멈추지 않고 동시에 여러 요청을 병렬로 처리할 수 있습니다.✅ FastAPI 비동기 예제느린 작업(예: 3초 대기)을 시뮬레이션한 API를 만들어봅니다.from fastapi impor..