맥에서 PDF 폰트 알아내기, 이미지 추출하기

요즘은 이와 관련된 웹서비스가 많이 있어서 별도로 프로그램을 설치할 필요 없이 쉽게 이용 가능하다. 다만 업로드할 수 있는 용량에 제한이 있는 경우가 많아서 로컬에서 사용할 수 있는 방법을 찾아봤다.

PDF 파일의 정보를 확인하거나 추출하기 위해서 pdffonts를 사용할 수 있는데 과거엔 xpdf 라이브러리에 포함되어 있다가 현재에는 poppler 라이브러리를 설치해 사용할 수 있다. 이 라이브러리는 homebrew를 통해 쉽게 설치할 수 있다.

brew install poppler

폰트 정보를 알아내기 위해서는 다음과 같이 사용할 수 있다.

pdffonts <파일명>

이미지를 추출할 때는 다음과 같이 쓸 수 있다.

pdfimages <파일명> <추출 경로>

추출된 이미지가 ppm인 경우는 일반적으로 사용 가능한 포맷인 jpg로 변경해 사용 가능하다. 이 경우엔 imagemagick 라이브러리에 포함되어 있는 convert를 사용할 수 있다.

해당 라이브러리가 설치되어 있지 않다면 역시 brew를 통해 설치할 수 있다.

brew install imagemagick

설치가 완료되었으면 다음과 같은 명령어로 일괄 변환할 수 있다.

convert *.ppm image%d.jpg

여기서 사용된 라이브러리들은 리눅스 패키지 매니저에서도 설치 가능하다.

김용균

안녕하세요, 김용균입니다. 문제를 해결하기 위해 작고 단단한 코드를 작성하는 일을 합니다. 웹의 자유로운 접근성을 좋아합니다. 프로그래밍 언어, 소프트웨어 아키텍처, 커뮤니티에 관심이 많습니다.

이 글 공유하기

이 글이 유익했다면 주변에도 알려주세요!

페이스북으로 공유하기트위터로 공유하기링크드인으로 공유하기Email 보내기

주제별 목록

같은 주제의 다른 글을 읽어보고 싶다면 아래 링크를 확인하세요.

November 24, 2014

C# 클래스 소멸자 ~ (물결 문자)

C#을 쓸 일이 종종 있는데 아직 초보 수준이라서 모르는 문법이 많다. 코드를 읽다가 메서드 선언 앞에 나온 물결 문자를 보게 되었는데 관련된 내용을 찾아봤다. 다음 내용은 함수명 앞에 오는 물결 표시는 무슨 의미인가요? 에 나온 답변이다. C#에…

October 14, 2014

WordPress에서 Links 사용하기

WordPress에는 기본적으로 Links라는 포스트 타입이 존재했었는데 WordPress 3.5 에서 제외되었다고 한다. 대부분의 사용자가 거의 이용하지 않는 기능이 되다보니 이런 결정을 내리지 않았나 싶다. 그 이전 버전 사용자는 업그레이드 하더…