PDF에서 Header와 Footer 처리

여기에서는 PDF를 읽을때에 header와 footer를 제외한 본문만을 가져오는 방법에 대해 설명합니다.

doc = fitz.open(fname)
page = doc[0]
rect = page.rect
height = 50
clip = fitz.Rect(0, height, rect.width, rect.height-height)
text = page.get_text(clip=clip)

Reference

python - read pdf ignoring header and footer

Extracting Text from within a Rectangle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pdf-header-footer.md

pdf-header-footer.md

PDF에서 Header와 Footer 처리

Reference

Files

pdf-header-footer.md

Latest commit

History

pdf-header-footer.md

File metadata and controls

PDF에서 Header와 Footer 처리

Reference