Как автоматически удалить пустые страницы из PDF

Как автоматически удалить пустые страницы из PDF PDF-инструменты
Пошаговое руководство по автоматическому удалению пустых страниц из PDF с помощью Adobe Acrobat, Python и бесплатных инструментов.

Работа с PDF-документами часто омрачается наличием лишних пустых листов, которые появляются при сканировании или конвертации. Вручную удалять десятки страниц долго и неэффективно. В этой инструкции мы разберем, как автоматизировать этот процесс с помощью профессионального софта и простых скриптов.

Видеоинструкция

Способ 1: Автоматизация в Adobe Acrobat Pro

Для автоматического удаления пустых страниц используйте встроенный JavaScript-сценарий:

  1. Откройте документ в Adobe Acrobat Pro.
  2. Нажмите комбинацию клавиш Ctrl + Shift + J (или Cmd + Option + J на macOS), чтобы открыть консоль отладчика.
  3. Вставьте следующий код в окно консоли и нажмите Enter:
for (var i = this.numPages - 1; i >= 0; i--) {
  var numWords = this.getPageNumWords(i);
  if (numWords == 0) {
    this.deletePages(i);
  }
}

Внимание: Скрипты, проверяющие количество слов, могут пропустить страницы, содержащие только изображения (сканы без распознанного текста OCR). Перед удалением убедитесь, что важные графические страницы не будут стерты.

Способ 2: Пакетное удаление через Python

Если вам нужно обработать сотни файлов, используйте библиотеку pypdf. Скрипт проверяет наличие текста на странице и удаляет пустые.

from pypdf import PdfReader, PdfWriter

def remove_empty_pages(input_pdf, output_pdf):
    reader = PdfReader(input_pdf)
    writer = PdfWriter()
    for page in reader.pages:
        if page.extract_text().strip():
            writer.add_page(page)
    with open(output_pdf, 'wb') as f:
        writer.write(f)
Дополнительно: Как распознать текст (OCR) перед удалением

Если ваш PDF состоит из сканов, сначала запустите инструмент ‘Распознавание текста’ (OCR) в Adobe Acrobat или PDF24, чтобы программа могла отличить пустой лист от листа с картинкой.

Частые ошибки и устранение неполадок

  • Ошибка: Скрипт удалил страницы с картинками.
    Причина: На странице нет текстового слоя (не выполнен OCR). Решение: Распознайте текст перед запуском скрипта или используйте проверку размера файла страницы.
  • Ошибка: Консоль Acrobat выдает ‘undefined’.
    Это нормальный ответ консоли после успешного выполнения кода. Проверьте количество страниц в документе — пустые должны исчезнуть.

Часто задаваемые вопросы

Можно ли удалить пустые страницы в бесплатном Adobe Reader?

Нет, в бесплатной версии Adobe Reader нет инструментов для редактирования страниц и консоли JavaScript. Используйте веб-сервисы или Python.

Как удалить пустые страницы онлайн без программ?

Используйте бесплатные веб-сервисы, такие как PDF24 или Sejda. Загрузите файл, выберите функцию удаления пустых страниц и скачайте результат.

Оцените статью
TechWork
Добавить комментарий