При работе с файлами формата PDF или Portable Document Format иногда может потребоваться извлечь весь текст из файла PDF . В этом руководстве мы покажем, как вы можете легко извлекать текст из файлов PDF или конвертировать файлы PDF в текстовые файлы в Windows с помощью или без помощи онлайн-инструментов.
Самый простой и быстрый способ извлечь текст из PDF-файлов - воспользоваться бесплатными онлайн-сервисами. Эти онлайн-сервисы не требуют никакого дополнительного программного обеспечения, а это означает, что вы можете выполнить свою работу без установки какого-либо дополнительного программного обеспечения на свой ПК.
Если указанные ниже онлайн-службы не дают желаемых результатов или вы хотите извлечь текст из конфиденциальной информации, которую вы не хотите загружать на удаленный сервер, вы можете воспользоваться бесплатным программным обеспечением Windows, упомянутым в способах 3–5. наши 6 способов сжатия PDF-файлов.
Метод 1 из 6
ExtractPDF
ExtractPDF - это бесплатный онлайн-сервис для дополнения текста и изображений из файлов PDF. Сервис предлагает простой для понимания макет. После открытия страницы ExtractPDF в веб-браузере нажмите кнопку «Обзор», чтобы выбрать файл PDF, нажмите кнопку «Загрузить», чтобы загрузить выбранный файл на сервер ExtractPDF и начать извлечение.
По завершении работы вы увидите параметры для загрузки текстового контекста, шрифтов и изображений из загруженного файла PDF. Чтобы загрузить извлеченный текст в виде TXT-файла (чтобы открыть его в Блокноте или Word), перейдите на вкладку «Текст» и нажмите кнопку «Загрузить результат как файл».
Как видно на картинке выше, сервис не поддерживает файлы размером более 12 МБ. Это ограничение не должно быть программой, так как большинство файлов PDF будет меньше 12 МБ.
Во время нашего теста мы заметили, что для некоторых файлов PDF служба не дает желаемого результата. Если у вас есть какие-либо проблемы с этим сервисом, проверьте следующий.
Метод 2 из 6
OCR онлайн
Онлайновое распознавание текста - это онлайн-инструмент, который поможет вам извлечь текст из файлов PDF размером менее 5 МБ. Сервис конвертирует PDF-файлы в редактируемые файлы Microsoft Word (.docx) или Text (.txt).
Метод 3 из 6
STDU Viewer
По сути, STDU Viewer - это бесплатное программное обеспечение, предназначенное для открытия и просмотра нескольких форматов файлов. Кроме того, бесплатная версия STDU Viewer поддерживает экспорт текстового содержимого из файлов PDF.
Чтобы экспортировать текстовое содержимое PDF-файла, откройте PDF-файл с помощью STDU Viewer, выберите «Файл», нажмите «Экспорт», нажмите «В текст», выберите место для сохранения нового текстового файла и нажмите кнопку «ОК».
Опция экспорта позволяет извлекать текст с одной, нескольких или всех страниц. Размер загружаемой программы STDU Viewer не превышает 3 МБ. Бесплатная версия STDU Viewer предназначена только для личного и некоммерческого использования.
Метод 4 из 6
PDF2Text Pilot
PDF2Text Pilot - это бесплатное программное обеспечение для Windows, позволяющее конвертировать PDF-файлы в текстовые файлы одним щелчком мыши. После установки и запуска программного обеспечения вам просто нужно выбрать файлы PDF, которые вы хотите видеть в виде текстовых файлов, а затем нажать кнопку «Преобразовать». Ваши конвертированные файлы будут готовы через пару секунд.
Сильной стороной PDF2Text Pilot является его простой интерфейс и возможность конвертировать несколько файлов PDF одновременно.
Метод 5 из 6
A-PDF Text Extractor
A-PDF Text Extractor - еще одна программа для Windows, предназначенная для извлечения текста из файлов PDF. Программное обеспечение абсолютно бесплатно для личного и коммерческого использования.
После установки A-PDF Text Extractor (размер установщика меньше 1 МБ) запустите A-PDF Text Extractor. Нажмите кнопку «Открыть», чтобы открыть файл PDF, а затем нажмите кнопку «Извлечь текст», чтобы начать извлечение текста из него.
Метод 6 из 6
Gaaiho PDF Reader
Gaaiho PDF Reader - это отличная программа, разработанная для работы с PDF-файлами. Это бесплатное программное обеспечение предлагает множество функций, которые вы не можете найти другое бесплатное программное обеспечение для чтения PDF. Одной из особенностей является возможность извлечения текста из файлов PDF с легкостью.
Чтобы сохранить PDF-файл в виде текстового файла, после открытия PDF-файла в Gaaiho Reader выберите «Файл», нажмите «Сохранить как», а затем выберите параметр «PDF в текст» в раскрывающемся меню рядом с «Тип файла».
Что вы думаете об этих инструментах? Знаете ли вы о лучшем бесплатном инструменте для той же работы? Дайте нам знать в комментариях.