04 апреля 2011, Однокрылов Владимир
Преобразование документов PDF и DjVu в файлы, поддающиеся редактированию неспециализированным ПО, является довольно востребованной задачей. И сегодня мы поговорим о некоторых способах и программах конвертации этих форматов в один из самых распространенных типов файлов – документ Microsoft Word (DOC), а также о подводных камнях, ожидающих пользователей на этом поприще.
Содержание
Итак, что же такое PDF? Так как с лета 2008 года данный формат стал открытым стандартом, то в сети есть достаточно точные определения, что из себя представляет наш предмет обсуждения – это кроссплатформенный формат файлов (Portable Document Format), введенный компанией Adobe еще в далеком 1993 и позволяющий включать в состав документа как сам текст, так и используемые шрифты, растровые и даже векторные изображения. А в последнее время, используя инструмент Acrobat 3D, можно внедрять и трехмерную графику в форматах U3D, PRC и некоторых других.
Теперь – зачем это нужно: компания Adobe в результате этой нехитрой манипуляции – создания документа с использованием возможностей PostScript, поддерживаемого в любой ОС безотносительно к программной среде или «железу» – фактически удалось «подмять» часть полиграфической индустрии и распространения полностью оформленных электронных документов, например, журналов и иллюстрированных книг. Напомним, что формат PDF появился в 1993, а стал открытым лишь в 2008 году (в спецификации версии 1.7) – а до этого он был проприетарным (закрытым коммерческим) и с полными возможностями редактировался только продуктами компании Adobe, что позволило ей стать лидером в этой области. Разумеется, есть альтернативы, но их немного, возможности редко превышают удобство PDF и они намного менее популярны.
Теперь обратимся к другому формату распространения печатной продукции во всемирной сети – DjVu.
По сути, это скорее файл, созданный при помощи технологий сжатия изображений с потерями, в основном с применением алгоритма JB2 – в нем используется словарь изображений, позволяющим заменять повторяющиеся символы на нескольких страницах одним изображением.
Строго говоря, в спецификации используется три слоя изображения – передний слой, задний слой и маска, и именно маска сжимается по алгоритмы JB2, и для большего выигрыша в размере получаемого документа два других слоя исключают из получаемого файла.
Боле того, DjVu позволяет хранить специальный OCR-слой, иначе называемый текстовым слоем, который содержит дублирующий изображение текст. Он позволяет быстро копировать текстовые данные из документа в любом просмотрщике DjVu-файлов. Если же текстового слоя нет – то де-факто остается только путь распознавания изображений в стороннем ПО, но об этом далее в нашей статье.
Путешествие из PDF в DOC #
Исходя из сказанного выше, полноценные редакторы PDF – довольно редкое явление по причине того, что формат только недавно стал открытым и де-факто продукты компании Adobe заняли лидирующие позиции как в просмотре, так и редактировании PDF-файлов. К тому же большинство редакторов стоит более $200, и человеку, не работающему с такими документами часто, накладно покупать такое ПО ради одного-двух документов.
Тут на помощь приходят программы-конвертеры, позволяющие перенести содержимое PDF-документа в более распространенный и просто редактируемый формат – Microsoft Word или DOC.
Почему именно DOC? Во-первых, Microsoft Office – достаточно популярный офисный пакет с широкими возможностями, очень распространенный как в России, так и за рубежом, а функционал его позволяет в широких пределах изменять оформление документа.
Во-вторых, существует большое количество альтернативного свободного ПО, работающих с данным форматом, наиболее известным из которых является кроссплатформенный пакет OpenOffice.
Сегодня мы пройдем по данной цепочке и рассмотрим несколько программ-конвертеров.
Однако вначале маленькое отступление – создавая PDF-файл, его можно защитить паролем от редактирования, и для открытия такого файла Вам скорее всего понадобится либо пароль, либо программа для снятия защиты – их великое множество в сети. Скачав первый попавшийся документ, мы обнаружили что он защищен именно таким образом – скачать тестовый PDF-файл.
Мы воспользовались trial-версией программы VeryPDF PDF Password Remover. Ограничения версии – всплывающее окошко при открытии получившегося документа и расшифровывается только половина страниц исходного документа.
Для наших целей этого было достаточно. Получившийся файл – скачать тестовый PDF-файл без пароля, как видно на снимке, изменений в структуре нет.
Также мы проверяли обработку программами и английского документа – с альбомным расположением страницы, рисунками и без защиты, скачать английский тестовый PDF.
Все представленные в тесте конвертеры были бесплатными или trial-версиями, скаченными с официальных сайтов разработчиков и предназначены для работы в операционной системе Windows (мы тестировали в Windows 7).
Free PDF to Word Doc Converter #
Для начала мы взяли бесплатный конвертер Free PDF to Word Doc Converter, который позиционируется как простое и быстрое решение для преобразования документов. Сразу можно сказать, что решение действительно простое – никаких особых дополнительных настроек, все в одном окошке программы, доступной только на английском языке.
Нам можно задать исходный документ, куда сохранить результат конвертирования, сколько страниц конвертировать, шрифт и пару опций, относящихся к форматированию, а также чем открыть получившийся документ. Free PDF to Word Doc Converter запросто открыл документ с защитой, а процесс прошел действительно быстро, и, полные надежд, мы открыли наш документ после конвертирования.
Что тут можно сказать – оформление он конечно сохранил, и даже попытался сделать формулы похожими на оригинал, но потеря всего русского текста непростительна – для конвертирования русскоязычных документов Free PDF to Word Doc Converter совершенно не годится. Посмотрим, как он справился с английским PDF.
Потеряны все изображения, сноски превратились в нечто невразумительное, словом, и тут Free PDF to Word Doc Converter не блещет. Что же, годится данная программа только для быстрого конвертирования английских текстовых PDF без графики и особого оформления, всего только и достоинств, что бесплатна и не требует для работы снятие защиты.
Solid Converter PDF #
Следующий участник – Solid Converter PDF, комммерческая программа от компании Solid Documents.
Сразу после запуска видно – простым конвертирование PDF в Word тут не обходится, набор функций весьма широк. Но в принципе интерфейс прост (благодаря хорошо оформленным иконкам) и нужную функцию нам найти не сложно.
Интерфейс на русском языке без видимых ошибок в переводе – словом, неплохая локализация. Правда, попытка скормить программе защищенный PDF успехом не увенчалась – потребовался пароль. Поэтому для тестов мы воспользовались разблокированный версией.
Строго говоря, несмотря на обширный набор опций, мы решили не останавливатся на подробностях.
Причина сего поступка проста – нас интересовал функционал сразу «из коробки», обычный пользователь коммерческих продуктов как правило не заинтересован в «допиливании напильником». Поэтому сразу после открытия мы перешли к конвертированию тестового файла. Ждать пришлось лишь чуть-чуть больше, чем в случае с Free PDF to Word Doc Converter.
А вот результат конвертирования получился очень неплох – практически все формулы, за исключением сложных дробей, сохранены в исходном виде, а текст полностью повторяет структуру такового в PDF.
Одно печалит – пробная версия оставляет здоровенный штамп по диагонали каждой страницы получающегося документа.
После результата с русским PDF мы нисколько не сомневались в положительном результате при конвертировании английского PDF, но тестирование есть тестирование, и все участники должны пройти одинаковый набор тестов. Итак, загрузили файл, кликнули, подождали пару секунд – и вот результат.
Практически 100% редактируемая копия исходного документа. Аплодисменты, занавес. Итого – отличный функционал, быстрая и качественная работа: пока что Solid Converter PDF является лидером в данном тесте.
VeryPDF PDF2WORD #
Третий участник нашего блиц-тестирования – VeryPDF PDF2WORD, продукт от компании VeryPDF, автора использованной при подготовке к тестированию программы для снятия защиты с PDF-файлов.
Главное окно программы довольно простое – из меню есть доступ к открытию файлов, а главное окно оказывает информацию о задании.
Есть и некоторый набор дополнительных опций.
Итак, первый мы загрузили нашу защищенную методичку и конвертер спокойно ее принял. Впрочем это неудивительно – была высока вероятность, что в свой конвертер VeryPDF PDF2Word компания также встроит механизм дешифровки. Немного ожидания, и сконвертированный файл готов.
Немного нарушено форматирование текста, сложные формулы нечитаемы, простые формулы несколько искажены, оценка – удовлетворительно. Посмотрим, что у нас получается при конвертировании английского PDF.
Оформление немного искажено, часть элементов «перескочила» на следующую страницу, но картинки сохранены. Однако размер получающегося файла – 3,28 Мбайта – все всякой критики, программа каждый рисунок разделила на отдельные элементы, что и привело к неоправданному росту объема. Оценка – удовлетворительно с минусом.
ABBYY PDF Transformer #
Программа ABBYY PDF Transformer является по сути урезанным ABBYY FineReader – из входных файлов оставлена только поддержка PDF, а вывод – в ограниченный объем форматов. Защищенные файлы PDF программа не открывает.
В пробной версии мы также имеем набор довольно жестких ограничений.
Негусто. Но тем не менее попробуем воспользоватся тем функционалом, что дают, к слову говоря, конвертация PDF в ABBYY PDF Transformer происходит путем простого распознавания – как и любого другого файла изображений в ABBYY FineReader.
Итак, мы распознали исходный русский PDF в автоматическом режиме и сохранили результат.
Драконовские ограничения пробной версии даже не дали выбрать страницы для сохранения и получаем мы в итоге лишь первые две страницы, качество неплохое, но на результат в сложных врядли можно рассчитывать более высокий, чем у самого ABBYY FineReader. Закинули в ABBYY PDF Transformer одностраничный английский тестовый PDF.
На выходе получили обычную картину для ABBYY FineReader – без ручного редактирования видимо невозможно обойтись, а форматирование получившегося документа похоже на содержимое блендера после первой секунды измельчения.
Adobe Acrobat X #
Ну и как же мы могли обойти вниманием «родной» для формата PDF редактор — Adobe Acrobat. Тестировали мы пробную версию Adobe Acrobat Х Pro, которая доступна после регистрации для свободного скачивания на официальном сайте компании Adobe.
Программа имеет английский интерфейс, при запуске сразу предлагает выбрать задачу, которой Вы намерены занятся.
Открыть защищенный файл нам не удалось, поэтому мы перешли к «беззащитному» варианту.
Разумеется, файл открылся без каких-либо проблем – к слову сказать, в отличие от всех программ в этом обзоре Adobe Acrobat не является конвертером – это полноценный коммерческий продукт от разработчиков pdf-формата, предназначенный для создания и редактирования любых (естественно, кроме защищенных) PDF-файлов.
Но мы редактировать файл не стали – просто попробовали сохранить его в формате MS Word. И вот что из этого получилось в итоге.
Простые формулы и форматирование текста переданы с минимальными искажениями, а вот ситуация со сложными формулами хуже, чем в Solid Converter PDF. Посмотрим, что получится из английского PDF.
Недостатки лишь в мелких искажениях заметок, изображения и текст переданы практически без искажений, здесь Adobe Acrobat нисколько не уступает Solid Converter PDF.
Как DjVu в Word попал и что из этого получилось #
Файлы DjVu открываются любым, даже самым простым просмотрщиком – примеры приложений Вы можете найти в нашей статье «Что такое DjVu и как с ним работать?», мы воспользовались WinDjView (самую новую версию Вы всегда можете скачать в нашем файловом архиве на странице программы).
А вообще у содержимого любого DjVu-документа есть три пути стать файлом формата DOC:
- Непосредственно перенестить из текстового слоя посредством буфера обмена в Microsoft Word – в этом случае какой либо намек на форматирование теряется, ровно как и изображения. Результат – мы получаем просто кучу обычного текста.
- Быть распознанным специальным ПО сразу – примером этого случая станет наш эксперимент с ABBYY FineReader, который с версии 9 стал поддерживать такой тип входных изображений.
- Посредством виртуального (программного) принтера стать PDF-файлом и далее отправится в вышеописанные программы-конвертеры или тот же самый ABBYY FineReader.
Но сначала тестовые условия: нашей лабораторной мышкой стал данный файл – 374-х страничный учебник по механике двухфазных систем размером 5,28 Мбайта (присутствует текстовый слой, чистый текст занимает 588 Кбайт). Конвертация документа производится без каких-либо изменений в тексте, все настройки используемых программ – изначальные.
ABBYY FineReader #
Итак, первым делом попробуем распознать документ в ABBYY FineReader. Ограничения пробной версии оказались еще более жесткие, чем в ABBYY PDF Transformer.
Одна радость – функционал намного больше.
Программа открыла документ как изображение, тестовый слой был проигнорирован – страница распознавалась с нуля. Мы ограничили тестовый объем одной страницей – все равно сохранить нельзя больше.
Результаты теста: пример №1 и пример №2 мало чем смогли порадовать – без ручной подстройки распознаваемых блоков ABBYY FineReader опознает не ахти.
В целом разница здесь между просто текстом и данными результатами невелика – сложные формулы выглядят кашей. Ручное же редактирование, в данном случае, 174 страниц – задача нетривиальная.
Экспорт в PDF при помощи Adobe Acrobat #
В задаче использования виртуального принтера мы решили обратится к Adobe Acrobat — кто может лучше всего подготовить PDF, как не редактор, созданный для этого? Открыв просмотрщик DjVu, мы в качестве принтера выбрали Adobe PDF.
Немного ожидания и в редакторе наконец открылся результат – однако его размер составил 26,43 Мбайта.
Очевидно, что все содержимое исходного документа было преобразовано в графику. Дальнейший путь файла – в наш раздел конвертеров и вышеуказанный ABBYY FineReader. В обоих случаях несложно догадаться, что 100% соотвествие исходному документу нас не ожидает.
Итоги #
В заключение мы можем отметить, что среди всех программ, протестированный нами и способных к конвертации PDF, наилучший результат дают Solid Converter PDF и Adobe Acrobat, остальные же программы способны удовлетворить нужды лишь непритязательных пользователей. Что касается DjVu, то путей превращения таких документов в 100%-похожую редактируемую копию пока нет – либо придется преобразовывать сложные места в изображения, либо оформлять утерянные участки до исходного состояния вручную.
Рекомендуем также почитать
Источник: http://www.f1cd.ru/soft/reviews/pdf_i_djvu_v_doc
FAQ WinDjView
Как просмотреть файл DjVu? Какая программа для этого нужна?
Мы уже выяснили, что для просмотра файла в формате DjVu необходима программа WinDjView и можно с уверенностью сказать, что она лучшая в своём классе.
Просмотреть файл DjVu можно непосредственно из программы в меню Файл – Открыть… Или же выбрать файл в Проводнике и двойным кликом запустить WinDjView, в этом случае выбранный файл автоматически откроется в программе.
Перемещение по страницам в WinDjView
В программе есть несколько способов открыть требуемую страницу. Во-первых, любая страница отображается в виде миниатюры в левой части окна. Клик по иконке открывает выбранную страницу.
Во-вторых, есть панель навигации, в которой можно: 1. Переместиться на первую страницу документа. 2. Вернуться на предыдущую страницу. 3. Ввести номер желаемой страницы. 4. Выбрать номер страницы в выпадающем списке. 5. Перейти на следующую страницу. 6. Открыть последнюю страницу.
- Ну и, наконец, перемещаться по документу можно управляющими клавишами или же скроллингом.
- Режимы отображения страницы в WinDjView
- В панели инструментов WinDjView есть группа кнопок, позволяющих изменять отображение документа. Кнопка [По ширине] выбирает масштаб отображения так, чтобы края страницы занимали всю ширину окна:
Кнопка [Масштаб 100%] отображает страницу безо всяких искажений, если окно маленькое, то даже может не вместиться в окне (потребуется прокрутка).
Кнопка [Страница целиком] задаёт такой масштаб отображения, чтобы была видна вся страница в окне программы.
Масштаб отображения страницы можно задавать и с помощью кнопок [+] или [-], а также путем выбора масштаба в выпадающем списке.
Есть ещё два варианта, о которых стоит упомянуть. Первый включён по-умолчанию, когда отображается одна страница над другой. Нажатие кнопки [Разворот] отображает по две страницы рядом, за счёт этого создаётся эффект чтения книги.
Как выделить и скопировать текст в WinDjView?
Сразу оговоримся – выделение и копирование текста в WinDjView может быть недоступно в тех случаях, когда документ не содержит текстового слоя. Иначе говоря, мы видим текст, но на самом деле это просто картинки.
Нажимаем кнопку [Выделить текст] и выделяем слова в тексте. Правый клик на выделенном тексте открывает контекстное меню, через которое можно как скопировать, так и выполнить другие операции – отметить текст (создать аннотацию) или добавить закладку.
Как пометить часть текста или установить закладку в файле DjVu?
Достаточно выделить текст и в контекстном меню выбрать пункт Отметить текст… После указать цвет и текст будет помечен. И, кстати, при следующем открытии файла все отмеченные места в тексте останутся.
Установка закладки выполняется также через контекстное меню в тексте, требуется ввести текст закладки.
В результате в списке (откроется дополнительная вкладка Закладки) появится созданная закладка. Клик на ней моментально открывает страницу с текстом, на который она была установлена. Правый клик в списке позволяет удалить, переименовать или перенаправить закладку на другую страницу.
Все установленные закладки WinDjView сохраняет в реестре. В случае, если система будет переустанавливаться, желательно сохранить информацию о аннотацих и закладках в отдельном файле – Файл – Настройки – вкладка Дополнительно – [Сохранить копию]. Позже с помощью сохранённого файла реестра можно восстановить данные.
Можно ли страницу в файле DjVu сохранить как картинку?
Для сохранения страницы в графическом формате необходимо правым кликом открыть контекстное меню и выбрать пункт Экспорт страницы… Затем указать формат графического файла (доступны BMP, JPG, GIF, PNG и TIFF) и сохранить.
Цветокоррекция в WinDjView
В цветном документе DjVu, особенно если он был получен путём сканирования, изображения могут быть тусклыми и не яркими. Есть возможность автоматической цветокррекции цветных изображений в WinDjView. В меню Файл – Настройки – вкладка Отображение – Применить коррекцию изображения.
- Результат автокоррекции можно сравнить:
Устают глаза от чтения на экране. Что делать?
В программе WinDjView предусмотрена возможность инвертирования цветов. В меню выбрать Файл – Настройки – вкладка Отображение – Инвертировать цвета.
Теперь документ отображается как белый текст на чёрном фоне. Такая цветовая гамма значительно меньше напрягает зрение.
- Как сделать встроенное содержание в DjVu?
- Если в файле DjVu встроено содержание, то WinDjView отображает его и позволяет перемещаться на страницу через клик в содержании.
Однако WinDjView не позволяет редактировать ссылки в Содержании и не имеет инструментов для создания Содержания. Эту задачу выполняет специальная утилита BookmarkTool.
Источник: https://www.pkgid.ru/articles/faqwindjvu.html
Преобразование файла DjVu в текстовый документ Word
DjVu — не самый распространенный формат, изначально он был предусмотрен для хранения изображений, но сейчас в нем, по большей части, встречаются электронные книги. Собственно, книга в этом формате и представляет собой изображения с отсканированным текстом, собранные в одном файле.
Такой метод хранения информации довольно удобен хотя бы по той причине, что DjVu-файлы имеют сравнительно небольшой объем, по крайней мере, если их сравнивать с оригинальными сканами. Однако, нередко у пользователей возникает необходимость перевести файл формата DjVu в текстовый документ Word. Именно о том, как это сделать, мы и расскажем ниже.
Преобразование файлов со слоем текста
Иногда встречаются DjVu-файлы, которые представляют собой не совсем изображение — это своего рода поле, на которое наложен слой текста, подобно обычной странице текстового документа. В таком случае для извлечения текста из файла и его последующей вставки в Ворд требуется выполнить несколько простых действий.
Урок: Как перевести документ Word в изображение
1. Скачайте и установите на свой компьютер программу, которая позволяет открывать и просматривать DjVu-файлы. Популярный DjVu Reader для этих целей вполне подойдет.
- Скачать DjVu Reader
- С другими программами, поддерживающими этот формат, вы можете ознакомиться в нашей статье.
- Программы для чтения DjVu-документов
2. Установив программу на компьютер, откройте в нем DjVu-файл, текст из которого необходимо извлечь.
3. Если на панели быстрого доступа инструменты, с помощью которых можно выделить текст, будут активны, вы можете выделить содержимое файла DjVu с помощью мышки и скопировать его в буфер обмена (CTRL+C).
Примечание: Инструменты для работы с текстом («Выделить», «Копировать», «Вставить», «Вырезать») на панели быстрого доступа могут присутствовать не во всех программах. В любом случае, просто попробуйте выделить текст с помощью мышки.
4. Откройте документ Ворд и вставьте в него скопированный текст — для этого просто нажмите «CTRL+V». Если это необходимо, отредактируйте текст и измените его форматирование.
Урок: Форматирование текста в MS Word
В случае, если DjVu-документ, открытый в программе-читалке, не поддается выделению и представляет собой обычное изображение с текстом (хоть и не в самом стандартном формате), описанный выше метод будет совершенно бесполезен. В таком случае преобразовывать DjVu в Ворд придется по-другому, с помощью другой программы, которая, вполне возможно, вам уже хорошо знакома.
Преобразование файла с помощью ABBYY FineReader
Программа Эбби Файн Ридер является одним из лучших решений для распознавания текста. Разработчики постоянно совершенствуют свое детище, добавляя в него необходимые пользователям функции и возможности.
Одним из нововведений, интересных нам в первую очередь, является поддержка программой формата DjVu и возможность экспорта распознанного контента в формате Microsoft Word.
Урок: Как перевести текст с фотографии в Ворд
О том, как преобразовать текст на изображении в текстовый документ DOCX, вы можете прочесть в статье, ссылка на которую указана выше. Собственно, в случае с документом формата DjVu мы будем действовать точно так же.
Более подробно о том, что представляет собой программа и что можно сделать с ее помощью, вы можете прочесть в нашей статье. Там же вы найдете информацию о том, как установить ее на компьютер.
Урок: Как пользоваться ABBYY FineReader
Итак, скачав Эбби Файн Ридер, установите программу на свой компьютер и запустите ее.
1. Нажмите кнопку «Открыть», расположенную на панели быстрого доступа, укажите путь к DjVu-файлу, который необходимо преобразовать в документ Word, и откройте его.
2. Когда файл будет загружен, нажмите кнопку «Распознать» и дождитесь окончания процесса.
3. После того, как текст, содержащийся в DjVu-файле, будет распознан, сохраните документ на компьютер, нажав для этого на кнопку «Сохранить», а точнее, на стрелку возле нее.
4. В выпадающем меню этой кнопки выберите пункт «Сохранить как документ Microsoft Word». Теперь нажмите непосредственно на кнопку «Сохранить».
5. В открывшемся окне укажите путь для сохранения текстового документа, задайте для него имя.
Сохранив документ, вы можете открыть его в Ворде, просмотреть и отредактировать, если это необходимо. Не забудьте повторно сохранить файл, если вы вносили в него изменения.
На этом все, ведь теперь вы знаете, как конвертировать файл DjVu в текстовый документ Word. Возможно, вам также будет интересно узнать о том, как преобразовать файл PDF в документ Ворд.
Мы рады, что смогли помочь Вам в решении проблемы.
Опишите, что у вас не получилось.
Наши специалисты постараются ответить максимально быстро.
Помогла ли вам эта статья?
ДА НЕТ
Источник: https://lumpics.ru/how-to-make-the-word-of-djvu/
Как из djvu
У вас должна быть установлена полная версия MS Office, в папке принтеров должен присутствовать Microsoft Office Document Image Writer (MODI). В данной статье описано использование MS Office 2003.
Начиная с Microsoft Office 2010, это приложение удалено из пакета. Существует утилита SharePoint Designer 2007, установив которую, вы добавите MODI в состав Microsoft Office 2010.
Загрузить SharePoint Designer 2007
Установите программу WinDjView и откройте в ней djvu-документ. Просматривая документ, выберите страницы, которые вы хотите извлечь и сохранить отдельно. Нужные страницы отправьте на печать Файл -> Печать.
В качестве устройства печати из выпадающего списка выберите Microsoft Office Document Image Writer.
Установите флажок Страницы и укажите через тире начальную и конечную страницы, выбранные для печати, и нажимаем Ok.
Будет сформирован документ в формате .mdi. Откроем его в программе Microsoft Office Document Imaging. Просто щелкните по нему и он откроется в этой программе, если она у вас установлена. Если редактирование документа не требуется, то можно его сразу отправить на печать. Если требуется редактирование, удалить или дополнить текст — тогда читайте дальше.
Обычно документ содержит рисунки, их надо сохранить отдельно. Левой кнопкой мыши выделите картинку, проведя по изображению по диагонали.
Щелкните правой кнопкой мыши по изображению и в меню выберите Копировать изображение. Скопированное изображение надо вставить в PAINT или другой графический редактор и сохранить.
По умолчанию сохранение в формате bmp, если хотите получить файлы меньшего размера (в 10-20 раз), выберите jpeg. Качество картинки, конечно, немного пострадает. Запомните место, где сохранили картинку.
Таким же образом скопируйте и сохраните другие картинки.
Теперь в главном меню выберите Сервис, а в нем пункт Отправить текст в MS Word. В окне Отправка текста в MS Word отметьте флажок Все страницы.
Выдается предупреждение о том, что будет выполнено оптическое распознавание текста.
Запустится MS Word и в окне появится распознанный текст.
Проверьте его и исправьте ошибки распознавания. Остается вставить в текст сохраненные ранее картинки. Поставьте курсор в нужное место текста и в главном меню MS Word выберите Вставка -> Рисунок -> Из файла… Вставленный рисунок обычно большего размера, чем это нужно.
Щелкните по рисунку, картинка выделится рамкой в виде тонкой черной линии. Подведите курсор мыши к правому нижнему углу рамки. Появится двунаправленная стрелка. Нажмите левую кнопку мыши и не отпуская ее, уменьшите изображение до нужных размеров. Также вставляем и другие картинки.
Если вы перед этим уже уменьшили размеры картинок в каком-либо графическом редакторе, то просто вставьте их в текст. Теперь можно сохранить полученный документ в формате MS Word. В меню Файл выберите пункт Сохранить как… В окне Сохранение документа из выпадающего списка выберите тип файла — Документ Word, введите имя файла и нажмите Сохранить.
Сохраненный документ Word можно перевести в формат pdf. Это можно сделать с помощью бесплатного офисного пакета Libre Office. Скачайте и установите свободный пакет Libre Office.
Откройте полученный вами документ Word в Libre Office Writer. В меню Файл выберите Экспорт в PDF… В окне Параметры PDF на вкладке Общие отметьте все или только необходимые страницы и нажмите Экспорт.
Остается ввести имя файла PDF и нажать кнопку Сохранить.
Источник: http://zgo.narod.ru/publ/kak_iz_djvu_fajla_vyrezat_chast_i_sokhranit_otdelnym_dokumentom/1-1-0-14
Работа с DjVu-файлами: незаменимые программы для чтения, конвертирования и создания DjVu
Я почти уверен, что любители электронных книг уже десятки раз встречались с этим форматом — DjVu (даже его написание несколько необычно?).
Он обладает уникальной особенностью: степень сжатия сканированного документа в нем (да и вообще любых картинок) — превосходит всех конкурентов (удивительно, но она выше чем у PDF). Благодаря чему, даже самую большую книгу можно поместить в компактный файл и передать ее по сети.
Однако, в силу специфичности формата, открыть его можно далеко не в каждой программе (да и открыв, во многих ридерах читать и пользоваться документом не так удобно). В этой статье порекомендую несколько незаменимых программок, которые открывают 99,99% DjVu-файлов, корректно их отображают, и позволяют комфортно работать с ними.
Итак…
Примечание: в статье приведены программы для Windows. Если вам нужна читалка для Android — рекомендую выбрать что-нибудь универсальное, например, вот эти продукты: https://ocomp.info/chtenie-elektronnyih-knig.html#Android
*
Для чтения (ридеры)
WinDjView
Сайт: https://windjview.sourceforge.io/ru/
Главное окно программы WinDjView
WinDjView — одна из самых быстрых и компактных программ для просмотра этого формата. Очень удобно, что в ней реализована непрерывная прокрутка страниц, слева предусмотрена панель быстрого перемещения по документу (содержание).
Отмечу также наличие функции расширенной печати (позволяет настроить распечатку так, как нельзя сделать в аналогичном софте). Программа основана на свободно распространяемой библиотеке DjVuLibre.
Особенности:
- возможность открывать сразу несколько документов (с помощью вкладок, подобно браузеру);
- наличие полноэкранной версии (облегчает чтение документа);
- возможность создания закладок;
- возможность настроить контрастность, яркость, цветовую гамму и пр. для комфортного времяпровождения;
- экспорт странички в формат картинки (GIF, JPG и JPEG);
- поддержка русского и всех популярных версий Windows 7, 8, 10.
Sumatra PDF
Сайт: https://www.sumatrapdfreader.org/free-pdf-reader.html
Чтение руководства по эксплуатации в Sumatra PDF
Очень удобная и компактная программа для просмотра всех популярных форматов электронных книг: PDF, DjVu, ePub, MOBI, XPS, CHM, CBZ и CBR. Вкупе с интерфейсом в стиле минимализма, низкими системными требованиями и простотой использования — делают ее одним из любимейших продуктов миллионов пользователей по всему Миру!
К тому же, Sumatra PDF полностью бесплатна, потребляет меньше памяти чем многие аналоги (скажем, Adobe Reader), не требует установки (можно носить с собой на флешке), поддерживает горячие клавиши, настройку отображения и т.д.
В общем, очень рекомендую к знакомству всем, кто еще не слышал об этом ПО.
Из минусов: могут быть некоторые проблемы при открытии старых DjVu файлов (видимо, все-таки, без штатного DjVu-ридера пока не обойдешься…).
DjVuReader
Сайт: http://djvureader.org/russian.html
DjVuReader — читаю книгу и пишу статью…
Несмотря на то, что эта программа давно не обновлялась, со своей задачей она справляется отлично! Ее основные преимущества:
- поддержка практически любых DjVu файлов;
- наличие бокового меню с содержание, эскизами и пр. — позволяет быстро перемещаться по документу;
- настройка яркости и контрастности изображения;
- низкие требования к ПК: особенно заметно при открытии больших файлах на слабых машинах;
- удобная навигация с помощью клавиатуры (можно не использовать мышку вообще!)
- маленький размер, нет необходимости в установке;
- поддержка русского, поддержка Windows XP, 7, 8, 10.
Из минусов (чисто на мой взгляд): нет плавной прокрутки страниц (привык я к этому очень).
*
Для создания DjVu (кодирование/декодирование)
DjVu Small
Сайт: http://www.djvu-soft.narod.ru/scan/djvu_small.htm
DjVu Small — как создать за 4 клика мышки файл DjVu
Это одна из самых простых программ для создания DjVu-файлов (из обычных картинок, с которыми все привыкли работать: TIF, JPG, BMP, GIF и PNG). Программа очень удобна, универсальна, работает практически во всех ОС Windows 98/NT/XP/7/8/10.
Отмечу, что программа может как сжимать одну или несколько картинок в DjVu (это называется кодированием), так и разжимать (т.е. декодировать — получить/извлекать из DjVu картинки).
Программа не нуждается в установке. Поддерживает русский интерфейс.
Для сжатия картинок в DjVu в ней необходимо (см. скрин выше):
- открыть папку или файлы;
- выбрать папку, где будет сохранен полученный файл;
- выбрать качество (вот здесь довольно сложно дать конкретную рекомендацию, т.к. выбирать нужно исходя из исходного качества. Для начала я рекомендую выбрать вариант «Default», если качество/размер файла не устроит — поменяете на отличный вариант);
- нажать кнопку «Пуск».
DjVu DocExpress
Сайт: http://www.djvu-soft.narod.ru/soft/
Открываем файл
Очень мощная программа для создания и редактирования DjVu документов. Например, программа может перевернуть сразу все страницы на 90-80 градусов, создать ссылки на страницы внутри файла или на отдельные страницы в сети интернет.
Что касается создания в ней файла DjVu, то здесь все просто:
- сначала открываете одну картинку (любую). Используйте меню «File/Open» (см. скрин выше);
- далее щелкаете по картинке правой кнопкой мышки и в меню выбираете вариант «Insert Pages After» (т.е. вставить еще дополнительно картинки после этой). Выбираете сразу 10-20 (или сотню ) и добавляете в проект.
Вставка доп. картинок после этой
- после чего сохраняете полученный файл (меню «File/Save as…»). Необходимо будет задать настройки (рекомендую выбирать качество не менее 300 DPI — а вообще, конечно, нужно попробовать несколько раз самостоятельно сохранить документ при разных настройках, чтобы «почувствовать» когда и в каких случаях что выбирать).
Задаем настройки и место сохранения
PdfToDjvuGUI
Сайт: http://www.trustfm.net/software/utilities/PdfToDjvuGUI.php
Главное окно
Одно из самых простейших решений — это PdfToDjvuGUI. Суть в том, что можно создавать DjVu не из картинок (как в предыдущих вариантах), а из PDF файла. В некоторых случаях это гораздо удобнее и быстрее.
Ремарка! Если вы не знаете как создать PDF файл, рекомендую вот эту статью (там несколько способов): https://ocomp.info/kak-sdelat-pdf-fayl.html
После запуска программы, достаточно выбрать файл (кнопка «Add PDF»), а затем кликнуть по кнопке «Generate DjVu» (при необходимости задать настройки сжатия).
После чего запуститься автоматическое конвертирование файла (просто подождите пока «черное» окно будет закрыто). Файл DjVu будет создан в том же каталоге, в котором находился добавленный на конвертацию PDF.
Онлайн-сервисы конвертирования
Сейчас в сети довольно-таки много сервисов, предлагающих загрузить к ним файл и быстро его конвертировать в DjVu. Конечно, их вряд ли можно использовать для сканированных документов (все-таки, в них часто содержаться личные и корпоративные сведения). Но для примера, приведу парочку вариантов:
- https://convertio.co/ru/pdf-djvu/ — сервис позволяет быстро перегнать PDF в DjVu (файл не должен превышать 100 Мб);
- http://djvu2pdf.com/ru/ — еще один сервис (в его арсенале достаточно много направлений конвертирования). По ссылке, которую привел выше, найдете обратный вариант: DjVu в PDF.
*
На этом всё, удачи!
RSS (как читать Rss)
Полезный софт:
- ВидеоМОНТАЖ
Отличное ПО для начала создания своих собственных видеороликов (все действия идут по шагам!).Видео сделает даже новичок!
- Ускоритель компьютера
Программа для очистки Windows от мусора (ускоряет систему, удаляет мусор, оптимизирует реестр).
Источник: https://ocomp.info/programmyi-dlya-djvu-faylov.html
WinDjView
Чтобы просматривать и читать файлы формата DjVu, необходимо установить на свое оборудование специальное приложение. WinDjView – это программа для чтения DjVu, которая не только раскрывает содержание файлов, но и позволяет пользователю выполнять оперативный переход по закладкам. Функциональный инструмент содержит достаточно широкий набор настроек и характеризуется массой достоинств.
Пользователям, которые привыкли к программе DjVu Reader, советуем попробовать скачать программу для чтения DjVu. В отличие от привычного решения, этот инструмент обладает расширенным функционалом и более совершенным интерфейсом.
К тому же он распространяется бесплатно и поддерживает все версии линейки операционной системы Windows. Разработчик приложения постоянно совершенствует свой продукт, выпускает обновления, обеспечивает поддержку пользователей.
Статус программы | Бесплатная |
Операционная система | Windows 10, 8.1, 8, 7, Vista, XP |
Интерфейс | Русский |
Разработчик | Андрей Жежерун |
Скачать WinDjView с официального сайта через торрент очень просто. После установки будет доступен весь функционал решения. Программа позволяет просматривать учебники, художественную и техническую литературу, книги, схемы, журналы – любые носители информации, оформленные в формате DjVu. Среди преимуществ программного решения на русском языке можно отметить:
- расширенные возможности печати;
- интуитивно понятный интерфейс;
- занимает на компьютере мало места;
- возможность одновременного открытия нескольких документов;
- быструю отправку на печать (доступно множество настроек).
«Дежавю Ридер» – программное обеспечение, которое обладает массой возможностей. Речь идет о преобразовании файлов в PDF-формат, изменении масштаба страниц, которые уже открыты.
Эта функция удобна, чтобы «подогнать» документ под экран компьютера. Пользователь может осуществлять переход на любую страницу, смотреть, копировать и распечатывать текст, переходить по ссылкам, которые есть в тексте.
Используя горячие клавиши и мышку, можно осуществлять навигацию.
DjVuViewer – читалка для DjVu на компьютер, которая позволяет менять настройки яркости, гаммы, контрастности, добавлять свои закладки. Несмотря на обилие функциональных возможностей, интерфейс программного обеспечения не перегружен. Поэтому ориентироваться сможет даже начинающий пользователь. Особых знаний и навыков не требуется. Просмотрщик снабжен только самым необходимым.
Программа «Дежавю Ридер» для просмотра djvu не требовательна к системным ресурсам. Установка редактора не вызывает сложностей. В процессе инсталляции выбираем русский язык. Далее действуем по подсказкам «Мастера установки», указав дополнительные компоненты, которые могут потребоваться в процессе использования программы.
После установки программа становится доступна для использования. Чтобы осуществить просмотр документа, необходимо выбрать файл, расширение которого DjVu. Далее следует определиться с масштабом, другими настройками, используя иконки, которые есть на панели управления.
Программное обеспечение под названием «Дежавю Ридер» быстро и качественно справляется со своими функциями. Бесплатное приложение будет полезно пользователям, у которых периодически возникает необходимость просматривать файлы в формате DjVu и выполнять разнообразные операции с такими документами. Скачивайте и используйте умный и современный инструмент.
Источник: https://WinDjVu.ru/
Как конвертировать DjVu в FB2?
Довольно часто можно столкнуться с электронными книгами, сохраненными в формате DjVu – его нередко используют для хранения отсканированных документов. Вот только не все электронные «читалки» корректно открывают этот формат, в отличие от того же FB2. Есть ли способ конвертировать DjVu в FB2?
К сожалению, программы, которая способна в один клик перевести DjVu в FB2, не существует. Связано это с тем, что формат FB2 содержит информацию в текстовом виде.
А DjVu – это графический формат, по сути, набор картинок, объединенных в один файл для большего удобства. «Вынуть» из картинки текст намного сложнее, чем сделать из текста картинку.
Поэтому конвертировать DjVu в FB2 придется в несколько шагов.
Проще всего это будет сделать, если в DjVu файле есть текстовый (OCR) слой. Как это проверить? Откройте электронную книгу любой подходящей программой для чтения DjVu и проверьте, можно ли осуществить полнотекстовый поиск по файлу (естественно, программа должна изначально поддерживать опцию полнотекстового поиска).
Если OCR слой присутствует, вам нужно скопировать текст файла в буфер обмена, вставить в любой текстовый редактор, подредактировать при необходимости и сохранить как текстовый документ (DOC, RTF, TXT, ODT и т. п.), а уже текстовый документ конвертировать в FB2 при помощи любой подходящей программы.
Если же DjVu документ состоит из «чистых» картинок, без текстового слоя, процесс конвертации DjVu в FB2 будет состоять из нескольких этапов. Чтобы извлечь текст из DjVu файла, вам нужно будет воспользоваться программой для оптического распознавания символов — к примеру, Fine Reader или любой другой более доступной альтернативой.
Но программы для распознавания текста редко способны напрямую работать с форматом DjVu. Поэтому для начала вам нужно будет конвертировать DjVu файл в формат PDF или TIFF.
Для конвертации в формат PDF, к примеру, можно использовать связку из двух программ — WinDjView и PDFCreator.
Вместо WinDjView можно использовать любую другую программу для чтения этого формата (лишь бы в ней присутствовала возможность печати), а вместо PDFCreator — любой другой виртуальный принтер.
Открыв файл DjVu в программе для чтения, вызовите диалог печати (сочетание клавиш Ctrl+P), в строке выбора принтера выберите из выпадающего списка виртуальный PDF-принтер и нажмите ОК.
Программе потребуется некоторое время, чтобы подготовить страницы документа для конвертации. Когда откроется окно сохранения файла, введите название книги и нажмите ОК.
Учтите, что конвертация может потребовать много времени и ресурсов компьютера.
Также можно использовать программы для конвертации DjVu в другие графические форматы (к примеру, DjVuOCR). Главное — чтобы в итоге вы получили документ, который можно распознать при помощи Fine Reader или другой подобной программы. Распознанный текст экспортируется в текстовый редактор, где его при необходимости можно подредактировать, а уже потом текстовый файл конвертируется в FB2.
Итак, есть две основные схемы конвертирования формата DjVu в FB2. Если в книге присутствует текстовый слой, нужно просто скопировать его в текстовый документ, а уже его сконвертировать в FB2.
Если текстового слоя нет, цепочка будет выглядеть следующим образом: конвертация DjVu в PDF или графический формат → распознавание получившегося файла в OCR программе → сохранение распознанного текста в текстовый файл → конвертация текстового файла в FB2.
Вообще, конвертация DjVu в FB2 — процесс долгий и достаточно трудоемкий. Так что если у вас есть возможность обойтись без конвертации, лучше оставить книгу в DjVu формате.
Источник: https://strana-sovetov.com/computers/5947-kak-konvertirovat-djvu-v-fb2.html