Djvu в Linux: how-to

Когда я переходил на linux — я выделил для себя несколько ключевых приложений, которые мне были нужны для нормального рабочего процесса и прямых аналогов, которых я не находил (точнее не находил аналогов, устраивающих меня).

Мне нужна была своя система хранения данных (что решилось с помощью АБТФ и vim), свой каталоггер (до недавнего времени я пользовался Cathy в связке с wine, но теперь у меня есть быстрый и дешевый самописный каталоггер), чайный таймер (он был сделан первым делом), и еще несколько мелочей. Отдельным пунктом стоял вопрос о преобразовании сканов в djvu-формат. Читаю я много, кое-что сканирую, кое-что храню на диске. Мне нужен был хороший djvu-просмотрщик (он нашелся почти сразу) и… софт, позволяющий обрабатывать сканы и генерировать djvu-файлы. А вот этот пункт выглядел загадочно. Однако, все оказалось проще, чем я думал :)

Отличное руководство есть здесь.

Я дополнил его генерацией tiff -> jpg и все отлично сработало.

В целом процесс выглядит так:

  1. Получаем сканы (фотографии)
  2. Доводим сканы до ума с помощью scantailor. Программа намного более продвинутая, чем все, что мне встречалось до того — она превзошла даже scankromsator, которым я пользовался под M$Windows.
  3. Сохраненные файлы конвертируем в отдельные djvu-странички, а потом объединяем их в один файл.

Конвертация идет через пакет djvulibre — конкретно его утилита c44 делает из jpg-ов дежавюки с заданным разрешением (и прочими параметрами), а djvm собирает их в один файл.

Если конвертить все из папки с jpg то можно сделать цикл, который прогонит сразу все jpg-и и сделает из них комплект djvu-ков с аналогичным названием.

for x in *.JPG; do c44 -dpi 300 $x; done

Как правильно заметил сэр Engraver файлы при этом должны быть пронумерованы подряд с лидирующими нулями. То есть 0001.jpg .. 0015.jpg .. 0155.jpg и так далее — тогда при обработке они будут идти подряд.

Дальше остается их склеить в один файл.

djvm -c ../ship.djvu *.djvu

У меня произошел нюанс. Мои страницы дневника были сосканированы в tiff, который не понравился c44. Я дополнительно переконвертил их с помощью утилиты convert из пакета ImageMagic.

for x in *.tiff; do convert $x $x.jpg; done
Реклама

6 Responses to Djvu в Linux: how-to

  1. Спасибо за описание!

    ИМХО стоит так же добавить, что в названиях файлов нужны лидирующие нули типа 0015.jpeg, чтобы страницы располагались по порядку.

  2. Да. Нужно будет добавить. Очень правильное замечание :) Я обычно так и делаю. А папки-фотографии етс стараюсь нумеровать датами (20100423) — они тогда тоже подряд обрабатываются.

    Кстати, нумерация файлов (в скриптах bash) для меня пока остается загадкой. В смысле я не очень ясно представляю себе через что это можно сделать :)

  3. Обновил :)

  4. crower:

    для tif-ов нужно использовать cjb2. Тогда лишней конвертации можно избежать.

  5. […] Djvu в Linux: how-to April 20104 comments 4 […]

  6. […] быстрый каталоггер дисков, я научился работать с djvu (что было очень критично для меня). Мое железо никогда […]

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

%d такие блоггеры, как: