1. Друзья, в это тяжёлое и непонятное для всех нас время мы просим вас воздержаться от любых упоминаний политики на форуме, - этим ситуации не поможешь, а только возникнут ненужные ссоры и обиды. Это касается также шуток и юмора на тему конфликта. Пусть войны будут только виртуальными, а политики решают разногласия дипломатическим путём. С уважением, администрация Old-Games.RU.

    Скрыть объявление
  2. Пожалуйста, внимательно прочитайте правила раздела.
  3. Если Вы видите это сообщение, значит, вы ещё не зарегистрировались на нашем форуме.

    Зарегистрируйтесь, если вы хотите принять участие в обсуждениях. Перед регистрацией примите к сведению:
    1. Не регистрируйтесь с никами типа asdfdadhgd, 354621 и тому подобными, не несущими смысловой нагрузки (ник должен быть читаемым!): такие пользователи будут сразу заблокированы!
    2. Не регистрируйте больше одной учётной записи. Если у вас возникли проблемы при регистрации, то вы можете воспользоваться формой обратной связи внизу страницы.
    3. Регистрируйтесь с реально существующими E-mail адресами, иначе вы не сможете завершить регистрацию.
    4. Обязательно ознакомьтесь с правилами поведения на нашем форуме, чтобы избежать дальнейших конфликтов и непонимания.
    С уважением, администрация форума Old-Games.RU
    Скрыть объявление

Soft Редактирование PDF

Тема в разделе "Hard & Soft", создана пользователем ZoRg, 26 фев 2014.

  1. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    У меня есть отсканированная книга, мне нужно изменить размер, выровнять текст, а так же что бы каждая страница шла отдельно, то есть нужно почти все заново собрать. Но как? Посоветуйте хорошую программу и может даже как пользоваться.
    А еще нужно переконвертировать из djvu в pdf. (другую книгу, не эту)
    p.s. для электронной книги.
    [​IMG]
     
    Последнее редактирование модератором: 19 июл 2015
  2. drk_patr1ck Z-z-z-z

    drk_patr1ck

    Регистрация:
    17 мар 2007
    Сообщения:
    2.040
    ZoRg54321, без OCR никак.
     
  3. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    drk_patr1ck, что?
     
  4. Virgil Администратор

    Virgil

    Администратор

    Регистрация:
    2 янв 2005
    Сообщения:
    11.652
    Сначала надо распознать текст, а потом заново всё собрать, подобрать шрифты. Целое дело.
     
  5. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    Virgil, но PDF это же картинки. Почему нельзя их просто отредактировать и запихнуть по новому?
     
  6. IdeaGen

    IdeaGen

    Регистрация:
    4 фев 2014
    Сообщения:
    1.367
    Сначало нужно разбить книгу на отдельные изображения. Тут поможет виртуальный принтер.
    Чтобы выровнять страницы, нужно воспользоваться ФайнРидером. Он разворачивает картинку перед распознанием. Последняя версия ещё и раздиляет сдвоенные листы в отдельные картинки так же на автомате. А так же, если не ошибаюсь, поддерживает экспорт не только в pdf, но и djvu.

    Более простого и автоматизированного способа нет. Будет плюс, текст будет распознан. Не обязательно сохранять именно распознанную версию, лучше djvu OCR-слоем (распознаный слой будет поверх картинки, но невидим, но его можно будет выделить, а также по нему потом можно будет осуществлять поиск)
     
    Последнее редактирование: 27 фев 2014
    Svetoch, Val07og и ZoRg нравится это.
  7. drk_patr1ck Z-z-z-z

    drk_patr1ck

    Регистрация:
    17 мар 2007
    Сообщения:
    2.040
    проблема еще в том, что качество распознавания при таком качестве картинки будет фиговым.
     
  8. Darza

    Darza

    Регистрация:
    2 апр 2013
    Сообщения:
    167
    ZoRg54321, PDF это ни разу не картинки. То есть можно конечно завернуть картинки в пдф, но это не самый дефолтный вариант использования данного формата. Проще всего загнать пачку файлов в файнридер, он действительно сам их выровняет по возможности, на сам OCR можно и вправду забить, и получить на выходе "картиночный" пдф. Ещё можно загнать всё в фотошоп, там всё поправить вручную (имеет смысл, если надо аккуратненько чтоб), потом сгенерить из батча картинок один пдф силами самого фотошопа.
     
    Svetoch и ZoRg нравится это.
  9. A.P.$lasH

    A.P.$lasH

    Legacy

    Регистрация:
    27 фев 2010
    Сообщения:
    4.666
    ZoRg54321, есть комплексное решение (не включает в себя OCR):

    ScanKromsator
    http://ru.wikipedia.org/wiki/ScanKromsator

    http://www.djvu-soft.narod.ru/kromsator/

    Интерфейс, конечно - мама не горюй, но работает и помогает. Единственный минус - придётся внимательно вчитываться в доступные руководства, потому как интуитивно-понятного в этом густом расположении кнопок и закладок немного.

    Там же советуют Scan Tailor.
    http://ru.wikipedia.org/wiki/Scan_Tailor

    Пишут, что особое внимание автор уделяет лаконичности и доступности интерфейса.

    Но этой программой не пользовался, ничего не скажу.
     
    compart, ZoRg и Val07og нравится это.
  10. Darza

    Darza

    Регистрация:
    2 апр 2013
    Сообщения:
    167
    Scantailor походу отлично, спасибо A.P.$lasH. Если ОЦР не надо, то правит круче чем сканридер (у меня правда не самый последний, так что не знаю, мож там всё круто тоже). Правда потом надо из батча картинок всё равно собирать ПДФ сторонним приложением, что не особая проблема, впрочем.
     
  11. oldes-games

    oldes-games

    Регистрация:
    15 сен 2009
    Сообщения:
    70
  12. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    на удивление ABBYY FineReader 11 все хорошо распознал, по крайней мере я не увидел ошибок. Но, там все сливается и этот проклятый RTF не получается отредактировать.

    пробую еще другие варианты
     
  13. IdeaGen

    IdeaGen

    Регистрация:
    4 фев 2014
    Сообщения:
    1.367
    и не нужно, по идее.

    - Открываешь ABBYY FineReader 11
    - Кидаешь в него свой исходный PDF
    - Жмёшь "Документ-->Анализ документа"
    - Затем "Документ-->Распознать"
    - Затем "Файл-->Сохранить документ как-->Документ DjVu"
    - Можешь нажать "Опции..." чтоб побаловаться с параметрами сжатия (но НЕ трогай "Режим сохранения", он должен быть "Текст под изображением")
     
    ZoRg нравится это.
  14. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    но Djvu мне как раз не подходит.
     
  15. IdeaGen

    IdeaGen

    Регистрация:
    4 фев 2014
    Сообщения:
    1.367
    тоже самое можно и с PDF делать, что все сохранится картинками, а текст будет все ровно выделяемый
     
  16. ZoRg

    ZoRg

    Переводчик

    Регистрация:
    30 май 2010
    Сообщения:
    6.153
    Кажется я все сделал. Забавно, что для этого (включая конвертацию djvu, для которой я скачал кучу программ) хватило ABBYY FineReader 11, которая у меня уже пол года как установлена.
     
  17. Darza

    Darza

    Регистрация:
    2 апр 2013
    Сообщения:
    167
    ZoRg54321, так оная "куча программ" же написана для небогатых людей у которых файнридера нет. Круто что всё получилось.
     
    ZoRg нравится это.
  1. На этом сайте используются файлы cookie, чтобы персонализировать содержимое, хранить Ваши предпочтения и держать Вас авторизованным в системе, если Вы зарегистрировались.
    Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie.
    Скрыть объявление