Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет haeldar ([info]haeldar)
@ 2010-07-19 13:53:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Касательно библиотек которыми мы так гордимся
Я счтаю что PDF в качестве формата для сканирования электронной книги, в том числе всех этих военно-исторических "мурзилок" должен помереть лютой смертью. Дорогу RTF-ам!

Ибо электронная книга без возможности поиска по тексту теряет примерно половину своего смысла.

Это я просто цитату в скане "Фронтовой иллюстрации" ищу и ругаюсь матерно.


(Добавить комментарий)


[info]iosipboroda@lj
2010-07-19 06:56 (ссылка)
Э-э-э... Кагбе PDF-ы тоже разные бывают.

(Ответить)


[info]mikser@lj
2010-07-19 06:57 (ссылка)
Если на что-то заменять, то на djvu.

(Ответить) (Ветвь дискуссии)


[info]iosipboroda@lj
2010-07-19 06:59 (ссылка)
Если подскажете нормальный софт для его просмотра - я за.
А то всё, что попадалось напоминает порнографию с извращениями - вроде интересно, но смотреть долго - противно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikser@lj
2010-07-19 07:01 (ссылка)
http://www.djvu.org/links/

(Ответить) (Уровень выше)


[info]e_c_r_d@lj
2010-07-19 07:01 (ссылка)
WinDjView версии 1.0+ не? Ставить в опциях сглаживание -- и всё ОК.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]samuel_volkov@lj
2010-07-19 07:11 (ссылка)
А с электронной книги как? А с кпк/смартфона?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]e_c_r_d@lj
2010-07-19 07:25 (ссылка)
По этому поводу не могу сказать ничего, в этих читалках не копенгаген. У меня ёжыг (и куча стационаров)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]samuel_volkov@lj
2010-07-19 07:28 (ссылка)
В электронных книгах, afaik, нет в принципе, а на WinMobile последний раз, когда я смотрел, было что-то чудовищное, прожорливое и не всеядное.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dr_romualdych@lj
2010-07-19 10:17 (ссылка)
С джву на винмобайлах туго и подвижек не наблюдается. С пдфками тоже не совсем комильфо - попробуй посмотреть какой-нибудь глянец (Максим хотя бы). Причём перекомпоновка не помогает, да и помочь не может - там же сканы.

(Ответить) (Уровень выше)


[info]saver_ag@lj
2010-07-30 16:34 (ссылка)
"В электронных книгах"
Есть на лбуке, хоть и тормозит. Нехер всякими киндлами пользоваться.

(Ответить) (Уровень выше)


[info]behe_moth@lj
2010-07-19 07:11 (ссылка)
А от того, что нераспознанные jpegи объединятся не в pdf, а в djvu - в них сразу поиск появится, да?
Вообще, кстати, не понимаю преимуществ djvu.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikser@lj
2010-07-19 07:14 (ссылка)
Оттого что нераспознанные jpeg-и объединяться не в pdf или djvu, а будут в качестве картинок прикреплены к файлам rtf - в них сразу поиск появится, да?
:)

http://en.wikipedia.org/wiki/Djvu

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]behe_moth@lj
2010-07-19 07:43 (ссылка)
>>Оттого что нераспознанные jpeg-и объединяться не в pdf или djvu, а будут в качестве картинок прикреплены к файлам rtf - в них сразу поиск появится, да?

Я так понимаю, что Хэльдар имел в виду степень распознанности, и выразил как смог.

>>http://en.wikipedia.org/wiki/Djvu
Я тащемта в курсе, что дежавю - это такой пдф для бедных, да ). Преимущества-то в чем? Раз вы за него ратуете - знать должны )
И кстати для мобильных устройств(винмобайл например) я еще не видел ни одной вменяемой читалки дежавю.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikser@lj
2010-07-19 07:48 (ссылка)
Что такое степень распознанности? Я не понимаю.

Преимущества в том, что он значительно меньше размером, свободный от лицензий, и при этом может делать то же что и коммерческие аналоги.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]behe_moth@lj
2010-07-19 07:59 (ссылка)
>>Что такое степень распознанности? Я не понимаю.
/KO mode on
Хэльдар ругается на типовую болезнь пиратских копий книг - это когда нераспознанные сканы тупо запихиваются в pdf/djvu/что-то еще(ненужное зачеркнуть) и хочет распознанное. Не будучи айтишником, употребляет названия (соответствующих самых распространенных) форматов.
/KO mode off

>>Преимущества в том, что он значительно меньше размером
За счет сжатия с потерями?
>>свободный от лицензий
Дааа? http://www.caminova.net/en/downloads/download.aspx?id=1 пункт 6 почитайте, хотя бы название.
>>коммерческие аналоги
А редакторы некоммерческие, да? А https://www.caminova.net/en/shop/ - это мираж?

(Ответить) (Уровень выше)


[info]e_c_r_d@lj
2010-07-19 07:00 (ссылка)
И пдф и дежавю поддерживают текстовые слои -- просто распознайка не всегда верно распознаёт, а править это вручную -- китайцев в китае не хватит

(Ответить)


[info]dr_guillotin@lj
2010-07-19 07:01 (ссылка)
Есть же распознанные PDF-ы.

(Ответить)


[info]samuel_volkov@lj
2010-07-19 07:03 (ссылка)
Ты уже морально готов пропустить всю кучу через finereader и вычитать получившееся?

(Ответить) (Ветвь дискуссии)


[info]haeldar@lj
2010-07-19 07:11 (ссылка)
вот перед этой задачей немотствуют уста

это скорее напутствие будущим сканерам

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]samuel_volkov@lj
2010-07-19 07:14 (ссылка)
Будущие сканеры на это положат с прибором.
Потому что им тоже на распознание неохота тратить время и силы.
Увы.

(Ответить) (Уровень выше)


[info]zimopisec@lj
2010-07-19 07:15 (ссылка)
Предпочитаю невычитаные сканы картинкам.
Об ашипках можно догадаться.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]samuel_volkov@lj
2010-07-19 07:17 (ссылка)
Спорный момент. С текстом проблем мало, а вот ошибки в цифрах крайне сложно угадать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]zimopisec@lj
2010-07-19 07:22 (ссылка)
нужно б что-то среднее, а где б его взять?
Текст с возможностью подгрузить исходную картинку. Времени нет, а то сам бы написал.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]thainen@lj
2010-07-19 08:08 (ссылка)
Эм... Распознанный pdf, например?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]zimopisec@lj
2010-07-19 08:21 (ссылка)
не.
Там, если распознанный, не не вычитанный- ощибки остаются в ПДФе. А нужно два независимых потока. Связанных. Обычный текст, фб2 или ртф- и возможность грузнуть исходный жипег, если есть сомнения в распознавании

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]thainen@lj
2010-07-19 08:57 (ссылка)
Что так, что этак — никуда не девается необходимость садиться и вычитывать.

(Ответить) (Уровень выше)


[info]black_skif@lj
2010-07-19 07:03 (ссылка)
скан в PDF - это набор JPEG-ов сшитый по листам. Нужно распозновать, чтобы поиск работал. За распознавалкой надо ещё приглядывать, косяки исправлять.

(Ответить)


[info]solar_myth@lj
2010-07-19 07:10 (ссылка)
Не трогай pdf-ы, они хорошие и вкусные.

Во дежавю - это жесть, да.

(Ответить)


[info]levsha@lj
2010-07-19 08:21 (ссылка)
Если в ртф засунуть тупо отсканированную картинку без ОЦР, то и там возможности поиска не будет. А весить он будет существенно поболе эквивалентного ПДФа.

(Ответить)

Алексей, ты не прав
[info]sigiz_munddd@lj
2010-07-19 15:16 (ссылка)
PDF наше всё! в плане читабельности и совмещения текста и картинок. DJVU люто-бешено ненавижу. Геморроя от этого формата больше, чем удовольствия от чтения. А про RTF и тем паче DOC вообще ничего хорошего не могу сказать. Книги это не только текст, но и наглядные иллюстрации, ( не сочтите меня любителем комиксов) поэтому RTF не катит вообще.

(Ответить) (Ветвь дискуссии)

Re: Алексей, ты не прав
[info]haeldar@lj
2010-07-19 17:59 (ссылка)
RTF понимает иллюстрации тащем-та

(Ответить) (Уровень выше)


[info]madbeast@lj
2010-07-19 16:23 (ссылка)
Это у тебя просто PDF нераспознанный.
Я вот тоже со своими DnD регулярно мучаюсь (((

(Ответить)


[info]mohanes@lj
2010-07-20 04:53 (ссылка)
А в чём проблема? Я пользуюсь Фокзит ридером - там есть функция поиска в тексте ПДФ.

(Ответить) (Ветвь дискуссии)


[info]haeldar@lj
2010-07-20 04:58 (ссылка)
да ну. То есть он их в онлайн-режиме распознает что-ли?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mohanes@lj
2010-07-20 05:53 (ссылка)
Не понял. У меня фокзит ридер на компе установлен. Я открываю ПДФ-файл оным ридером - и всё. Хучь поиск, хучь чтение

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]haeldar@lj
2010-07-20 06:07 (ссылка)
ПДФ скан книги лежащий в сети это как правило сшитые в книжку картинки. Как он может по ним искать?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mohanes@lj
2010-07-20 10:32 (ссылка)
Хм. Не понял. ПДФ - это текстовый формат. Правда, в нём уже ничего нельзя менять, но искать - запросто. Короче, "Foxit Reader - компактная и быстро работающая программа для просмотра и печати документов формата PDF, не требующая наличия большого и поэтому медленно запускающегося Adobe Reader. Позволяет выделять и копировать текст в буфер обмена, а также производить поиск по тексту. Нормально работает с русским языком." (http://soft.softodrom.ru/ap/Foxit-Reader-p6310) Скачивай, и не мучайся.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]haeldar@lj
2010-07-20 10:37 (ссылка)
Неа

смотри, большая часть ВИ мурзилок типа тех же Оспреев делается так - люди берут книжку, разбирают на страницы, пихают в сканер, полученные джпеги конвертят в ПДФ и сшивают в один файл. Я не верю что фоксит сможет это прочесть, распознавание on the fly сейчас ни одна прорамма делать не умеет

для примера - глянь в мою библиотеку качни что-нибудь и попробуй фокситом там что-то найти (тег "библиотека")

(Ответить) (Уровень выше)