холодный отжим текста
diesell@lj попросил меня рассказать, как я вытаскиваю тексты из гугльбукса. Никакой хитрости тут нет, более того, возможно, есть более эффективный способ, тем не менее, если нужно посмотреть небольшой кусок (максимум 2-3 страницы), то это, конечно, удобнее, чем специально ходить в библиотеку.
Текст вытаскивается по методу коромысла, когда с помощью текстовых кусков вытаскиваются картинки-«папирусы» и наоборот. В случае, когда следующий кусок текста попадает в «мертвую зону», не выдаваемую ни как текст, ни как «папирус», к текстовому запросу присоединяется простейшее короткое слово (союз, предлог, местоимение), либо ключевое слово, о котором известно, что оно встречается в дальнейшем.
Разберем на конкретном примере: книга Викторина Попова
«Снег и солнце», меня интересует страница 28.
( Read more... )Upd:
kcmamu @lj подсказал гораздо более
простой и рациональный способ.