Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kouzdra ([info]kouzdra)
@ 2008-03-13 11:29:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
О "защите от копирования книг":
Посидел в ванне - еще раз посмотрел на "защиту от литреса" - все оказалось еще примитивнее, чем я думал:


Юзать: java -jar LIB-Read.jar dyachenko_marina mednyi_korol 30 >dyach.html
(30 - число страниц)
Но жаба в данном случае - стрельба из пушки по воробьям - я-то готовился подменять заголовки, с куками трахаться etc - а все оказалось не просто просто, а очень просто. Вылезу из ванны - может на bash перепишу - думаю, в строчки 3-4 влезет.

import org.apache.commons.httpclient.*;
import org.apache.commons.httpclient.methods.GetMethod;

import java.io.IOException;
import java.text.MessageFormat;
import java.util.regex.*;

public class Main {
    private static HttpClient client = new HttpClient();
    private static String bookUrl(String auth, String bk, int pg) { return MessageFormat.format("http://lib.aldebaran.ru/author/{0}/{0}_{1}/{0}_{1}__{2}.html", auth, bk, pg); }

    public static void main(String[] args) {
        for (int pg = 0; pg != Integer.parseInt(args [2]); ++ pg)
            System.out.println(filter (get(getRef(getRef(bookUrl(args [0], args [1], pg+1))))) + "\n\n<hr>\n\n");
    }

    // удаление срача
    private static String filter(String s) {
        Matcher pattern = Pattern.compile("s \\+= '([^']*)';").matcher(s);
        StringBuilder res = new StringBuilder();
        while (pattern.find ()) res.append(pattern.group(1)).append("\n");
        return Pattern.compile("(<span class=h>[^<]*</span>)").matcher(res.toString()).replaceAll("");
    }

    private static String get(String uri) {
        final HttpMethod method = new GetMethod(uri);
        try { client.executeMethod(method); return method.getResponseBodyAsString(); }
        catch (IOException e) { e.printStackTrace(); return null; }
    }

    private static String getRef(String url) {
//        return Pattern.compile("[\"'](http://[a-zA-Z0-9.-]+/getpage/[0-9]+/[0-9A-Fa-f]+)['\"]").matcher(get(url)).group(1);
        final Matcher matcher = Pattern.compile("[\"'](http://[a-zA-Z0-9.-]+/getpage/[0-9]+/[0-9A-Fa-f]+)['\"]").matcher(get(url));
        matcher.find ();
        return matcher.group(1);
    }
}


(Добавить комментарий)


[info]valshooter
2008-03-13 11:48 (ссылка)
Взломали литрес!!1

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2008-03-13 12:00 (ссылка)
взломали его и без меня - куда интересноее то, что там нечего взламывать:

на главной странице лежит ссылка на iframe

в виде http://lib.aldebaran.ru/getpage/nnn/some-hash

По ней лежит несложный жабаскрипт, который содержит ссылку точно такого же вида. А по той идет текст страницы в виде жабаскрипта, складирующего в переменную s искомый контент. В формате

s += '....'; (на каждую строчку)

Контент для "неудобочитаемости" перемежается мусором в виде
<span class=h>херня</span>.

Ну дальше - три GET'a и немножко регэкспов. На bash'е c wget и sed должно выйти куда короче и проще.

А товарищам веб-девелоперам за эту защиту наверное денег плочено - DRM - это же великие ноу-хау и крутые хакеры :)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]valshooter
2008-03-25 05:06 (ссылка)
Тут вообще чудесное решение нарисовали:
http://asbb.livejournal.com/112712.html

(Ответить) (Уровень выше)


[info]kaledin
2008-03-13 12:14 (ссылка)
Slushaj, a vot esli ne vlom ehtim zanimat'sya, napishi bash-script chtoby fotki s flickra skachivat'? chelovechestvo ocenit. Mne len' -- ya huevo znayu yazyk, mne pridetsya poldnya man chitat'.

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2008-03-13 19:35 (ссылка)
А что там собственно надо? Я flickrом практически не пользовался и даже не смотрел - только по ссылкам иногда заходил.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kaledin
2008-03-13 19:43 (ссылка)
Nu vot primer. Kak vidihs', on pridumyvaet dlinnoe sluchajnoe nazvanie fajla, i krome togo, pryachet ssylku (ya smotrel kak imenno, pryachet tupo, tipa one step removed) i ne daet "save image as". Strogo govorya, ehto zavisit ot pol'zovatelya -- mozhno smenit' ustanovki, togda budet otdel'no link na download. No mozhno i chtob ne bylo. Krome togo, osmyslennaya opciya ehto "sgruzit' vse fotografii dannogo pol'zovatelya"; uzret' ikh mozhno, nachinaya s pervoj stranicy (v privedennom primere ona takaya, dalee po linkam vnizu. I eshche tam est' "sets"; razumno takzhe sgruzhat' dannyj set.

(Ответить) (Уровень выше)


[info]mipa
2008-03-13 14:16 (ссылка)
О! Спасибо. Как раз просили скачать. Надо скорей это сделать, а то поменяют скоро что-нибудь...

(Ответить)


[info]ppkk
2008-03-13 18:17 (ссылка)
Там что-то сменили? У меня нормально открывалось и сохранялось.

(Ответить) (Ветвь дискуссии)


[info]ppkk
2008-03-13 18:24 (ссылка)
Собственно, меня всегда удерживало от автоматизации то, что руками делается обычно быстрее, чем читается. Ну и, конечно, слабые знания в соответствующих разделах программирования.

Для всяких YouTube (использование которых без возможности скачивать я считаю аморальным) я использовал выдирание из кеша броузера вручную (копирование файла из каталога в каталог с помощью известной хакерской программы Far Manager), какую-то утилиту ещё (но она перестала работать), но закончил тем, что перестал пользоваться: больно голимые ролики, удовольствия не получаю.

Про YouTube есть комментарий? Мне пригрезилось, или что-то меняли?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kaledin
2008-03-13 19:44 (ссылка)
Youtube tol'ko chto ob'yavil, chto otkryvaet API -- klienty dlya skachivaniya ya dumayu teper' tonnami pojdut.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-13 20:03 (ссылка)
Спасибо за информацию.

Но они и сейчас тоннами (например, см. Яндекс, строка запроса "vkontakte скачать видео": они для YouTube работают в первую очередь).

Да и универсальные решения возможны (сохраняющие все потоки данных, там уж отличить клип от фоновой музыки страницы несложно, я не видел, но это не очень сложно).

Только это в основном коммерческая деятельность (распространение таких программок), и надо либо платить, либо бояться троянов.

Собственно, про flickr и остальное: сохранять отдельные картинки или потоки может быть несложно через кеш броузера (у меня Опера). А можно ссылку, где картинку показывают, но не дают сохранить? Или там другая проблема?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kaledin
2008-03-14 07:01 (ссылка)
Nu vot naprimer; to zhe, chto ya vyshe daval [info]kouzdra". Sohranit' otdel'nuyu kartinku neslozhno, tam esli posmotret' source, dovol'no ochevidno, gde imenno ona lezhit. No lyudi inogda takim obrazom vykladyvayut celye fotosety, i vse ehto prevrashchaetsya v gemorroj.

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2008-03-17 06:11 (ссылка)
для flickr не надо никаких скриптов (в Оперы и тормозилле по крайней мере).

в Опере есть встроеный content blocker, в тормозилле наверняка уже стоит adblock+. блочим вот такую маску: «http://*.flickr.com/images/spaceball.gif». всё. теперь радостно и весело тыцаем правомышкой на картинку — и! фокус — можно утянуть ссылку. вот с примера ссылка, стянутая в Опере после блокирования дурацкого "шарика": http://farm3.static.flickr.com/2247/2312003769_ab64539403.jpg?v=1204734230

может, оно блокирует что-то жабоскриптом ещё — тут noscript спасёт.

(Ответить) (Уровень выше)


[info]ppkk
2008-03-17 16:30 (ссылка)
Ну да, правой кнопки мыши у меня картинка сохраняется только в "режиме автора" (Опера), когда заслоняющие прозрачные GIF-ы не мешают.

То есть речь о выкачивании всех фотографий из альбома и т.п.: вопрос удобства просмотра их, если автор решит стереть (тогда уж, если быть максималистом, нужно мучиться с названиями, комментариями и т.п., и сделано ничего в итоге не будет).

И Teleport (без сценариев) всякий скорее всего неудобен: может что-нибудь предусмотрено против него, но в любом случае, судя по ссылкам, качать удобно только ВСЁ данного пользователя.

(Ответить) (Уровень выше)


[info]babitto.livejournal.com
2008-03-15 23:13 (ссылка)
USDownloader help you!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-17 16:20 (ссылка)
Ну, это не отвечает на вопрос про то, изменилось ли что-нибудь. Качалка в основном для rapidshare, чтобы понять, как ей качать с youtube, прочитать комментарии автора и т.п., надо быть упорным.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]babitto.livejournal.com
2008-03-17 16:21 (ссылка)
Чего проще: копировать ссылку на видео и качать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-17 22:33 (ссылка)
Это НИКАК не связано с вопросом о том, изменялось ли что-нибудь на YouTube (кроме того, что они открыли API, как написал [info]kaledin).

(Ответить) (Уровень выше)


[info]ppkk
2008-03-13 18:28 (ссылка)
Я имею в виду: прямо сейчас, в точности по URL, какой создаётся программой.

То есть: программка-то, получается, и не для выделения цитат вовсе.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kouzdra
2008-03-13 18:36 (ссылка)
оно открывается, разумеется - выделение при включенном жабаскрипте сразу сбрасывается, если его выключить - то выделяется - но результат (после вставки) получается примерно такой:

Ранним вечером цпарусное сцудно «Крылама» вошло в прибрцежные воды побврта Мирте и встыиало на рейд в ожитждании таможеькнного досмотра. Команда ис пассажиры, сколшько их было, выбралеись на палубу – не только попфтому, что этоэзго требовали тамояеженные прайвила Мирте, но и затюсем, чтобыпп посмотреть на Летающий Город.


А программка просто скачивает текст книжки - то есть делает то, от чего как раз пытаются защититься. Меня в основном интересовало что там наверчено - мораль - что наверчено нечто странное - жить мешает куда больше чем надо для задачи воспрепятствовать скачиванию, при этом саму задачу не решает.

(Ответить) (Уровень выше) (Ветвь дискуссии)

АУ!!!
[info]ppkk
2008-03-13 19:15 (ссылка)
ЭГЕ-ГЕЙ!!! ЭГЕ-ГЕЙ!!!

У меня текст не искажается при выделении-вставке, ёк-макарёк!!!

Броузер — Опера, вставляю в текстовый файл в Фаре!!!

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: АУ!!!
[info]kouzdra
2008-03-13 19:33 (ссылка)
Это любопытно - но может объясняться особенностями оперы - текст на альдебаране гадится вставкой туда в произвольные места <span class=h>xxx</span>, содержимое которых глазом не видно, но в клипборд копируется. Возможно, что опера обходится с этим как-то по другому. Но мне ее честно говоря только ради этого ставить лень.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: АУ!!!
[info]ppkk
2008-03-13 19:59 (ссылка)
А анализатор потока данных (или что там упоминалось как "снифер") что делает? Он позволяет сохранять все потоки (типа видео и звука), различать их? Сколько стоил?

(Ответить) (Уровень выше)

Re: АУ!!!
[info]amdf
2008-03-15 23:17 (ссылка)
Именно так. Opera эти спаны не копирует, в отличие от прочих браузеров.

(Ответить) (Уровень выше)


[info]ppkk
2008-03-13 19:44 (ссылка)
(мне на мои комментарии, видимо, можно отвечать на любой из них)

Я понял, но они, кстати, уже очень налажали: трафик на страницу больше полутора мегабайт, это несерьёзно, это может грузиться (при медленном соединении) дольше, чем читается страница.

Ещё по теме: а я писал (кроме прочего в этом духе; коммерческую, на Дельфах) программку для снятия защиты от печати и т.п. в PDF (при известном пароле пользователей: прочитать-перевертеть-сохранить). Кстати, хорошее упражнение в ООП: структура PDF весьма замороченная, до меня с программкой налажал человек с бОльшей зарплатой и много бОльшим опытом, я его исходники не использовал. Забавно, что ghostscript и прочие XPDF не умеют полноценно "парсить" PDF, хотя он почти полностью документирован (я тоже не писал поддержку всего, это же коммерческая программа, не до качества). Насколько я понимаю, это легальный инструмент для людей, забывших собственный пароль "хозяина" на собственный документ PDF. Тем более, что я писал её до нового ГК.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-13 20:13 (ссылка)
Ещё о броузерах: когда поддержка стандартов для основных технологий, ассоциирующихся с Web 2.0, будет на достаточном уровне, когда Acid3 будет срабатывать на все 100 на всех популярных броузерах (до этого ещё далеко), боюсь, придётся писать намного более серьёзные регулярные выражения (то есть: задача станет сложной).

Но есть ещё довольно универсальное решение, абсолютно с другого конца: распознавание снятых в официальном броузере, где всё работает, снимков экрана. Если текст будут выдавать сложнее, чем на большинстве "каптч" (которые и то периодически "взламывают"), то такими услугами точно перестанут пользоваться нормальные люди (такое можно будет использовать, видимо, только для проверки цитат с точным указанием источников).

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2008-03-17 06:16 (ссылка)
>есть ещё довольно универсальное решение, абсолютно с другого конца: распознавание снятых в официальном броузере, где всё работает, снимков экрана
тьфу. берём движок тормозиллы, подтачиваем так, чтобы финальным этапом был не рендер на экран, а складывание лабуды в файл. то есть, складываем то, что там построчно «нарендерилось». получаем чистый текст. ну, всё чуть сложнее, конечно, но нафига распознавать?

%-)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-17 16:10 (ссылка)
Это вполне объяснялось: "чистый текст" может сильно отличаться от изображённого.

Пример: можно разбить текст на колонки, тогда в "чистом тексте" будет набор колонок (нечитаемо), а на экране они сложатся в цельный текст.

"мама

мыла

раму"

как вертикально размещённые "ммр", "аыа", "млм" и "аау".

Естественно, можно и много чего другого придумать, да и реализовать, чтобы картинка была красивой.

И это ещё без сценариев, функций всяких и т.п.

Ещё, естественно, можно отдельные куски текста выдавать в виде картинок и т.п.

(Ответить) (Уровень выше)


[info]ppkk
2008-03-17 16:11 (ссылка)
То есть Вы, судя по комментарию, ничего не поняли, не прочитали внимательно, и мои ответные комментарии тоже не прочитаете (так как уведомления по электронной почте-то не придёт).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ketmar
2008-03-17 23:32 (ссылка)
отчего же не прочитал? прочитал. и понял. %-) исключая случай «буков-картинок» всё равно проще пробежаться по горизонтальным «боксам». имо. а «буквы-картинки» можно распознавать по именам. ибо если имена у них будут уникальные — то посетители пошлют такой «удобный» ресурс наЎ, и он сам сдохнет.

хотя отчего г-н колесников до сих пор не двинул мощную идею строить тексты из 66-и мелких буквокартинок — не ясно. по накалу идиотизма идея как раз для магистера.

(Ответить) (Уровень выше) (Ветвь дискуссии)

двойной ответ
[info]ppkk
2008-03-18 17:29 (ссылка)
Может я уже упомянул, но у них страница "весит" 1.5 Мб. Дать весь текст в виде картинки (а не использовать заново картинки буковок) — не проблема с такими "габаритами".

Я всё равно не пользуюсь практически (чаще всего по ссылкам [info]kouzdra), и эти 1.5 Мб меня тоже отпугивают.

Про вертикальное размещение: да, это годится только для моноширинных шрифтов без труда.

1. (максимализм) Но когда броузеры, проходящие Acid3 станут нормой (а там, например, должен быть включен Яваскрипт и т.п.), к чему идёт, такой "титанический труд" тоже будет относительно нормальным: труд титанический при чисто декларативном подходе средствами HTML 4 и т.п., а с помощью функций и т.п. становится проще.

2. (попроще) Без Яваскрипта и Флеш-плагина довольно многие страницы не загибаются. Я их не смотрю ("посылаю"), но они всё равно не загибаются. С помощью Яваскрипта переставлять буковки несложно по очень разным алгоритмам. Это вовсе не титаническая работа. "Титаны" не требуются даже для создания не слишком очевидно шаблонных стандартных HTML страниц на стороне сервера.

Вот, кстати, набросок ограниченного решения проблемы вертикальных строк: на стороне сервера с учётом размеров окна и шрифта создаётся столько вертикальных строк, сколько пикселов по ширине. Для тех обычных строк, в которых с данным сдвигом (в пикселях) не начинается символ, в вертикальной строке идёт пробел.
+: избыточность самого текста — "всего" раз в двадцать, что мало по сравнению c прочей мишурой
-: при изменении ширины окна надо обновлять страницу (а на сервере надо ограничить возможное количество обновлений в минуту); с учётом жизнеспособности, например, страниц "оптимизированных для просмотра в Internet Explorer в разрешении 800*600" — это не вопрос жизни и смерти

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-18 17:40 (ссылка)
note: правка кривого тэга.

>Может я уже упомянул, но у них страница «весит» 1.5 Мб.
вроде бы ощутимо меньше. натурально, всякую рекламу я не считаю, ибо просто её не вижу. %-) с моими 12 KiB/sec я даже визуально заметил бы загрузку полутора метров.

>Я всё равно не пользуюсь практически
я тоже, но побалаболить подискутировать это не мешает. %-)

1. в принципе, это долго. к тому же если они не будут поддерживать IE, то у них «срежется» как минимум половина (это я оптимист) аудитории. ибо асилившие тормозиллу/оперу асилят и поискать торрент/мул.

вы же не верите, что IE будет вменяемо поддерживать стандарты? я лично не верю.

2. да на здоровье. всё равно в итоге оно должно попасть на экран. и вот это «попадалово» я и предлагаю посылать вместо экрана в файл. не так всё просто, конечно, но ничего нереального не вижу.

>набросок ограниченного решения проблемы вертикальных строк
шибко ограниченого. учитывая, что масштабирование страниц наконец появилось и третьей тормозилле, к тому же есть такая штука, как юзерские стили — оно опять же рабоее только для бедняг, сидящих на IE.

а в принципе — я только за то, чтобы реализовывали кучу всяких сложных схем, которые будут глючить и разваливаться. тем быстрее помрут нафиг.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-18 20:56 (ссылка)
я и предлагаю посылать вместо экрана в файл. не так всё просто, конечно, но ничего нереального не вижу.
В этом смысле всё равно заканчивается анализом фактического построенного изображения, а не текстовых строк как есть: а это по сути то, что я написал, и что вызвало возражения:)

а в принципе — я только за то, чтобы реализовывали кучу всяких сложных схем, которые будут глючить и разваливаться. тем быстрее помрут нафиг.
Я против. Я считаю, что реализация и поддержка сложных моделей, с примерами типа того же Acid3 — жуткое усложнение.
Но я и против флеш-анимации и т.п.
Они по факту не умирают! Глючат, разваливаются, кормят толпу дизайнеров (которые тыкают мышкой в редакторе страницы) и программистов, но не умирают! Я сам однажды реализовывал жуткие какие-то микрософтовские извращения над HTML с целью "правильного" импортирования страниц в МС Ворд: народ пользуется, технологии живут.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]kouzdra
2008-03-18 21:17 (ссылка)
В этом смысле всё равно заканчивается анализом фактического построенного изображения, а не текстовых строк как есть: а это по сути то, что я написал, и что вызвало возражения

Если речь идет о картинке, которая рендерится броузером из текста - то туда и надо вписываться - причем не думаю, что особенно сложно.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-19 03:16 (ссылка)
Да, броузер-чёрный ящик. Не могут же текст делать неразборчивым для живых людей. А "красивости" типа буквиц и экзотических шрифтов (когда в тему) разумнее тогда картинками и оставлять.

Ну и сохранение вырезанных текстовых полей как картинок для сжатия в djvu — вполне приличный вариант.

Естественно, могут быть баннеры посреди текста, но их и обычные пользователи тогда должны будут терпеть. Цель-то первая техническая: добиться сохранения у себя данных для лёгкого независимого обеспечения себя услугой не хуже, чем на сайте.

(Ответить) (Уровень выше)

Re: двойной ответ
[info]ketmar
2008-03-19 00:15 (ссылка)
>В этом смысле всё равно заканчивается анализом фактического построенного
>изображения, а не текстовых строк как есть

однако же задача распознавания именно символов не стоит. там было «распознавание», я понял как «распознавание символов».

>Я против
я, вообще-то, про литрес сотоварищи, а не про CSS. %-)

>я и против флеш-анимации и т.п.
аналогично. всяческие плугины у меня отключены нафиг. однако разумное применение жабаскрипта приветствую.

также приветствую разделение логики и представления (CSS/HTML). однако нутром чую, что оно куда-то не туда пошло. куда — сказать не могу, нутро молчит, зараза. только сигнализирует, что «не туда». %-)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-19 03:11 (ссылка)
там было …, я понял как
Я нить уже подпотерял, но я имел и имею в виду распознавание текста на вылезшей из броузера-чёрного ящика картинке: если текст по разборчивости как на "каптчах", то вряд ли этими услугами пользуются живые люди, значит автоматическое распознавание должно срабатывать.

Вообще, потратить человеко-час на книжку для её выдирания (пусть во многом автоматизированном), по-моему, — честно. Иначе какое-то беззастенчивое явное пиратство.

однако нутром чую, что оно куда-то не туда пошло. куда — сказать не могу, нутро молчит
Про нутро надо читать, ЧТО именно проверяет тест Acid3, станет тяжело. Там скорее не слова HTML/CSS, а Яваскрипт как обязательный и продвинутые фишки малопонятных мне DOM (я ж не разработчик страничек, тем более, что там горят буквы Web 2.0: порталы, движки всякие покруче Жиж и т.п.). Стандарты уже давно есть, но ничего хорошего, по-моему, от них не будет. Acid3 интересен в первую очередь тем, что производители броузеров-таки ЗА выполнение тестов, включая IE.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-19 03:25 (ссылка)
>я имел и имею в виду распознавание текста на вылезшей из броузера-чёрного
>ящика картинке

вот. а я веду к тому, что пока картинки нет — достаточно проанализировать то, что браузер рендерит, распознавать символы не надо.

>Иначе какое-то беззастенчивое явное пиратство.
я не знаю, что такое «пиратство» по отношению к информации. и никогда этого не узнаю — ибо понять такое не способен.

>Яваскрипт как обязательный
и опять ничего в этом плохого не вижу. кроме того, что JS родился как костыль и живёт на правах старого, любимого, но костыля. отсюда у меня и чуйка «не то».

>Стандарты уже давно есть, но ничего хорошего, по-моему, от них не будет.
ах, если бы их ещё все поддерживали одинаково… тогда бы наступил полный рай и одинаковый рендеринг во всех браузерах. что хорошо, и хорошо весьма. впрочем, меня волнует только Опера. остальные пусть хоть удавятся — главное, чтобы в Опере всё выглядело нормально. %-)

>включая IE.
ему ещё лет 50 «включаться». пока народ задорно дотачивает поддержку третьего аксида (вива вебкит! когда ж допиляют midori?), ие со скрипом асиливает второй. некрософт, фигле…

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-19 04:28 (ссылка)
кроме того, что JS родился как костыль и живёт на правах старого, любимого, но костыля
Для Acid3 он обязателен. Это меня скорее смущает. Больше, чем поддержка SVG, например. Кстати, если текст будет на языке SVG нарисован (не по буквам, а по элементам каким-то), то вопрос об анализе исходников может отпасть более очевидно (у нас теоретический трёп, поэтому оценивать практичность атаки на исходный текст или использования моей [в данном обсуждении, по крайней мере] радикальную идею можно бесконечно).

ах, если бы их ещё все поддерживали одинаково… тогда бы наступил полный рай и одинаковый рендеринг во всех браузерах. что хорошо, и хорошо весьма. впрочем, меня волнует только Опера. остальные пусть хоть удавятся — главное, чтобы в Опере всё выглядело нормально. %-)
Или "рендеринг" будет одинаково во всех броузерах заканчиваться крахом броузера на некоторых страницах. Тоже рай?

Опера на Acid3 работает крайне нестабильно, если "с чистого листа", то 46/100, а если ещё что-то открывалось, если второй раз попытаться или что-нибудь такое — то бывает вываливается (с окном, что "приложение будет закрыто") на некоторых тестах, начиная с 9, кажется, до 41.

От тяжкой гонки за поддержкой безумных стандартов все броузеры станут заточенными под конкретные тесты, плохо написанными (а значит плохо развиваться в сторону пользователя, а не разработчика страниц) и очень глючными.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-19 04:50 (ссылка)
>Для Acid3 он обязателен.
«костыль» в данном случае у меня означает «прибили ржавыми гвоздями буратино к стенке».

>стати, если текст будет на языке SVG нарисован (не по буквам, а по
>элементам каким-то), то вопрос об анализе исходников может отпасть более
>очевидно

а вот это более богатая идея, чем картинки, имо. тут уже, если правильно делать, без распознавания никуда. ибо наворотить можно (учитывая, что в SVG тоже есть JS) — маманегорюй.

>у нас теоретический трёп
ну да. я люблю такие. %-)

>Или «рендеринг» будет одинаково во всех броузерах заканчиваться крахом
>броузера на некоторых страницах. Тоже рай?

да. потому что тогда эти страницы переделают. а вот если в одном-двух будет работать, а в других — нет, вот это намного хуже.

>Опера на Acid3 работает крайне нестабильно
смотря какая. сегодняшняя, например, 77/100, ничего не падает. я ж не юзаю ветку 9.2x, это тормоз ущербный. %-)

>с окном, что "приложение будет закрыто"
у меня не бывает таких окон. %-))

>все броузеры станут заточенными под конкретные тесты
фишка аксида именно в том, что если верно рендерят аксид — то верно рендерят и остальное. патологию типа внутренних хаков специально для аксид-страницы рассматривать не будем, думаю?

>плохо развиваться в сторону пользователя
??? как одно с другим связано? O_o
вообще, кроме Оперы и так никто никуда не развивается в плане юзабилити. тормозилла тормозит, течёт и неудобна до жути. IE не рассматриваем в силу родовой травмы. Safari не рассматриваю лично я, ибо не имею мака. %-)
итого получаем, что Опера придумывает фичи, через некоторое время их со скрипом (и криво, обычно) внедряют в тормозиллу. IE как всегда запаздыват на пол десятилетия.

>и очень глючными.
Opera 9.50 beta aka 'Kestrel' по стабильности приближается к официальному релизу (у меня, например, падает реже, чем ветка 9.2x; за пол-года около 1-2 падения в месяц, это учитывая, что версия даже не beta, а developer snapshot). при этом поддерживает она всё больше, работает всё быстрее (sic! 9.2x тормозит по сравнению с Kestrel). правда, парни из Opera Software недовольны: «слишком медленный Kestrel, Peregrin будет шустрее, задолбали нас тормоза». %-)

>плохо написанными
это опять к тормозилле. надеюсь, они хотя бы tamarin не угробят.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-20 22:31 (ссылка)
это более богатая идея,
А, по-моему, Яваскрипт более гибок. Не попробуешь и так и эдак, даже субъективно оценивать сложно…

да. потому что тогда эти страницы переделают.
При том, что они будут соответствовать стандартам.

> Опера на Acid3 работает крайне нестабильно
сегодняшняя, например, 77/100, ничего не падает. я ж не юзаю ветку 9.2x, это тормоз ущербный
А ты помучай, помучай. Не знаю, я очень недоволен 9.2, 9.5 не пробовал, но ранее бОльшей стабильности не замечал в тестовых версиях. Насчёт тормозов: ну, отключение Яваскрипта обычно помогает, а от страниц, без него не работающих совсем, я стараюсь не зависеть.

фишка аксида именно в том, что если верно рендерят аксид — то верно рендерят и остальное
Это вряд ли. Такой тест — недостижимый обычно идеал. Программы пишутся так, что даже при одинаковых исходных состояниях то, что видимо нормально выполняются действия a, b, a-b, b-a, a-b-a и т.п., не может гарантировать, что a-b-a-b-… (тысячу раз) выполнится нормально. Характер действий Оперы (полный вылет в некоторых ситуациях, при повторном запуске) это и показывает: она не могла показать 46/100 два раза подряд даже при "удалении личных данных" между.
Acid3, как я понимаю, проверяет возможность использования некоторых "современных" технологий, а не анализирует работу броузера, как её воспринимает пользователь, сколько он жрёт памяти и т.п.

>плохо развиваться в сторону пользователя
??? как одно с другим связано? O_o
Есть разница между получением картинки "как надо" на одном наборе из сотни специфических тестов и, например, удобством интерфейса, быстродействием в типичных ситуациях. В Acid3, например, заложено обязательная эффективность использования вычислительных мощностей? Многоступенчатые неестественные усложнения движка для поддержки "фишек" могут вызвать тормоза.
Safari не рассматриваю лично я, ибо не имею мака
Для любителей тестовых версий β выходила довольно давно (кажется, была убогой, но портировать сложный хороший [если не врут] продукт, который дорабатывали напильником, очень сложно).

>и очень глючными.
Opera 9.50 β…

Я по своему опыту сужу: Опера 5 или 6 была (сравнительно) шустрой и без глюков, а сейчас я ощущаю её неудобным, но привычным броузером без хороших альтернатив и страдаю.
Собственно, версия 9 такое отношение и вызвала в первую очередь.
Кстати о фишках: "табы" как раз предъявляют повышенные требования к непадению броузера целиком на каких-то страницах…

На Мозиллу да Огнелиса смотрел мало, общее впечатление — что-то тяжёлое. Может и неправ. "Виджеты" не собираюсь использовать нигде.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-20 23:33 (ссылка)
>А, по-моему, Яваскрипт более гибок.
SVG не отменяет жабоскрипта. просто рисовать в SVG проще.

>При том, что они будут соответствовать стандартам.
тогда на них не будут падать все браузеры. а которые будут — те пусть чинят. и Оперу, и тормозиллу чинят достаточно оперативно.

>А ты помучай, помучай
избави демоны! я не могу юзать 9.2. она ОЧЕНЬ медленная. на pIII/600 это заметно без напрягов.
а вообще — я юзер исключительно Оперы ещё с версии 3.5, сравнивать есть с чем. я ещё помню, какая была радость, когда ввели поддержку разных кодировок; и версию, где была вмонтированая аська. %-)

>ранее бОльшей стабильности не замечал в тестовых версиях
раз на раз. вот в новой тестовой, например, отвалилось открытие новых страниц из кнопок и комстроки. регресс, но не падает.

хотя вру: падает. от простой жабоскриптовой строчки. надо бы проверить на 9.2x, но лень. но такой жабаскрипт пишут только больные Кэтмары. %-)

>Программы пишутся так, что даже при одинаковых исходных состояниях то,
[крыс погрыз]
>не может гарантировать, что a-b-a-b-… (тысячу раз) выполнится нормально.

это ты не программу описал, а быдлокод. если программа ведёт себя непредсказуемо — в ней баг. точка. баг надо найти и убить. для чего служат unit и regression тесты, а также формальные доказательства работоспособности алгоритмов. ну и я бы с удовольствием увидел повсеместное внедрение literate programming.

я программирую уже не первый десяток лет, так что позволил себе вот такой снобизм. %-)

>>а не анализирует работу броузера, как её
>воспринимает пользователь, сколько он жрёт памяти и т.п.

а он и не должен это проверять. тонкости реализации в стандартах не описаны — делай как хочешь, лишь бы в итоге работало. для проверок на скорость, поедание моска и ты пы используют другие тесты. это правильно, ибо не дело стандартов определять,как писать, достаточно того, что.

>В Acid3, например, заложено обязательная эффективность использования
>вычислительных мощностей?

ты снова путаешь standards compliance и эффективность. одно другое не отменяет, но мерять их одним и тем же тестом несколько странно. это юзеры померяют. и проголосуют путём выбора того, что их устраивает. я, например, вот уже который год таким образом голосую против тормозиллы — усердно проверяя каждый новый релиз и убеждаясь, что по-прежнему тормозилла и мозгоед.

>Для любителей тестовых версий β выходила довольно давно
под винду, afaik. под Linux не видел. а винду не держу.

под Linux есть только midori, построеный на webkit. но оно падает само по себе просто от удивления, что кто-то скачал страницу. %-)

>ейчас я ощущаю её неудобным, но привычным броузером без хороших
>альтернатив и страдаю.

Kestrel быстр. я не преувеличиваю, когда говорю, что 9.2x — тормозит. она действительно тормозит. и периодически Kestrel ускоряют (а не затормаживают с каждой новой версией). и я уверен, что будут ускорять, ибо и layout engine, и javasctipt engine одни и те же, что на десктопе, что на мобиле. а у мобилы ресурсов-то пшик. а оперовцы живут за счёт мобил.

>"табы" как раз предъявляют повышенные требования к непадению броузера
>целиком на каких-то страницах…

это да. таки была одна 9.50 alpha, которая падала на некоторых страницах. благо, у меня инет медленный, я при следующем запуске успевал закрыть то, что падение вызвало. %-) но это оказалось связано с плугинами, а не с движком рендеринга, и после отключения плугинов (которыми я и так не пользуюсь) пропало. однако ж alpha, чего там.

>На Мозиллу да Огнелиса смотрел мало, общее впечатление — что-то тяжёлое.
так и есть. я обычно 40–80 вкладок открытых держу. до 100–150 доходит тоже часто. тормозилла на 30-и начинает заикаться, нервничать и свопиться. Опера на том же конфиге летает как и летала.

вот чего не хватает — возможность объединять табы в группы, сохранять именно группы, а не сессии и детачить не отдельную вкладку, а всю группу. но этого нигде нет.

>"Виджеты" не собираюсь использовать нигде.
а это и не для десктопов придумано. как я писал выше, оперовцы зарабатывают не на десктопных платформах. виджеты сочинили для, например, игровых консолей. вот там они будут сильно востребованы.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ppkk
2008-03-24 18:53 (ссылка)
если программа ведёт себя непредсказуемо — в ней баг. точка. баг надо найти и убить. для чего служат unit и regression тесты, а также формальные доказательства работоспособности алгоритмов.
Да, только вот борьба за новые возможности, сложные стандарты и тест-флагман, под который чешутся руки затачивать движок — существенно провоцируют глюки программ. Я именно об этом.

я не могу юзать 9.2. она ОЧЕНЬ медленная. на pIII/600 это заметно без напрягов.
Согласен. Я перешёл на 9.50b, стало лучше. Тормоза остались, но какое-то эволюционное изменение произошло.
Кстати, чуть не перешёл на Огнелиса 2…12: у него со стабильностью-скоростью тоже неплохо.

>"табы" как раз предъявляют повышенные требования к непадению броузера
>целиком на каких-то страницах…
это да.

Кстати, такое ощущение, что в Оперу 9.50b ввертели поддержку истории разных окон, хотя точно не понимаю, что именно. У меня типовой глюк (был?): справка или что-то такое вызывается, что открывает новое окно Оперы, а старое падает. Тогда если сессия не сохранялась — "конец".

я обычно 40–80 вкладок открытых держу. до 100–150 доходит тоже
И это неудобно даже в разрешении 2048*1536 с мелким шрифтом. Да, согласен, что с этим можно дорабатывать. В Огнелисе, кстати, избежали нечитаемых заголовков в отличие от Оперы.

Видимо, разумно делать "группы" вкладок в разных окнах: есть поддержка перетаскивания из окна в окно вкладки (хватошвырем). Соответственно, в окне это и будет группой вкладок, которую можно сохранить как сессию. Не очень удобно в полноэкранном режиме.

У меня почему-то отобразилось ранее 4080 и 100150, я испугался и долго не отвечал.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-24 21:24 (ссылка)
>Да, только вот борьба за новые возможности, сложные стандарты и
>тест-флагман, под который чешутся руки затачивать движок — существенно
>провоцируют глюки программ.

есть такое. поэтому, например, Kestrel уже почти год ходит в бетах — тестят, пиляют. %-)

>Тормоза остались
смотрите мой второй ответ, где про отключение поиска и апдейт до последнего снапшота (он ещё быстрее «официальной» беты).

>Кстати, чуть не перешёл на Огнелиса 2…12
я их постоянно скачиваю новых. всё бы ничего, если бы не дичайшие тормоза и ненастраиваемый интерфейс.

>справка или что-то такое вызывается
справку нельзя пока. %-) это ж develper snapshot, по сути. они где-то упоминали, что не надо звать справку, Опера очень обидится. %-)

>И это неудобно даже в разрешении 2048*1536 с мелким шрифтом
тут я даже рад, что неудобно. если бы я их не замечал — было бы открыто 300-400. потому что 80% этих вкладок — «интересная ссылка, потом пролистаю». а так, когда они забивают пол экрана, я таки разгребаю мусор и возвращаюсь к 10-20. чтобы через час опять под сотню нащёлкать. %-)

>В Огнелисе, кстати, избежали нечитаемых заголовков в отличие от Оперы.
??? там как раз напрочь нечитаемо. в Опере я включил режим «ellipsis in center» — удобно. отображает начало и конец заголовка, всё ясно и читаемо. как это сделать в лисе — не знаю.

>Видимо, разумно делать «группы» вкладок в разных окнах
неудобно. как вы выше писали — при крэше «пооконная» история не сохраняется. поэтому я не использую несколько окон.

>У меня почему-то отобразилось ранее 4080 и 100150, я испугался и долго не
>отвечал.

я бы сам испугался. %-)

(Ответить) (Уровень выше)

Re: двойной ответ
[info]ppkk
2008-03-24 19:02 (ссылка)
Ещё об Опере 9.50b: с включенным Яваскриптом некоторые страницы по сути не грузятся (например: lj.rossia.org/users/kouzdra/), может дело и в "разворачивателе" от [info]ketmar.

И автозаполнение какое-то странное в адресной строке: притормаживает, к возможностям надо привыкать, хорошо, что информации побольше, но в любом случае — притормаживает, а это никуда не годится.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: двойной ответ
[info]ketmar
2008-03-24 20:55 (ссылка)
>Ещё об Опере 9.50b: с включенным Яваскриптом некоторые страницы по сути
>не грузятся

что, «официальную бету»? выкинуть и забыть это старьё. читать сюда: Desktop Team Blog. тут дают самые новые.

>(например: lj.rossia.org/users/kouzdra/), может дело и в
>"разворачивателе" от ketmar

у самого Ketmar'а всё работает. ща отпишусь у себя.

>И автозаполнение какое-то странное в адресной строке: притормаживает
это фича полнотекстового поиска. насколько знаю, в новых она отключена. чинится так:
opera:config#UserPrefs|MaxVisitedPagesIndexSize
установить в 0. всё. тормоза пропали навсегда. заодно освободит на диске 150–300 метров. это индекс был.

вообще, идея хорошая — полнотекстовый поиск по истории. но фича затормаживает и ввод адреса, и парзинг страниц. потому фтопку, пока не научится искать и индексировать на фоне, когда машина ничем не занята.

(Ответить) (Уровень выше)


[info]ketmar
2008-03-17 23:35 (ссылка)
кстати, сохранить приемлемую вид страницы при размещении букв хотя бы по вертикали, как вы указали — это задача для какого-то титана, имо. будет страшноужасная лапша из скриптов и кода, которая всё равно минимум в половине браузеров закосячит нипадецки. то есть, идея-то жизнеспособна, но слишком труднореализуема. следовательно, стоит серьёзных денег. да магистер на подтяжках повесится, когда ему цену назовут!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ppkk
2008-03-18 17:29 (ссылка)
http://lj.rossia.org/users/kouzdra/419957.html?thread=2362229#t2362229

(Ответить) (Уровень выше)


[info]kouzdra
2008-03-13 18:38 (ссылка)
ps: как утверждает представитель ресурса - эта фигня действует только в тех книжках, авторы которых подписали с ними договор.

(Ответить) (Уровень выше)


[info]ifp5
2008-03-25 21:08 (ссылка)
Более полная инструкция:
1) скачать jdk с java.sun.com (и поставить его)
2) скачать с apache.org:
- commons-codec-1.3.zip
- commons-httpclient-3.1.zip
- commons-logging-1.1.1-bin.zip
3) распаковать все из пункта 2
4) скомпилять исходник:
javac -cp commons-httpclient-3.1.jar Main.java
5) сделать из него jar
jar cfe lib-read.jar Main Main.class
6) для запуска:
java -cp commons-httpclient-3.1.jar;commons-logging-1.1.1.jar;commons-codec-1.3.jar;lib-read.jar Main dyachenko_marina mednyi_korol 30 >dyach.html

Только похоже что в защите что-то поменяли:
25.03.2008 20:56:01 org.apache.commons.httpclient.HttpMethodBase processCookieHeaders
WARNING: Invalid cookie header: "=deleted; expires=Mon, 26-Mar-2007 18:00:12 GMT; path=/; domain=.aldebaran.ru". Cookie name may not be blank
25.03.2008 20:56:01 org.apache.commons.httpclient.HttpMethodBase getResponseBody
WARNING: Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
Exception in thread "main" java.lang.IllegalStateException: No match found
        at java.util.regex.Matcher.group(Unknown Source)
        at Main.getRef(Main.java:32)
        at Main.main(Main.java:14)

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2008-03-25 21:31 (ссылка)
Это я идиот - просто не тот немножко текст запостил - см. исправленный вариант

(Ответить) (Уровень выше)