Не верь, не бойся, не проси - [entries|archive|friends|userinfo]
phantom

[ website | My Website ]
[ userinfo | ljr userinfo ]
[ archive | journal archive ]

[Mar. 24th, 2008|07:54 am]
Previous Entry Add to Memories Tell A Friend Next Entry
LinkLeave a comment

Comments:
From:[info]phantom
Date:March 27th, 2008 - 07:23 pm
(Link)
да каледин, слава яйцам,
один такой пока, ну ещё
вторая утошга есть, да.
но давай лучше что-нибудь
более полезное захуярим,
и не к ЛЖР, а вообще или к
часто используемым сайтам.
[User Picture]
From:[info]ppkk
Date:March 27th, 2008 - 08:11 pm
(Link)
Я уже поразбирался. Фрустрации немного (вот for-in с массивами почему-то работает не так, как я ожидаю), но ещё не закончил (не слишком тривиальных ошибок не исправляю).

Обнаружил какое-то количество глюков (буква "щ", "Дате:", текст при ответе на комментарий Продвинутого Архаичного Линуксоида, например).
From:[info]phantom
Date:March 29th, 2008 - 07:18 pm
(Link)
буква "щ", и только она, требует
двух проходов (моего) унтранслиттера,
кроме неё встречаются максимум
2-буквенные комбинации (ср. "сч")
[User Picture]
From:[info]ppkk
Date:March 31st, 2008 - 01:43 pm
(Link)
С учётом того, что гражданин ещё и с ошибками пишет очень часто, автоматический "перевод" его на русский с распознаванием вкраплений английского, особым выделением цитат на русском и исправлением ошибок — задача на всю жизнь, на которой можно защитить несколько диссертаций (по психиатрии, психологии, филологии и математическому обеспечению ЭВМ, наверное).
From:[info]phantom
Date:March 31st, 2008 - 02:37 pm
(Link)
да я вообще хуею с этих
фашиствующих субъектов.

мало того, что гражданин
"уже весь сервер заебал"
своим транслитом, по его
же словам, а теперь вот
ketmar написал о скрипте,
и этот гражданин каледин
говорит "а не могли бы вы
долабать нам движочек?
а то мы 3 года этого
сделать не можем сами".

немного хуею с такой наглости.
вообще бы всем мотематигам
запретил бы в интернет ходить,
разводят разную херню фашистскую
вместо того, чтоб делом заниматься.
[User Picture]
From:[info]ppkk
Date:March 28th, 2008 - 12:50 pm
(Link)
Ты пробовал-то мой текст? Вряд ли, но к вопросу о славе поздних доразработчиков Фара: ты написал довольно топорный не очень нужный пользовательский Яваскрипт, заточенный под один броузер. Я написал немного другого толка ненужную хрень (по идее демонстрирующую мою способность за ограниченное время прикрутить что-то к чужому исходнику на 40 Кб и пользоваться при этом Яваскриптом и ОМД [DOM:)], включая события), но максимум, на что я могу претендовать: написать, что я не совсем лох, оправдываться за ссылку на объективные обстоятельства (про фрустрацию).

Чего в похожей ситуации можно ожидать от нынешних разработчиков Фара?

Насчёт полезного: лично я скорее займусь обдиранием пары новостных сайтов, чтобы было легче сохранять новости в личный архив без ссылок на все сегодняшние события на полях и т.п., но с иллюстрациями и ссылками по теме. В жижах кроме разворачивателя комментариев я затрудняюсь подумать об усовершенствованиях нужных (на обоих просматриваемых мной журналах усовершенствования не очень требуются).
From:[info]phantom
Date:March 29th, 2008 - 08:03 pm
(Link)
тем не менее, я считаю, один в поле воин.
т.е. один может разработать полезное ПО.


>обдиранием пары новостных сайтов

это называется "скрейпинг", и я сомневаюсь,
что для этого инструментарий JS лучший -
для разбора иерархий, и в т.ч. DOM-а,
удобно иметь поддержку pattern matching.
кроме того, вряд ли стоит это делать
"из броузера" - м. б., там crazy security
[User Picture]
From:[info]ppkk
Date:March 31st, 2008 - 01:46 pm
(Link)
тем не менее, я считаю, один в поле воин.
т.е. один может разработать полезное ПО.


Не спорю: вот Рошаль сделал Фар. А с поддержкой, обновлениями, всё плохо: ибо некоммерческое ПО. (Линуксы с кучей народа на зарплате в корпорациях и т.п. — пример самый известный, но нетипичный. Считать его некоммерческим — бабушка надвое сказала. Как и ОпенОфис, естественно.)

это называется "скрейпинг", … кроме того, вряд ли стоит это делать
"из броузера" - м. б., там crazy security


Ничего не понял. Разъясни, пожалуйста.
From:[info]phantom
Date:March 31st, 2008 - 05:45 pm
(Link)
>А с поддержкой, обновлениями, всё плохо:

все ж хотят программировать типа.
а поддержка, документация это
"не царское дело" как считается.
и пишут по 100 раз одно и то же,
не зная или не понимая аналогов.


>это называется "скрейпинг", … кроме того, вряд ли стоит это делать
>"из броузера" - м. б., там crazy security
>
>Ничего не понял. Разъясни, пожалуйста.


см.
Scraping

я подозреваю, чтобы не оставлять особых дыр,
часть "опасных" действий должна быть запрещена,
например, в Опере нельзя делать cross-site get,
как пишет ketmar, а может быть, и такие простые
вещи, как запись/чтение файлов нельзя делать.

но библиотеки есть почти под каждый язык -
скачать страницу можно при помощи пары строк,
разобрать её на части - уже сложнее, я говорю,
что стоит выбрать язык, поддерживающий фичу
pattern matching (сопоставление с образцом).
для разбора неоднородных иерархий очень удобно.

pattern matching - это switch-и на стероидах,
если его в языке нет, вместо него будут кучи
вложенных if-ов (хотя если код достаточно легкий,
можно, конечно, обойтись и без таких изысков)
[User Picture]
From:[info]ppkk
Date:March 31st, 2008 - 11:01 pm
(Link)
Ну, сохранять-то я хотел бы с помощью средств броузера, а не программой. Ты немного преувеличил мои намерения, которые и так могут не реализоваться.

Я имел в виду: для начала на паре конкретных популярных сайтов обдирать мусор для удобства сохранения избранных новостей в архив.

Можешь подробнее про p m?

Вообще, если на паскале написаны компиляторы Паскаля, то вряд ли всё так плохо с Паскалем. Или с Сипипи. Вопрос, конечно, в целесообразности изобретения велосипеда, так что можно подробнее?
From:[info]phantom
Date:April 1st, 2008 - 03:47 pm
(Link)
вот здесь, например.
[User Picture]
From:[info]ppkk
Date:April 1st, 2008 - 04:50 pm
(Link)
Что-то не проникся.

Про компиляторы, собирающие себя сами: просто так или иначе в таких языках синтаксический разбор вполне обычно возможен. Ну, вместо match используется какая-нибудь хрень. Выгоды неочевидны: какая-нибудь более объектно-ориентированная обработка выглядит вполне приемлемой для вложенных конструкций, которые в три строчки не уместишь с таким match. Может я и не понял чего-то.
From:[info]phantom
Date:April 1st, 2008 - 05:52 pm
(Link)
да, чтобы ощутить, нужно полгодика
попрограммировать в этом стиле...
можешь посмотреть компилятор
немерле, если осилишь (непросто)
[User Picture]
From:[info]ppkk
Date:April 1st, 2008 - 06:50 pm
(Link)
Скорее просто не посмотрю, если буду смотреть, то нескоро.
From:[info]phantom
Date:April 1st, 2008 - 07:15 pm
(Link)
да ты просто ткни и 10 мин полистай,
обращая внимание на кл. слово match
[User Picture]
From:[info]ppkk
Date:April 1st, 2008 - 08:02 pm
(Link)
Читаемость иногда лучше, полагаю.

Но вообще не врубился в исключительность и удобство.

Для Lex/Yacc исходники на себе тоже маленькие, на Паскале их исходники тоже маленькие.
From:[info]phantom
Date:April 1st, 2008 - 05:55 pm
(Link)
исходники немерле занимают 2 мб,
компилятор сложнее, чем gcc (40 мб).
во многом такая компрессия была
достигнута благодаря матчингу.
From:[info]phantom
Date:April 1st, 2008 - 03:54 pm
(Link)
на паскале написаны компиляторы Паскаля

так многие компиляторы написаны,
это называется bootstrapping