Вот и написал очередной скрипт-классификатор внутреннего употребления для animearcheve.ru. Задачка оказалась не очень простой, если решать элегантно. Там и DBI, и File::find, многочисленное пользование stat'ом и классификация файлов по inode для преодоления hardlink-hell. Плюс активное использование хэшей, напрмер для построения симметрической разности двух списков. На вид программа линейная, а все потому, что ее квадратичные проблемы, конечно же, запихнуты в хэши (которые, я надеюсь, в Perl'е все же чаще всего не линейные, а меньше). Работает достаточно быстро.
А вот текст выкладывать не буду - те, кому интересны конкретные вопросы, - спросят и, возможно, получат рецепт. А для остальных, да и в целом тоже, Perl нечитаем, как известно. (Да, да, тем более написано немного грязно: например, вот: ... = $_;.)
BTW: для интересующихся - "скрипты без музы". Sic!
Links
October 2022
|
Argh...!
А ты работаешь волшебником?
А процесс person-mining'а идет дальше. Результаты, как всегда, не ясны, но наличие движения вполне отмечено. ЖЖ оказывается в таких ситуациях вполне подходящим инструментом. Можно легко построить некое приближение к психотипу и, исходя из этого, оценить степень интереса и продуктивности (наблюдения за)/(общения с). Иногда бывает, что реальные параметры не будут выходить из малой окрестности нуля - завышенные ожидания. Но даже один успех из десяти считается очень хорошим результатом. (Да, правило 20-80, или, что куда более сильно, правило трех сигм). |