Записки на обоях

> Recent Entries
> Archive
> Friends
> User Info
> Мой Mastodon
> previous 20 entries

September 16th, 2024


12:46 am
Надо наверное и тут написать, что я ушёл из Твиттера и пришёл в Mastodon, да здравствует децентрализация и федерация:
https://kolektiva.social/@northernkender

(10 comments | Leave a comment)

September 6th, 2017


02:37 pm - Добрый агент Купер и наша нескладная жизнь
После окончания 3 сезона Twin Peaks (и, таким образом, 25-летней эпохи) мне показалось, что это всё было вот о чём.

Наша жизнь - это, как известно, колесо страданий и смертных ужасов. И в этом круговороте каждому/каждой из нас очень хочется, чтобы однажды к нам в дверь позвонил добрый агент Купер и сказал, что забирает нас домой. Что на самом деле “вы девушка по имени Лора Палмер”, а всё вокруг - сон, из которого можно проснуться. И тогда получится вернуться обратно в подлинное детство и подлинную семью, и там будет происходить что-то очень важное и настоящее.

Но не получается. Даже когда агент Купер за ручку приводит нас “обратно”, оказывается, что там всё давно не то и не так, как мы себе представляли. Прошлого уже не существует, а вместо него какой-то другой мир. А если в этом другом мире мы и слышим призрачные голоса родителей, зовущих нас, то это только пробуждает страшные воспоминания. И тогда мы кричим от ужаса.
Current Music: Porcupine Tree - Russia On Ice

(4 comments | Leave a comment)

August 9th, 2017


06:17 pm - Хакатон и плагиат
Ну, все конечно в курсе о проблемах с плагиатом в российской науке и образовании. Чуть менее все в курсе про то, что plagiarizm detection - это активно развивающая академическая дисциплина, подвид natural language processing. В мире по этому делу (определение плагиата) проходят соревнования, публикуются статьи и всё такое.
Так вот, в июле мы попытались сделать хакатон по определению плагиата в рамках конференции AIST-2017. Конференция очень хорошая, но в этом году она проходила в Московском Политехническом Университете. Университет этот выступил резко против проведения хакатона со словом “плагиат” в названии. Причины этого, как быстро стало понятно, очень прозрачны и давно изложены на сайте “Диссернета”. В общем, архетипическая история о том, что в доме повешенного не говорят о верёвке.

Так что хакатон наш перенёсся на другую конференцию, а именно, на AINL-2017, которая состоится в Питере 20-23 сентября. Так что если вы хотите, например, в течение суток лихорадочно закодить систему, которая легко определит, что откуда списано (включая парафразированные заимствования) - добро пожаловать на регистрацию!
Current Music: La Phaze - Le Chant Des Bombes

(1 comment | Leave a comment)

June 15th, 2017


12:12 pm - Дайте майору льда
Прекрасное
Via https://lj.rossia.org/users/los/137689.html

Вышел майор прогуляться - а под ногами вода,
Рвётся под китель тёплый июньский воздух,
Запах тюльпанов, сирени и незабудок.

Дайте ж майору скорее немного льда,
Он не на то получал свои званья и звёзды,
Чтобы ходить по воде, разгоняя уток.

(Leave a comment)

March 27th, 2017


11:58 am - Любая власть рождает коррупционеров

Current Music: Адаптация - Цинга

(Leave a comment)

January 31st, 2017


04:06 pm - Загнившие сообщества и академическая этика
В Диссеропедии российских научных журналов углядел “Вестник Челябинского государственного университета”. Публикации за авторством плагиаторов, отсутствие рецензирования, множественные публикации одного и того же - стандартный набор университетского “Вестника” стандартного российского вуза.

Вспомнил, что и я когда-то по молодости и глупости там опубликовал какую-то ерунду. Не плагиат, конечно, просто ерунда, с научной значимостью, колеблющейся в районе нуля. Рецензирования действительно никакого не было от слова совсем, хотя я ведь даже не имел отношения к ЧелГУ. Всем было плевать.

Мне на тот момент было уже не то чтобы совсем комфортно (я уже начал о чём-то догадываться), но всё-таки я ещё считал относительно нормальным опубликоваться в таком месте. Типа не фонтан, но сойдёт. Меня в некоторой степени извиняет, то что тогда, в 2011, я был сильно занят другими делами - например, меня как раз увольняли из Тюменского университета. Но тем не менее.

Удивительно всё же, насколько радикально отличаются научно-университетские сообщества в зависимости от того, сдохла в них академическая этика и традиции совсем, или ещё нет. И насколько продолжительное время может занять операция по выкорчевыванию самого себя из болота. Труднее всего, конечно, осознать саму необходимость выкорчевывания. Надо как-нибудь написать историю научной эволюции провинциального лингвиста, с acknowledgments всем задействованным лицам.
Current Music: Jimi Hendrix - Who Knows

(5 comments | Leave a comment)

December 24th, 2016


06:28 pm
Рождественская картинка, чтобы не потерять:

Current Music: Mervent - Tarbolton Reel

(7 comments | Leave a comment)

December 7th, 2016


06:56 pm - Всё уже сказали 60 лет назад.
Сходили всей лабораторией в кино на “Прибытие”. Типа научная фантастика про лингвистов же.
Ну не знаю, по-моему, лучше “Сердце змеи” Ефремова почитать. Он ещё в 1958 году те же самые проблемы первого контакта описал гораздо лучше. Там и науки, и фантастики побольше, чем в “Прибытии”.

И не то чтобы фильм плохой. Но не шедевр. И кстати, лингвистики там вообще никакой практически нет (разве что гипотезу Сепира-Уорфа гордо упомянули). Главный герой с таким же успехом могла бы быть культурным антропологом или ещё кем. На сюжет это не влияет.
Current Music: Башня Rowan - Полудница

(2 comments | Leave a comment)

December 1st, 2016


08:42 pm - Teaching achievements
Закончил читать свой первый полноценный курс по дистрибутивной семантике. Это был адский месяц, потому что всё нужно было делать почти с нуля, но я доволен.
До этого были только какие-то отдельные лекции, доклады и тьюториалы, несистемно. Теперь есть прямо целый курс, шесть лекций, семинары, mandatory reading, obligatory assignment, экзамен, вот это всё. Конечно, можно сделать и получше (и побольше), но зато вроде бы получилось донести практически bleeding edge: предсказательные модели на нейронных сетях (word2vec и компания) и все модные темы, связанные с ними. Можно сказать, прямо с конференций в classroom. Кажется, так и надо.

Читалось как половина сборного курса Language technological applications (в первой половине давали машинный перевод). Тут слайды лекций, списки литературы, задания и прочий syllabus (во второй половине страницы).

Курс в основном для магистрантов факультета информатики, обучающихся на программе “Язык и коммуникация” (компьютерная лингвистика, короче). Бэкграунд у них очень разный (как всегда на NLP-программах), но вроде интерес проявляют и более-менее справляются. Посмотрим как напишут экзамен.

P.S. Это ещё был и первый опыт систематического преподавания в европейском университете, что тоже довольно интересно.
P.P.S. Не упускаю случая ещё раз порекламировать наш семантический калькулятор RusVectōrēs с дистрибутивно-семантическими моделями для русского. Скоро планируем выкатить тонну новых фич.
Current Music: Nick Cave & The Bad Seeds - Red Right Hand

(21 comments | Leave a comment)

September 8th, 2016


02:28 am
Российское общество очень религиозно. Нет-нет, я не в смысле веры в Христа, Аллаха и прочих богов. Я в смысле веры в нечто светлое, чистое и далёкое, за что можно терпеть лишения. Это может быть и какой-то классический бог, это может быть вера в светлое будущее коммунизма или - вот это сейчас очень актуально - патриотизм. Я полгода назад написал пост, где утверждал, что патриотизм есть не что иное, как религия. Религия - это средство манипулирования массами, и в то же время важнейшее психотерапевтическое средство, которое люди сами по доброй воле потребляют в больших количествах. Страдать намного легче и спокойней, если знать, за что или кого. За боженьку или за отчизну - не важно, важно лишь только быть в смирении. И еще важно, чтобы это было нечто такое, что нельзя увидеть или пощупать руками, иначе миф рассыпется. Когда вокруг все в это верят, подвергать это сомнению страшно, тем более, если знаешь, что за сомнение последует вполне осязаемое наказание. Не могу сказать, что на западе патриотизмом никто не спекулирует, конечно спекулируют, но масштабы несопоставимы. При западной мобильности людей вопрос о патриотизме как-то само собой сходит на нет. Медленно, конечно, но сходит. А в России быть непатриотом стыдно, даже самые записные либералы бьют себя кулаками в грудь - мы патриоты! Вот Путин только притворяется патриотом, а мы настоящие. А сказать - нет, я по убеждениям космополит - страшновато, это за рамками общепринятой нормы, это в российскую “генетику” не укладывается.

Всё так.

(2 comments | Leave a comment)

August 25th, 2016


12:42 am - Колючая проволока над фьордом: поход к маяку Bøkfjorden
Бёк-фьорд

Я что-то уже давно пишу в основном в Твиттер, но, кажется, нужно и в ЖЖ/LJR тоже возвращаться, потому что всё же часто хочется написать развёрнуто.

Так вот, в начале августа мы с [info]torakan4eg@lj несколько дней походили по горам Северной Норвегии, рядом с Киркенесом. С тех пор уже было много всего - и топовейшая конференция ACL в Берлине (best paper опровергает произвольность языкового знака), и празднование там же дня рождения [info]leann-fraoigh@lj, а потом был Больцано в Северной Италии, где Альпы смотрят на город, etc. Но всё-таки нужно написать про Бёк-Фьорд и наши странствия там.

Так вот, Бёк-Фьорд (Bøkfjorden) - это такой, собственно, фьорд на самом севере Норвегии, в области под названием Сёр-Варангер (регион Финнмарк). Там неподалеку Кольский полуостров и граница с Россией, а так вообще Заполярье. Главный город - Киркенес, о трёх с половиной тысячах жителей, гордый обладатель аэропорта, сильно русифицированный (даже названия улиц на русском дублируются).

Читать дальше )

В общем, ходить по Норвегии можно и нужно. Тем более, что законы способствуют - ставить палатку можно практически где угодно, никто тебя не погонит и не оштрафует.
Киркенес
Current Music: Garmarna - Varulven

(11 comments | Leave a comment)

May 15th, 2016


01:14 am - "Антитеррористические" законы и профнепригодные дебилы
Вот, например, возьмём «антитеррористический» законопроект, который тут Дума в первом чтении одобрила, с 8 голосами против.
Там много интересного для соответствующих специалистов (я имею в виду, по психическим расстройствам). Например, авторы хотят не выпускать за границу людей с непогашенной и неснятой судимостью по экстремистским и террористическим статьям. Интересно для специалистов тут то, что эти самые авторы, очевидно, не читали уже имеющиеся законы. А в уже имеющихся законах сказано, что до отбытия или исполнения наказания выезд за границу осужденным запрещен. Можно спорить о том, что считать “исполнением наказания” - выход из тюряги или всё-таки погашение судимости. Но беглый поиск по Сети показывает: практически единодушное мнение юристов таково, что пока у тебя есть судимость (неснятая и непогашенная) по любой статье, тебя из Россиюшки не выпустят. И так дело обстоит уже многие годы. То есть, эта «новелла» блаженных Яровой и Озерова бессмысленна чуть более, чем полностью.

Но я даже не об этом. Там законопроект еще требует от провайдеров три года хранить копию всего трафика. Чтобы, значит, доказательную базу создавать в делах против террористов и экстремистов. Ну и, конечно, это дело обильно критикуют за самые разные вещи: за то что Большой Брат и тотальная слежка, за то что адски дорого и ляжет на плечи простых юзеров, за то что все данные немедленно утекут на Горбушку и так далее.
Это всё, разумеется, правда. Но почему-то почти никто не говорит о том, что это самое хранение (хоть три года, хоть три месяца) тоже бессмысленно почти целиком. И с каждым месяцем будет становиться все бессмысленнее.

Почему? Потому что шифрование.
На картинке диаграмма трафика в Северной Америке (отсюда). В апреле 2015 ещё 65% трафика были не зашифрованы. К концу года Netflix полностью перешел на SSL, и теперь, вероятнее всего, всё наоборот: нешифрованного трафика уже меньше по объему. Что и естественно - шифрование не внедряет только ленивый, особенно учитывая, что при помощи Let’s Encrypt это можно сделать натурально бесплатно. Вот чуваки ведут статистику: к 5 мая 2016 года лишь 57% из миллиона топовых сайтов до сих пор не поддерживают HTTPS, и эта цифра постоянно снижается. Причем, разумеется, первыми шифрование внедряют популярные сервисы, где пользователи так или иначе что-то передают друг другу - вот эти все гуглопочты, фейсбуки, телеграмы и вотсапы. Я уж молчу про шифрованный не-HTTP трафик, типа торрентов или ssh (я, например, по ssh практически ежедневно гоняю туда-сюда гигабайты, если не десятки гигабайт).

И эти дебилушки собираются перехватывать и хранить чью-то там переписку и использовать ее в уголовных делах? Так хранить-то придется не тексты в открытом виде, по которым еще худо-бедно можно было бы организовать поиск. Придется хранить шифрованный трафик - то есть, просто эксабайты высококачественной энтропии, абсолютно бесполезной, если у вас нет сертификатов и ключей соответствующих сайтов. А я сильно сомневаюсь, что Гугл и Фейсбук отдадут свои ключи ФСБ. И если чисто теоретически, на минутку конспирологии, можно себе представить, что АНБ в широком масштабе использует какие-то неизвестные дыры в стандартных криптографических протоколах (все-таки большая их часть разрабатывалась в юрисдикции этого самого АНБ), то ФСБ никто эти дыры явно не покажет, даже если они существуют.

И зачем тогда вся эта ерунда? Уже совсем скоро в сети даже котиков нешифрованных не останется. И вот тут я задумываюсь. Те, кто приказал Яровой и Озерову этот идиотизм в законопроект вставить - они правда клинически чистые олигофрены, в принципе не представляющие себе Интернет? Или они просто вообще не задумывались, когда писали, потому что дедлайн подходил, а отчитываться перед начальством надо? Или они собираются запретить шифрованный трафик (мне кажется, это технически невозможно)? Пока склоняюсь к версии профнепригодных дебилов всё-таки.
Current Music: Iggy Pop - Shake Appeal

(Leave a comment)

May 13th, 2016


12:31 am
Оригинал взят у [info]tupikin@lj в ПРЕДИСЛОВИЕ К РАЗГОВОРУ
[не знаю, как всё это в голову затекает, но, вот, так или иначе]

предисловие к разговору

Тратить энергию жизни надо пока жив
Или пока жива
О том, что будет потом
Существуют разные мнения
В любом случае, это всё неисповедимо
Никто ведь не возвращается оттуда
И ничего не рассказывает

Все тратят её как умеют
Кто-то курит, кто-то бухает
(Я — и то, и другое)
Некоторые — любят
(И я, разумеется, тоже)

Ещё существуют политика и культура
Наука
Различные профессиональные самореализации
Всё это катит
Но больше всего катит, безусловно
Анархия

Потому что она сразу всё
Обещание совместности
Обещание индивидуальности
Обещание любви
Дружбы
Обещание любой самореализации
Обещание
Утопия

Чистая утопия
За то и любима
Потому и реализуема
Каждую секунду
В любые века, тёмные или светлые
Или прозрачные
Бестелесные
Вот как сейчас

Вот в эту самую секунду
Реализуется твоё обещание
Помни
Не проскочи мимо

В.Т.
11 мая 2016, Москва

Current Music: Олег Медведев

(Leave a comment)

May 1st, 2016


06:02 pm - Темнее всего перед рассветом
В этом году древний праздник весны Пасха и День солидарности трудящихся 1 Мая пришлись на один день. Испокон веков земледельческие народы праздновали весной день воскрешения природы. В языческие времена весной праздновали возвращение Персефоны из подземного царства, воскрешение Осириса и других умирающих и воскресающих богов. Праздник Весны напоминал людям о том, что любые бедствия не вечны, что настанет день, когда расцветут растения, на полях будет посеяно зерно для будущего урожая. В иудаизме праздник весны стал днем Освобождения, днем исхода еврейского народа из рабства в Египте. Не случайно миф об Исходе был так популярен у американских негров во времена плантационного рабства.

Христиане верят, что основатель их религии Иисус воскрес после казни. Последователи Иисуса сохранили традицию праздновать Пасху, но посвятили этот праздник воскрешению создателя новой религии.  В наши дни большинство историков считают, что Иисус действительно существовал и, вероятно, после его смерти произошло некое событие, которое вызвало слухи о его воскрешении из мертвых. Почему же миф о воскрешении распятого римлянами бродячего проповедника оказался столь востребован в тогдашнем обществе и породил самую массовую из мировых религий?

Надо прямо сказать, что история борьбы угнетенных классов – это история поражений, иначе они не были бы угнетенными. Во времена Иисуса поражение потерпел и весь древнееврейский народ, считавший себя народом, избранным богом. Римляне утопили в крови антиимперское восстание и разрушили главную святыню иудеев Иерусалимский храм.  В этих условиях история о проповеднике Иисусе, который учил, что придет день, когда «последние станут первыми», был казнен римлянами и воскрес – превратилась в символ грядущего торжества мировой справедливости. На протяжении большей части истории христианства память об Иисусе лишь помогала угнетенным смириться со своим положением, сохранив некое чувство собственного достоинства. Однако, в истории были и времена, когда религиозный миф вдохновлял на борьбу с наследниками Пилата и фарисеев.

В день 1 мая мы вспоминаем чикагских рабочих-анархистов, казненных по ложному обвинению в организации теракта. Эти люди не воскресли на третий день, но их поражение не остановило борьбу трудящихся за бесклассовое общество. Каждую весну мы вспоминаем о том, что, подобно тому как природа возрождается после зимних холодов, человечество рано или поздно встретит весну освобождения от вражды и угнетения.
Current Music: Gatas Parlament

(Leave a comment)

April 30th, 2016


06:59 pm - Beltane ag teacht

Сегодня ночью праздник белого огня Белтайн.
Колесо жизни повернулось ещё на один оборот. Лето начинается.
Current Music: Соломенные Еноты - Остров-крепость

(Leave a comment)

April 12th, 2016


03:42 am - Выложен исходный код WebVectors - тулкита для работы с дистрибутивно-семантическими моделями через веб
Весь код нашего семантического калькулятора на нейронных сетях под неоднозначным названием “RusVectōrēs” теперь обретается на github под лицензией GPL.

Называется всё это проект WebVectors.

Можно клонировать, дико ставить себе на сервера и красиво показывать обученные вами непревзойденные word2vec-модели. Также можно писать нам об ошибках или даже предлагать свой код.
Инструкция по установке там сейчас довольно поверхностная, но будет развиваться. Есть также статья по мотивам.

И как-то очень кстати пришёлся пятилетний юбилей Школы Лингвистики ВШЭ. С чем и поздравляю.
Current Music: Соломенные Еноты - Baltassaar

(Leave a comment)

March 29th, 2016


09:22 pm - Imperfect security
Очень мудрые мысли у Брюса Шнайера, хорошо бы побольше людей это поняли:

Across the US, states are on the verge of reversing decades-old laws about homosexual relationships and marijuana use. If the old laws could have been perfectly enforced through surveillance, society would never have reached the point where the majority of citizens thought those things were okay. There has to be a period where they are still illegal yet increasingly tolerated, so that people can look around and say, “You know, that wasn’t so bad.” Yes, the process takes decades, but it’s a process that can’t happen without lawbreaking. Frank Zappa said something similar in 1971: “Without deviation from the norm, progress is not possible.”

The perfect enforcement that comes with ubiquitous government surveillance chills this process. We need imperfect security­ -- systems that free people to try new things, much the way off-the-record brainstorming sessions loosen inhibitions and foster creativity. If we don’t have that, we can’t slowly move from a thing’s being illegal and not okay, to illegal and not sure, to illegal and probably okay, and finally to legal.
Current Music: В.П.Р. - Последняя

(2 comments | Leave a comment)

March 27th, 2016


05:50 pm - Тюрьма
Опубликовано офигенное послесловие болотного узника Алексея Полиховича к новой книге Питера Гелдерлооса “Тюрьма”.

Там и о том, как в Болотном деле проявилась наказывающая и тоталитарная природа Государства, и о тюрьме в целом, и о том, почему анархистское мировоззрение радикально противостоит этому Голему. Почитайте, интересно.

Может быть, сейчас, в эпоху расколов, атомизации и апатии мои мысли про волнующий дух мая 2012-го кажутся несколько наивными. Потому что ничего не удалось и все устали. Причем те, что были на свободе, устали вдвойне. Ничего не получилось — у либералов, нас, нацистов, Удальцова, Лимонова, Навального, Немцова, протеста и немирных робких фантазий. Поэтому сегодня тюрьма даже более чем всегда есть неотъемлемая часть нашей жизни.

...

А смысл «болотного дела» в том, что арбитром прямого конфликта общества и государства становится само государство, сколько бы нам ни рассказывали про независимую судебную ветвь власти. Один винтик системы принимает решение в пользу другого. Сегодня корпорация должна защитить своих исполнителей, чтобы завтра они защитили корпорацию.
Current Music: Ольга Арефьева - Сион

(Leave a comment)

March 18th, 2016


09:01 pm - "Никто не является субъектом этого процесса"
А вот, например, отличное эссе в трёх частях от [info]makarmia@lj про Тюменский университет и программу 5-100, в которую тот недавно попал.
Краткое резюме: всё плохо, но теоретически что-то улучшить шансы есть.
  1. Спасение утопающих дело рук самих утопающих

  2. Надежда умирает последней

  3. Было бы здоровье, 5-100 приложится

Current Music: Myrninerest - FangBell, TwiLight

(Leave a comment)

March 17th, 2016


06:12 pm - Meaning is context
Раз уж сегодня день Святого Патрика, то нужно что-нибудь эдакое выкинуть, не только же Джемисон хлестать.

Так вот, не только Гугл нейронными сетями над гроссмейстерами го издевается, мы тоже умеем. В дополнение к семантическому калькулятору для русского, про который я уже писал, теперь появился аналогичный сервис для английского и норвежского. Называется SemanticVectors, без фантазии, зато по делу. Одна из моделей там, кстати, самим Гуглом обучена, на Google News.
http://ltr.uio.no/semvec/

Для ирландского бы, конечно, замутить, да обучающего корпуса под рукой нет.
Current Music: Соломенные Еноты - Конго

(Leave a comment)

> previous 20 entries
> Go to Top
LJ.Rossia.org