Срачи с ИИ: белковый взгляд |
[Sep. 2nd, 2025|08:05 am] |
 Может ли машина думатьПоставил давеча очередной вивисекторский опыт над Перплешкой.
Мне на отзыв прислали довольно длинную (40 страниц) математическую статью про то, как посчитать число точек пересечения двух алгебраических кривых на комплексной плоскости. Такую задачу можно ставить в разных постановках, в зависимости от того, что известно про кривые и какие именно точки пересечения надо считать.
Немного красивой математики и конец интригиЕсли не известно ничего, кроме степеней, и считать надо все (комплексные) корни, то со школьных времён известна теорема Безу: число точек при правильном подсчёте (с кратностью и считая точки, "убежавшие на бесконечность") ответ в точности равен произведению степеней многочленов, описывающих кривые.
Этот ответ может быть значительно улучшен в некоторых ситуациях. Например, если уравнения "лакунарные", т.е., содержат сравнительно немного ненулевых мономов (и без ограничения на степени, что существенно!), то в случае общего положения число конечных ненулевых корней определяется геометрией показателей степеней, т.е. точек (i,j) ∈ ℕ² на целочисленной решётке, таких, что моном xiyj входит в уравнение хотя бы одной из кривых с ненулевым коэффициентом. Это — великая и прекрасная теорема Бернштейна (Давида, а на Иосифа), Кушниренко и Хованского, обобщающая известное правило Декарта: если рассмотреть многочлен p(x) от одного переменного с известным числом ненулевых коэффициентов и посчитать число его ненулевых корней, то оно не зависит от степени (и от величины этих коэффициентов). Хованский превратил теорему Декарта в полноценную математическую теорию, которая называется по-русски "теория малочленов". Основной вывод теории малочленов — если дана система малочленных уравнений, то подавляющее большинство её корней сидит на "координатном кресте" xy = 0.
Можно повернуть задачу другим боком: считать, что коэффициенты уравнений ограничены по абсолютной величине (в некоем правильном смысле), но степени по-прежнему не ограничены. Такая задача перемещается из области алгебры/геометрии в область комплексного анализа: можно написать явные верхние оценки для числа точек пересечения в "круге" { | x | < R, | y | < R}, но они будут неограниченно расти с ростом R до бесконечности.
Авторы попытались скрестить ежа с ужом и предположить, что одна из двух пересекающихся кривых — малочленная, а вторая имеет ограниченные коэффициенты. Можно ли совместить две теории, алгебру и анализ? Очевидный ответ (если понимать колёсики и пружинки внутри каждой) — можно, но гибрид скорее всего будет уродливым, преимущества каждого отдельного подхода исчезают, а трудности никуда не деваются. Так и оказалось, — выписанные авторами ответы даются формулами, занимающими по полстраницы (всевозможные суммы, произведения, ... ). Если бы такие гибридные задачи возникали естественным образом в каких-нибудь приложениях, можно было бы в какой-нибудь системе символических вычислений (Матлаб, Вольфрам, ... ) запрограммировать эти формулы и пользователь мог бы вводить параметры своих кривых и получать конкретный ответ. Но ни авторам, ни мне такие приложения не известны. Для кожаных/белковых пользователей можно было бы как-то минимизировать число параметров, описывающих каждую кривую, и посмотреть на trade-off между ними, что критичнее влияет на рост числа точек пересечения, комбинаторные характеристики одной кривой или аналитические характеристики другой. Тоже ничего подобного не сделано.
Вот я и написал рецензию (практически пересказанную выше). Даже если в статье всё правильно, её никто никогда не прочтёт, а нетривиальных математических идей, можно ли эффективно поженить две разные теории, не просматривается сквозь мешанину формул. Отклонить.
А причём здесь Перплешка? Написанный выше текст моей рецензии страдает от отсутствия того, что на иврите называется "басар", — плоть, суть. Выдвигаются некие "обвинения", которые хорошо бы подкреплять примерами из манускрипта. Это мне было делать откровенно лень, кроме того, это оставляло бы авторам лазейку: переписать конкретное место и сказать, что-де замечания рецензента были с благодарностью учтены. Перечислять все такие места, - не, ищите дураков, я лучше в ЖЖ чего-нибудь умное напишу.
И тут-то я и решил привлечь ИИ. Скормил ему рецензируемый манускрипт, свою рецензию и свои соображения, как он мог бы её улучшить (подобрать немножко "басара" для подтверждения моих оценочных субъективных мнений™). ИИ с готовностью согласился, но результат был не просто бессмысленен, он был ужасен.
Все мои математические описания (в частности, описание трёх возможных постановок задачи) ИИ беспощадно выкинул, оставив только их "маркеры", отнюдь не общезначимые. Вся редактура свелась к тому, что мои слишком личные обороты ("я не нашёл", "мне неизвестно" и т.д.) он заменил на безличные "академичные". Ну, и рекомендации (читай: претензии к тексту) все были выхолощены до полной бла-бла-бла. Я вообразил себе члена редколлегии, читающего подобное словоблудие, — и в уме немедленно возник образ инструктора райкома КПСС, читающего рекомендации на кандидата на включение в делегацию на международную конференцию за границу.
Что из этого следует?LLM не может быть ничем, кроме Language model. Он чертовски начитан и умеет раскладывать прочтённое по полочкам, почти не понимая того, что там написано: алгоритмы хранения и поиска, видимо, бесконечно расширенная система того, что раньше называлось библиотечными рубрикаторами (по этим рубрикаторам расставлялись книги на полках библиотек), просто этих рубрик на несколько порядков больше того, что можно записать 6-7 алфавитно-цифровыми индексами. И, естественно, рубрикация делается автоматически и кросс-верифицируется ссылками. Я спросил Перплешку, может ли он найти мне видеоклип из советского фильма "Неуловимые мстители", где Яшка-цы́ган без помощи рук пьёт "горилку" (на самом деле воду) из крынки. Перплешка мне прислал ссылку, мол, эта сцена происходит на такой-то минуте, хочешь, пришлю ссылку на ю-тьюб. Это значит, что в безднах его памяти хранится транскрипт всех фильмов, когда-либо выложенных в открытый доступ. Неоценимое умение, если хочешь найти какие-то газетные или книжные публикации. Но ничего больше от ИИ требовать нельзя.
Более того, его можно переубедить, если действовать нахраписто. По просьбе коллеги проверить средствами ИИ некую математическую статью на предмет того, кто её написал, ИИ или белковый автор. Статья была по моей прямой специальности, поэтому, "полистав" её 5 минут, я понял, что это пересказ результатов, известных ещё Эйлеру, и никаких новых результатов там нет в принципе. Но ИИ немедленно заявил, что статью написал человек. На вопрос, на чём основано его безапелляционное суждение, ИИ ответил, что текст имеет все правильные признаки математической статьи (определения, леммы, теоремы, список библиографии, аффилиация автора и т.д.), и написан правильным академическим языком.
Я пошёл в атаку, выяснил, что ИИ знает по сути дела, формулируя ультраклассические теоремы, которые он легко распознавал, давая ссылки на хорошие учебники. Дальше я попросил его найти какие-нибудь утверждения в статье, которые выходили бы за пределы махровой классики. ИИ согласился, что таких утверждений нет. Я спросил его, много ли он видел математических статей, не содержащих новых результатов или хотя бы нового взгляда на старые. Тут ИИ оживился и сказал, мол, конечно, такое бывает, обзорные статьи — важный элемент научных исследований (привет прошке- profi с его тележкой, к которой он старательно прикручивает ИИ-движок, торопясь наваять побыстрее и побольше хуйни). Тут я спросил, часто ли ИИ видит обзорные научные статьи, в которых ограничиваются результатами многовековой давности. Тут он сдался, сказал, что я прав, и скорее всего, текст сгенерирован железным, а не белковым мозгом. Правда, коллега усомнился, — может быть, ИИ исповедует принцип "проще дать, чем объяснить, что не хочется". Мне возразить на такое нечего. |
|
|