golos_dobra's Journal
 
[Most Recent Entries] [Calendar View]

Thursday, April 13th, 2023

    Time Event
    2:18p
    переход к скрытому пространству


    https://arxiv.org/pdf/2112.10752.pdf

    Переход к скрытому пространству

    Наш подход начинается с анализа уже обученных моделей диффузии в пространстве пикселей: на рис. 2 показано соотношение скорости и искажения обученной модели. Как и в случае с любой моделью, основанной на правдоподобии, обучение можно условно разделить на две стадии: первая — это стадия перцептивного сжатия, при которой удаляются часто встречающиеся детали, но при этом усваиваются небольшие семантические вариации. На втором этапе фактическая генеративная модель изучает семантический и концептуальный состав данных (семантическое сжатие). Таким образом, мы стремимся сначала найти эквивалентное с точки зрения восприятия, но более подходящее с вычислительной точки зрения пространство, в котором мы будем обучать модели распространения для синтеза изображений с высоким разрешением.

    Следуя общепринятой практике [11, 23, 64, 65, 93], мы разделяем обучение на две отдельные фазы: во-первых, мы обучаем автоэнкодер, который обеспечивает низкоразмерное (и, следовательно, эффективное) репрезентативное пространство, которое перцептивно эквивалентно к пространству данных. Важно отметить, что в отличие от предыдущей работы [23,64] нам не нужно полагаться на чрезмерное пространственное сжатие, так как мы обучаем DM в изученном скрытом пространстве, которое демонстрирует лучшие свойства масштабирования по отношению к пространственной размерности. . Уменьшенная сложность также обеспечивает эффективную генерацию изображений из скрытого пространства за один сетевой проход. Мы назвали получившуюся модель классом моделей скрытой диффузии (LDM).



    Тут для гуманитариев необходимо особо подчеркнуть существенную парадоксальность именно этого среди прочих прорывов в ИИ, сделанных буквально только в прошлом году, ближе к концу, хотя в работах автора десятилетней давности все это было конечно же предсказано и расписано более чем детально применительно к сути человеческой жизни вообще.

    Здесь ведь что особо критически важно понимать?
    Вот, например, автор давно жаловался на изобразительную дефектность, неспособность рисовать и пользоваться всяким фотошопом, не говоря уже о видео.

    А вот тексты пожалуйста, нет проблем, хоть даже на древнеарийском,
    можно даже клинописью.

    И вот пожалуйста, ТЕКСТА ДОСТАТОЧНО!
    Все остальные изобразительные вытребеньки, которые так завораживают бипедных со слабым подобием интеллекта - это выдается вообще без проблем чисто на основе если хотите "ТЕКСТОВОГО СЦЕНАРИЯ".

    Причем, изображение и видео вполне голивудского качества теперь может делать буквально кто угодно где угодно на технике довольно скромных запросов и вполне индивидуально-лично доступной.

    Ну это конец всякого рода художникам-иллюстраторам и прочим труженикам графических полей.

    А всего-то дел, уйти в правильное, но скрытое пространство, практически универсальный рецепт, так реально все и устроено во Вселенной.

    Что такое "скрытое пространство"?
    Например, вы все знаете "сжатые" картинки в разных
    форматах типа PNG и прочих. Вот эти картинки в сжатом
    формате и находятся уже в "скрытом" пространстве по
    отношению к исходной матрице пикселей с вашего фотоприемника.

    Проблема в чем? Проблема в том, что двигаться в скрытом
    пространстве приходится совсем иным образом, все физические
    понятия, которые интуитивно бипеды осваивают своими
    нейронами, они более вообще не применимы в новом пространстве,
    и более того - пространство может оказаться беспредельно
    ХРУПКИМ, отступил чуть от исходной точки в скрытом пространстве и провалился
    куда-то в безнадежную тьму при попытке вернуться в исходное.

    Но зато, если как следует освоить структуру скрытого пространства
    можно там так шагнуть, что на другом конце этой Вселенной окажешься сразу.

    Понятно, что Абсолют - это как раз предельное сжатие, закодирование
    всего потенциально бесконечномерного пространства в размеренность скрытого пространства один. Это будет Кодировка Высшей Власти надо всем.

    Но и без того, даже при кодировке без потерь, для полного сохранения
    всего и вся, переход в скрытое пространство благодаря иной топологии
    позволяет более "разумно" двигать объекты по жизни.
    Плюс диффузия в нем, позволяет это делать "гладко", так что
    возникающие в ИИ галлюцинации имеют высокую степень "достоверности"
    для ширмасс.

    Пример,
    "Реальная" женщина
    https://www.youtube.com/watch?v=C-p5iUI_qE0

    ИИ галлюцинация
    https://i.imgur.com/w12dETw.gifv

    Собственно, это и ответ на требования "мануала".
    Ребята, а какой мануал вам оставил ваш Исус?

    << Previous Day 2023/04/13
    [Calendar]
    Next Day >>

golos_dobra   About LJ.Rossia.org