Все статьи подряд / Математика / Хабр's Journal
 
[Most Recent Entries] [Calendar View]

Tuesday, February 21st, 2023

    Time Event
    6:43a
    [Перевод] Пишем GPT в 60 строк NumPy (окончание, 2/2)
    Перевод части первой

    Архитектура GPT


    Архитектура GPT соответствует архитектуре трансформера:


    Рисунок 1 из Attention is All You Need

    Но использует только стек декодера (правую часть схемы):


    Архитектура GPT

    Обратите внимание, что слой «перекрёстного внимания» посередине тоже убран, потому что мы избавились от кодировщика.
    Читать дальше →
    8:05a
    90 лет со дня рождения Игоря Васильевича Поттосина


    История компьютерных технологий помнит многих героев, но некоторые из них остаются в тени более громких и известных имен. Один из таких людей — Игорь Васильевич Поттосин, советский и российский ученый, внесший огромный вклад в развитие вычислительной математики и математического программирования. Сегодня ему исполнилось бы 90 лет. Читать дальше →
    11:00a
    АБ-тесты — это не только ценный мех… Но еще и процессы

    О математических нюансах АБ-тестирования есть много замечательной литературы, но почти нигде нет информации о том, каким образом в компаниях выстраивать сам процесс применения АБ-тестирования. За исключением отдельных отраслей (игры, интернет-коммерция), где уже сформировались зрелые практики.

    При этом для офлайн-бизнеса внедрение АБ-тестирования во многом организационная, а не математическая проблема. На практике правильно выстроить бизнес-процесс применения АБ и позиционирования его внутри компании едва ли не сложнее, чем создать правильную статистическую методологию.

    В этой статье я поделюсь своим опытом и советами о том, как это сделать. Статья собрана из серии постов в тг-канале Reliable ML.

    Читать далее

    << Previous Day 2023/02/21
    [Calendar]
    Next Day >>

Все статьи подряд / Математика / Хабр   About LJ.Rossia.org