Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет nancygold ([info]nancygold)
@ 2024-09-26 17:16:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: amused
Entry tags:computing

The Barnes-Hut Algorithm for LLMs
So currently the main issue with LLMs is that they are bound by the N^2 law, where N is the context size.

The problem appears to be very similar to simulating gravity.

Yet for gravity we can use the Barnes-Hut approximation, where far away entities are grouped together as a single entity.

Therefore the question: is it possible to adapt Barnes-Hut to the attention matrix of LLMs?

I think people are trying to do something similar (hierarchical approaches, summaries and tree of thought), but they still don't see the forest behind the trees. I.e. that the language modelling is basically a physics problem.

All these N^2 connectednes/pathfinding problems appear to be expressible as gravity over some distance function, which itself a sorting problem, which can be solved by a N*log(N) algorithm.



(Читать комментарии) - (Добавить комментарий)


(Анонимно)
2024-09-26 18:15 (ссылка)
Для выражения нереального действия могут использоваться и придаточные условные предложения. Сравните в русском с союзом если:

Если бы была хорошая погода, мы бы пошли гулять.

(Ответить)


(Читать комментарии) -