Добавление комментария

Пишет nancygold (

nancygold)
@ 2025-11-20 12:26:00

Настроение:

amused

Performance on Bongard problems
Limitations: Research shows that even advanced models like Gemini 3 have significant difficulty with the classical set of synthetic Bongard problems.

Real-world vs. synthetic: Performance improves on Bongard problems using real-world images (e.g., Bongard-HOI), but models still struggle with tasks requiring them to improve predictions or effectively use dialogue context.

General limitations: The difficulty in solving classical synthetic Bongard problems suggests that the issue is not just domain-specific but reflects more general limitations in the models' ability to perform abstract visual reasoning

Then again, most humans also struggle with them.

(Читать комментарии)

Добавить комментарий:

Как:

анонимно

OpenID

Identity URL:
Войти?

пользователь LiveJournal.com

имя пользователя:	помнить
Вы должны предварительно войти в LiveJournal.com

E-mail для ответов:
Вы сможете оставлять комментарии, даже если не введете e-mail. Но вы не сможете получать уведомления об ответах на ваши комментарии! Внимание: на указанный адрес будет выслано подтверждение.

пользователь LJ.Rossia.org

Имя пользователя:
Пароль:
Войти?

Тема:

HTML нельзя использовать в теме сообщения

Сообщение:

Не выполнять автоформатирование:

Обратите внимание! Этот пользователь включил опцию сохранения IP-адресов пишущих комментарии к его дневнику.