1. «Мы сделали больше, чем любая другая страна». Трамп назначил День Победы во Второй мировой войне в США
  2. Кочанова пояснила, что будет с пенсиями и зарплатами. Есть над чем задуматься, если учесть ожидаемый дефицит казны и прогнозы экономистов
  3. Эксперты проанализировали последние заявления МИД РФ и Шойгу, который назвал западных миротворцев «законными целями» — вот их выводы
  4. Стало известно, чем сейчас занимается экс-глава ПВТ Валерий Цепкало
  5. Снова дорожает автомобильное топливо. Но есть и условно позитивная новость, которая может понравиться водителям
  6. У беларусов появилось новое экзотическое направление, куда не нужна виза. Узнали, как там с ценами и пляжным отдыхом
  7. Правозащитники: В Беларуси — массовые задержания за участие в протестах и по «делу Гаюна»
  8. Кочанова высказалась о повышении пенсий. Тем временем Фонд соцзащиты населения хвастается, что купается в деньгах
  9. Силовики решили взяться за людей с «протестным бэкграундом», которые приезжают в Беларусь. Рассказываем, как и кого задерживают
  10. BYSOL: У силовиков новая тактика для людей с «протестным бэкграундом», которые возвращаются в Беларусь
  11. Пока другие отрасли в убытках, нашелся новый драйвер экономики: у всех его топ-предприятий — рекордная прибыль
  12. Банки вводят новшества для вкладов: одни из них могут понравиться клиентам, другие — не очень


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.