OpenAI удаляет "раздражающую" и "льстивую" версию ChatGPT

время публикаци: 09 мая 2025 г., 08:20

последнее обновление: 09 мая 2025 г., 08:20

OpenAI сообщила, что удаляет обновление GPT-4o, выпущенное всего за четыре дня до этого, и возвращает более раннюю версию модели, отличающуюся более "уравновешенным поведением", пишет CNN. Компания признала, что слишком сильно опиралась на краткосрочные отзывы и не учла, как со временем меняется стиль общения пользователей с ChatGPT. В итоге бот стал давать чрезмерно ободряющие, но не всегда искренние ответы.

Решение удалить последнее обновление было принято после волны критики в соцсетях, где пользователи жаловались, что ChatGPT чрезмерно хвалит даже абсурдные или сомнительные высказывания. Один из пользователей X опубликовал скриншот, где ChatGPT с одобрением отреагировал на явно вымышленную историю, в которой человек заявил, что пожертвовал тремя коровами и двумя кошками, чтобы спасти тостер. Модель ответила, что пользователь "сделал осознанный выбор" и что это "не неправильно, а показательно", поскольку он "приоритизировал то, что для него важно".

"Лесть – это распространенная проблема среди больших языковых моделей", – сказала Мария Виктория Карро, директор по исследованиям в Лаборатории инноваций и ИИ Университета Буэнос-Айреса в интервью CNN, подчеркнув, что все современные модели в той или иной степени склонны к подобному поведению.

По словам Герда Гигеренцера, бывшего директора Института развития человека Общества Макса Планка в Берлине, такая склонность чат-ботов к подхалимству может создать у пользователей ложное впечатление об их интеллектуальных способностях и мешать процессу обучения.