Скоро Siri поумнеет: Apple готовит языковую модель ИИ для поддержки голосового помощника

Новая операционная система iOS 18 должна выйти в июне, тогда же компания обещает представить и новую Siri 2.0. Возможно, уже тогда ReALM начнет реальную работу. Но, возможно, это случится и позднее.

Apple за последние несколько месяцев представила много новых моделей и инструментов для повышения эффективности работы искусственного интеллекта (ИИ) на небольших устройствах. ReALM (Reference Resolution As Language Modeling) – это решение, специально разработанное для улучшения уже существующих ИИ-моделей.

Brand Finance: Apple стал самым дорогим брендом в мире

Apple более десяти лет работает над исследованиями в области ИИ, но большая часть результатов скрыта внутри приложений или сервисов. Только с выпуском последней серии MacBook компания начала использовать буквы "AI" (Artificial intelligence) в своем маркетинге.

ReALM – это малая языковая модель (в отличие от больших языковых моделей, таких как GPT-4). Но, как пишут разработчики, мощностей ReALM вполне достаточно, потому что приложению не обязательно делать все. Его цель – помогать другим моделям ИИ и в первую очередь Siri.

ReALM – это визуальная модель. Она исходит из того, что экран смартфона – это своего рода "фраза". ReALM "читает" экран и маркирует каждый объект. Затем модель создает текстовое представление визуального макета экрана и передает его голосовому помощнику. А тот уже ориентируется, чем он может помочь пользователю, если пользователь, например, запутался в Google Map.

Если ReALM будет развернут, то Siri будет лучше понимать пользователя, когда он просит открыть определенное приложение (возможно, она научится понимать и такие фразы: "Открой мне примочку с пимпочкой") или перевести слово на картинке.

Подход Apple к ИИ довольно нетипичен сегодня: компания вкладывает значительные средства в сферу ИИ-помощников, а не в наращивание мощностей внешних моделей.

Newsru.co.il в приложениях

- Android

- iOS