Google: новые разработки в области ИИ, включая персонального ассистента

Вскоре Google выпустит множество новых инструментов и систем на базе искусственного интеллекта, включая AI-ассистента, который будет помогать пользователям, проактивно выполняя задачи от их имени. (ET Now)

«Агентный» ИИ, недавний популярный термин для технологических компаний, стал центральной темой ежегодной конференции разработчиков Google I/O. Будущий агент ИИ, Gemini Spark, был одним из многих объявлений компании на конференции во вторник.

«Мы уверенно находимся в нашей агентской эре Gemini», — заявил генеральный директор Google Сундар Пичаи во вторник перед переполненным амфитеатром рядом с штаб-квартирой компании в Маунтин-Вью, Калифорния. «Я экспериментировал с разными агентами, и можно увидеть потенциал, но ещё рано делать агентов простыми в использовании, суперзащищёнными и действительно полезными.»

Google и её материнская компания Alphabet Inc. вложили миллиарды в разработку ИИ. Главный финансовый руководитель компании в конце апреля сообщил в разговоре с инвесторами, что капитальные расходы в этом году могут вырасти до 190 миллиардов долларов. Но инвестиции, похоже, окупаются: её квартальные доходы демонстрируют сильный рост. С момента публикации отчёта акции выросли ещё на 11%.

Пичаи во время основного доклада отметил, что в прошлом году у приложения Gemini было 400 миллионов активных пользователей в месяц, но сейчас эта аудитория превысила 900 миллионов, что более чем удвоилось за год.

Последняя серия моделей Google, Gemini 3.5, выходит во вторник для миллиардов пользователей по всему миру, начиная с Gemini 3.5 Flash. Модель Flash ориентирована на скорость, и Google утверждает, что 3.5 Flash — её самая сильная агентная и кодировочная модель, но при этом примерно в четыре раза быстрее некоторых конкурентов.

Эта модель теперь является стандартной для приложения Gemini и в поиске Google — «AI mode». Компания также работает над версией Gemini Pro 3.5, которую, по их данным, использует внутри компании и планирует запустить в следующем месяце.

Gemini 3.5 была разработана с новым, более продвинутым обучением по безопасности и мерами по снижению последствий, что означает, что её модели реже генерируют вредный контент или ошибочно отказываются отвечать на безопасные запросы, сообщили в компании.

Google также анонсировала новую модель Gemini Omni, которая позволит пользователям создавать высококачественное видео, отправляя запрос с любым вводом — будь то текст, изображения, видео или аудио. Видео, которое создаёт Omni, можно легко смонтировать через разговор с моделью. Пользователи в конечном итоге смогут создавать изображения и аудио с помощью Omni, но пока не было уточнено, когда эти функции будут внедрены.

Компания заявила, что видео Omni будут выглядеть более реалистично, чем те, созданные другими моделями, благодаря пониманию таких сил, как гравитация, кинетическая энергия и динамика жидкости.

Gemini Omni Flash, первый из семейства Omni, запускается во вторник для подписчиков Google Al Plus, Pro и Ultra через приложение Gemini и Google Flow. Начиная с этой недели, она будет доступна бесплатно в YouTube Shorts и YouTube Create App.

Все видео, созданные с помощью Omni, будут использовать незаметный цифровой водяной знак Google — SynthID, но Google также добавляет проверку учетных данных контента в приложение Gemini. Этот инструмент определяет, был ли контент, такой как фото или видео, создан ИИ или зафиксирован камерой телефона и отредактирован с помощью инструментов ИИ. В ближайшие месяцы он будет доступен в поиске в Chrome. Google также объявила, что компании по производству ИИ Open AI, Kakao и Eleven Labs внедряют свою технологию SynthID для большего количества своего контента, созданного с помощью ИИ.

На базе Gemini 3.5 Gemini Spark сможет выполнять рутинные задачи, такие как сортировка заметок встреч, электронной почты и чатов, а затем создание документа с самыми важными моментами и делами. В отличие от других доступных агентов, Spark работает в облаке, поэтому продолжает работать в фоне даже когда пользователи закрывают ноутбуки или блокируют телефоны.

Проактивность агентов ИИ отличает их от чат-ботов, и это также вызывает опасения по поводу возможностей этой технологии. Gemini Spark разработан для получения разрешения перед выполнением «высокорисковых» задач, таких как отправка электронного письма или совершение покупки, сообщили в компании.

Избранные тестировщики получат доступ к агенту со вторника, а компания планирует внедрить бета-режим для американских подписчиков на уровне Google AI Ultra.

Позже этим летом Gemini Spark начнёт работать непосредственно внутри Chrome, сообщили в компании.

На прошлогодней конференции самым обсуждаемым событием стало введение и внедрение «режима ИИ» в поисковой системе Google. Эта функция даёт пользователям более разговорный ответ на их запрос перед предоставлением релевантных ссылок, опираясь на ранее внедрённые изменения в восприятии и взаимодействии пользователей с платформой.

Запросы в режиме ИИ более чем удваиваются каждый квартал с момента запуска в прошлом году, а по словам Лиз Рид, руководителя поискового отдела Google, этот инструмент недавно превысил 1 миллиард пользователей в месяц.

Новой стандартной моделью в поиске теперь будет Gemini 3.5 Flash, и компания вводит так называемую интеллектуальную поисковую строку. Это изменение, которое, по словам Рида, является самым большим обновлением поисковой строки за последние 25 лет, означает, что поле будет адаптироваться для более длинных запросов и поможет пользователям писать свои вопросы с помощью предложений на базе ИИ вместо традиционного автозаполнения.

Пользователи также могут искать с помощью различных модальностей, используя текст, изображения, видео, файлы и даже вкладки Chrome в качестве поисковых входов. Новая поисковая строка начнёт внедряться во вторник во всех странах и языках, где уже доступен режим искусственного интеллекта.

Компания также анонсировала новый инструмент — Universal Cart, который назвала «по-настоящему интеллектуальной тележкой для покупок». Он работает как у продавцов, так и в разных сервисах, поэтому пользователи могут добавлять материалы в корзину, просматривая поиск Google, общаясь с Gemini, смотря YouTube или читая письма в Gmail. Затем корзина запускается на моделях Gemini, чтобы сразу приступить к работе, как только товар помещается в корзину, в поиске предложения и снижения цен, предоставляя информацию об истории цен и предупреждая пользователей, когда что-то возвращается в наличие.

Инструмент Universal Cart будет доступен пользователям в поиске и приложении Gemini этим летом, а затем появятся YouTube и Gmail.

Журналист Associated Press Барбара Ортутай из Окленда, Калифорния, внесла свой вклад в подготовку этой истории.

(в пересказе)

Мнение авторов может не совпадать с мнением редакции. Cообщество журналистов. Non profit