Gemini 2.0, следующая глава в истории искусственного интеллекта Google

Генеральный директор Google DeepMind Демис Хассабис рассказал изданию Axios, что Google Gemini 2.0 — масштабное обновление основных функций искусственного интеллекта Google, представленное компанией сегодня, — призвано помочь генеративному ИИ перейти от ответов на вопросы пользователей к выполнению самостоятельных действий.

Почему это важно: Google, как и другие в отрасли, активно рекламирует потенциал агентов ИИ. Но технология нуждается в повышении производительности и точности, если она хочет действовать надежно с меньшим человеческим контролем.

«На самом деле вам нужна система, которая не просто даст вам информацию, но и сможет выполнить за вас задания», — сказал Хассабис на этой неделе в видеоинтервью из Швеции, где вчера он получил Нобелевскую премию по химии этого года.

Сегодня утром Google представила Gemini 2.0 Flash, которая, по словам компании, в два раза быстрее своей предшественницы и мощнее более крупной «профессиональной» версии Gemini 1.5.

Компания также анонсировала ряд прототипов и продуктов, созданных на основе новой технологии, а дополнительные версии Gemini 2.0 должны дебютировать в январе.

Хассабис сказал, что создание систем искусственного интеллекта, способных действовать самостоятельно, было целью DeepMind с первых дней ее существования — обучение компьютеров таким играм, как шахматы и го.

«Мы всегда работали над агентными системами», — сказал Хассабис. «С самого начала они могли планировать, а затем выполнять действия и достигать целей».

Хассабис сказал, что системы ИИ, которые могут действовать как полуавтономные агенты, также представляют собой важный промежуточный шаг на пути к общему искусственному интеллекту (AGI) — ИИ, который может сравниться с человеческими возможностями или превзойти их.

«Если мы задумаемся о пути к ИИОН, то, очевидно, нам нужна система, которая может рассуждать, решать проблемы и выполнять действия в мире», — сказал он.

Google теперь внедряет Gemini 2.0 различными способами как в исследовательские проекты, так и в поставляемую продукцию.

Новая модель начинает использоваться в обзорах ИИ, отображаемых поверх результатов поиска Google.

Google также использует Gemini 2.0 в новой версии своего экспериментального интерактивного помощника на основе искусственного интеллекта Project Astra.

Компания также представила агентов для игр и программирования, а также Project Mariner — экспериментальный плагин для Chrome, который может выполнять действия на различных веб-сайтах.

Хассабис признал, что Google и другие компании не имеют возможности улучшать большие языковые модели только за счет увеличения их размера.

«Я думаю, что в отрасли наблюдаются признаки снижения отдачи», — сказал Хассабис, отметив, что, по крайней мере, когда речь идет о тексте, у компаний заканчиваются новые источники данных для обучения.

Да, но: хотя новое поколение моделей, возможно, и не обеспечивает столь ошеломляющих скачков, как их предшественники, улучшения все равно существенны, сказал Хассабис, но он считает, что одни только большие языковые модели не приведут отрасль к ИИОН.

«Я всегда ожидал и утверждал в течение многих лет, что нам все еще нужны, вероятно, еще два или три крупных прорыва такого уровня, которые мы совершили в прошлом с глубоким обучением с подкреплением и, в частности, с трансформаторами... чтобы прийти к AGI», — сказал он.

(в пересказе)

Мнение авторов может не совпадать с мнением редакции

Некоммерческое сообщество журналистов Non profit