Генеральный директор Google DeepMind Демис Хассабис рассказал изданию Axios, что Google Gemini 2.0 — масштабное обновление основных функций искусственного интеллекта Google, представленное компанией сегодня, — призвано помочь генеративному ИИ перейти от ответов на вопросы пользователей к выполнению самостоятельных действий.
Почему это важно: Google, как и другие в отрасли, активно рекламирует потенциал агентов ИИ. Но технология нуждается в повышении производительности и точности, если она хочет действовать надежно с меньшим человеческим контролем.
«На самом деле вам нужна система, которая не просто даст вам информацию, но и сможет выполнить за вас задания», — сказал Хассабис на этой неделе в видеоинтервью из Швеции, где вчера он получил Нобелевскую премию по химии этого года.
Сегодня утром Google представила Gemini 2.0 Flash, которая, по словам компании, в два раза быстрее своей предшественницы и мощнее более крупной «профессиональной» версии Gemini 1.5.
Компания также анонсировала ряд прототипов и продуктов, созданных на основе новой технологии, а дополнительные версии Gemini 2.0 должны дебютировать в январе.
Хассабис сказал, что создание систем искусственного интеллекта, способных действовать самостоятельно, было целью DeepMind с первых дней ее существования — обучение компьютеров таким играм, как шахматы и го.
«Мы всегда работали над агентными системами», — сказал Хассабис. «С самого начала они могли планировать, а затем выполнять действия и достигать целей».
Хассабис сказал, что системы ИИ, которые могут действовать как полуавтономные агенты, также представляют собой важный промежуточный шаг на пути к общему искусственному интеллекту (AGI) — ИИ, который может сравниться с человеческими возможностями или превзойти их.
«Если мы задумаемся о пути к ИИОН, то, очевидно, нам нужна система, которая может рассуждать, решать проблемы и выполнять действия в мире», — сказал он.
Google теперь внедряет Gemini 2.0 различными способами как в исследовательские проекты, так и в поставляемую продукцию.
Новая модель начинает использоваться в обзорах ИИ, отображаемых поверх результатов поиска Google.
Google также использует Gemini 2.0 в новой версии своего экспериментального интерактивного помощника на основе искусственного интеллекта Project Astra.
Компания также представила агентов для игр и программирования, а также Project Mariner — экспериментальный плагин для Chrome, который может выполнять действия на различных веб-сайтах.
Хассабис признал, что Google и другие компании не имеют возможности улучшать большие языковые модели только за счет увеличения их размера.
«Я думаю, что в отрасли наблюдаются признаки снижения отдачи», — сказал Хассабис, отметив, что, по крайней мере, когда речь идет о тексте, у компаний заканчиваются новые источники данных для обучения.
Да, но: хотя новое поколение моделей, возможно, и не обеспечивает столь ошеломляющих скачков, как их предшественники, улучшения все равно существенны, сказал Хассабис, но он считает, что одни только большие языковые модели не приведут отрасль к ИИОН.
«Я всегда ожидал и утверждал в течение многих лет, что нам все еще нужны, вероятно, еще два или три крупных прорыва такого уровня, которые мы совершили в прошлом с глубоким обучением с подкреплением и, в частности, с трансформаторами... чтобы прийти к AGI», — сказал он.
(в пересказе)
Мнение авторов может не совпадать с мнением редакции Некоммерческое сообщество журналистов Non profit