информатика

Гато, DeepMind и гонка за общим искусственным интеллектом

Gato — это новая мультимодальная система искусственного интеллекта от DeepMind, способная выполнять сотни различных задач, всегда используя одну и ту же нейронную сеть.

Есть те, кто думает, что путь к искусственный интеллект человеческого уровня теперь отслеживается, теперь это будет просто вопрос увеличения вычислительных ресурсов, которые вместо этого сдерживаются, потому что многие требования по-прежнему будут отсутствовать. Однако исключительная способность управлять самыми разными задачами делает Gato системой искусственного интеллекта, отличной от других, которая, если с одной стороны, это еще не тот общий искусственный интеллект, которого все ожидают, с другой - это все еще инновационная система для пути которому удается обрабатывать очень разные данные из одной и той же архитектуры deep learning.

Близкий ИИ и общий ИИ 

До сих пор одним из основных различий в сложном мире искусственного интеллекта была разница между слабым ИИ, также называемым «узким» ИИ, и сильным ИИ, также называемым «общим» ИИ. Это был довольно простой способ сразу решить вопрос о мыслящих машинах. Узкий ИИ — это тип искусственного интеллекта, который выполняет только одну задачу, например, планирование маршрута, предоставление релевантных результатов поиска или ведение письменного разговора. С другой стороны, общий ИИ — это вид искусственного интеллекта, который мы видим в фильмах, который думает как человек, выполняет множество задач одновременно, создавая между ними полезную синергию. Аббревиатура этих человекоподобных машин — AGI. Искусственный общий интеллект. Для большинства исследователей это химера, которая теоретически возможна, но до которой мы не доберемся в ближайшее время.

Однако это различие сегодня скрипит и становится все менее и менее простым для объяснения. Фактически, в последние годы исследования подтолкнули к созданию все более универсальных моделей искусственного интеллекта, однако не привели к открытию ОИИ. Поэтому он создает своего рода золотая середина, где мы находим модели ИИ, способные выполнять многочисленные задачи разного характера, настолько, что их уже нельзя охарактеризовать как «узкий» ИИ, но которые в то же время не демонстрируют того каузального интеллекта или осознания, которые для многие эксперты должны быть присущи ОИИ.

Мультимодальный ИИ

Мы можем назвать этот тип искусственного интеллекта «универсальным» или, возможно, более правильно «мультимодальный», так как есть несколько способов взаимодействия с ним. Например, мультимодальная система ИИ могла бы найти прогноз погоды для нашего района (поиск и выбор лучшего результата), сообщить нам, что сегодня будет дождь (обработка естественного языка и синтез речи) и проверить, собираемся ли мы с зонтом или без него (машинное зрение). Кроме того, одной из основных характеристик мультимодальной системы является способность «поглощать» данные разных типов, например изображения и текст, зная, как извлечь полезную информацию из обоих. В результате нам будет казаться, что мы имеем дело с настоящим интеллектом, на самом деле это всего лишь несколько моделей ИИ, поставленных «на батарею» и находящихся в синергии друг с другом.

Зоопарк DeepMind

Что касается исследований в области мультимодального ИИ, то в последние недели лондонская компания DeepMind, которая, как мы помним, является частью галактики Google, выпустила две системы искусственного интеллекта, которые заставили о себе много говорить. Первый называется Фламинго, и представляет собой модель, способную решать «мультимодальные задачи», то есть задачи, в которых входящая информация может передаваться через различные модальности, такие как изображения, видео и текст, даже в сочетании друг с другом. Flamingo — это модель визуального языка (VLM), которая может обрабатывать классификационную информацию, управление заголовками, ответы на вопросы на основе изображений, при этом предоставляя лишь несколько входных/выходных образцов (так называемое «обучение за несколько выстрелов»).

Цель модели состоит в том, чтобы «понимать» ситуацию с изображением или видео, правильно описывая ее с помощью лингвистической системы и правильно отвечая на вопросы, касающиеся того, что она «видит».

Инновационный бюллетень
Не пропустите самые важные новости об инновациях. Зарегистрируйтесь, чтобы получать их по электронной почте.

Коннективизм и интеллект?

Гато не всегда лучшая модель ИИ для конкретной задачи. Управление роботом Sawyer (это робот, состоящий из руки со множеством «суставов») находится на хорошем уровне, но создание надписей весьма посредственно, а обработка некоторых игр Atari хуже, чем у других посвященных модели ИИ. DeepMind заявляет, что из 450 задач (по сравнению с 604, которым он обучался) Гато более точен, чем эксперты-люди, «более чем в половине случаев». Несколько запутанный способ сказать, что из общего числа 604 задач как минимум 154 дают очень плохие результаты, а в оставшихся 450 добрую половину времени Гато ведет себя лучше, чем человек-эксперт, но еще половину времени ведет себя худший.

Путь к генерализации

Результаты этих недель являются результатом обязательства, которое DeepMind выполняет уже много лет. Не будем забывать, что цель компании — «решить проблему интеллекта», разрабатывая все более общие системы, способные решать широкий спектр различных задач. Это то, что компания называет общим искусственным интеллектом, и именно к этому они и стремятся. В прошлом году шаг в этом направлении был сделан с Воспринимающий, мультимодальная модель, основанная на архитектуре Transformer, способная обрабатывать различные типы входных данных, таких как изображения, текст, видео, звук, 3D-данные. Сами создатели Gato считают, что Perceiver может быть полезен для дальнейшего расширения количества режимов будущих общих систем.

Статья взята из сообщения Luca Sambucci, если вы хотите прочитатьвесь пост нажмите здесь 


Инновационный бюллетень
Не пропустите самые важные новости об инновациях. Зарегистрируйтесь, чтобы получать их по электронной почте.

АРТИКОЛИ recenti

Онлайн-платежи: вот как потоковые сервисы заставляют вас платить вечно

Миллионы людей платят за стриминговые сервисы, выплачивая ежемесячную абонентскую плату. Распространено мнение, что вы…

Апрель 29 2024

Veeam предлагает наиболее полную поддержку программ-вымогателей: от защиты до реагирования и восстановления.

Coveware от Veeam продолжит предоставлять услуги по реагированию на инциденты, связанные с кибер-вымогательством. Coveware предложит возможности криминалистики и исправления…

Апрель 23 2024

Зеленая и цифровая революция: как прогнозируемое обслуживание меняет нефтегазовую отрасль

Прогнозируемое техническое обслуживание производит революцию в нефтегазовом секторе благодаря инновационному и упреждающему подходу к управлению предприятием…

Апрель 22 2024

Антимонопольный регулятор Великобритании поднял тревогу BigTech по поводу GenAI

Британское CMA выступило с предупреждением о поведении крупных технологических компаний на рынке искусственного интеллекта. Там…

Апрель 18 2024

Читайте «Инновации» на вашем языке

Инновационный бюллетень
Не пропустите самые важные новости об инновациях. Зарегистрируйтесь, чтобы получать их по электронной почте.

Следуйте за нами