情報

Gato、DeepMind、および一般的な人工知能への競争

Gato は DeepMind の新しいマルチモーダル AI システムで、常に同じニューラル ネットワークを使用して何百もの異なるタスクを実行できます。

と考える方もいます。 人間レベルの人工知能 計画は現在計画されており、あとは計算リソースを増やすだけの問題になりますが、多くの要件がまだ不足しているために速度が低下しているものもあります。 しかし、非常に異なるタスクを管理する並外れた能力により、Gato は他の AI システムとは異なる AI システムとなっています。これは、一方では誰もが期待する一般的な人工知能ではありませんが、他方では、その方法においては依然として革新的なシステムです。これは、同じアーキテクチャからの非常に異なるデータを処理することができます。 deep learning.

AIと一般的なAIを閉じる 

これまでのところ、人工知能の複雑な世界における主な違いの XNUMX つは、「狭い」AI とも呼ばれる弱い AI と、「一般的な」AI とも呼ばれる強い AI の違いです。 思考機械の問題をすぐに解決するのは、かなり簡単な方法でした。 Narrow AI は、ルートの計画、関連する検索結果の提供、書面による会話など、XNUMX つのタスクのみを実行する一種の人工知能です。 一方、一般的な AI は、映画で見られるような人工知能であり、人間のように考え、多くのタスクを同時に実行し、それらの間に有用な相乗効果を生み出します。 これらの人間のような機械の頭字語は AGI です。 人工知能. ほとんどの研究者にとって、理論的には可能ですが、すぐには到達できないキメラです。

しかし、今日、この区別は軋み、説明がますます単純ではなくなり始めています。 実際、近年の研究はますます汎用的な人工知能モデルの作成に向けて推し進められてきましたが、AGI の発見には至りませんでした。 したがって、それは作成しています 中間地点の一種、ここでは、異なる性質の多数のタスクを実行できる AI モデルを見つけたので、もはや「狭い」AI とは言えませんが、同時に因果的知性や認識を示していません。多くの専門家は AGI に内在しているはずです。

マルチモーダル AI

このタイプの人工知能は「ジェネラリスト」、あるいはもっと正確に言えば「マルチモーダル」、それと対話する方法はいくつかあります。 例を挙げると、マルチモーダル AI システムは、私たちの地域の天気予報を見つけ (検索して最良の結果を選択)、今日雨が降ると伝え (自然言語処理と音声合成)、行くかどうかを確認することができます。傘の有無にかかわらず (マシン ビジョン)。 さらに、マルチモーダル システムの主な特徴の XNUMX つは、画像とテキストなど、さまざまなタイプのデータを「取り込む」ことであり、両方から有用な情報を引き出す方法を知っています。 その結果、私たちは本当の知性を扱っているように見えますが、実際には、「バッテリーに」入れられ、互いに相乗効果を発揮する複数の AI モデルしかありません。

ディープマインド ズー

マルチモーダル AI の研究に関しては、ここ数週間、ロンドンの企業 DeepMind が - 私たちが覚えている - 銀河系の一部です。 でログイン、自身について多くの話題を呼んだ XNUMX つの AI システムをリリースしました。 最初は呼ばれます フラミンゴ、そして「マルチモーダルタスク」、つまり、画像、ビデオ、テキストなどの異なるモダリティを介して伝達される情報を互いに組み合わせても解決できるタスクを解決できるモデルです。 Flamingo は、分類情報、キャプション管理、画像ベースの質問応答を扱うことができるビジュアル言語モデル (VLM) であり、そのすべてを少数の入出力サンプル (いわゆる「少数ショット学習」) のみで提供します。

モデルの目的は、画像やビデオの状況を「理解」し、言語システムで正しく説明し、「見える」ものに関する質問に正しく答えることにあります。

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

コネクティビズムと知性?

Gato は、特定のタスクに最適な AI モデルであるとは限りません。 Sawyer ロボット (多くの「関節」を備えたアームで構成されるロボット) の制御は良好な水準ですが、キャプションの作成は平凡であり、一部の Atari ゲームの処理は他の専用ゲームよりも劣ります。 AI モデル。 DeepMind は、450 のタスクのうち (彼がトレーニングを受けた 604 と比較して)、Gato は人間の専門家よりも「半分以上」正確であると述べています。 やや複雑な言い方をすれば、合計 604 のタスクのうち、少なくとも 154 は非常に悪い結果を返し、残りの 450 の時間のかなりの半分で Gato は人間の専門家よりも優れた動作をしますが、残りの半分の時間では動作します。悪い。

一般化への道

これらの週の結果は、DeepMind が長年にわたって実行してきたコミットメントの結果です。 同社の目標は、「知性の問題を解決する」ことであり、さまざまな問題に対処できるより一般的なシステムを開発することであることを忘れないでください。 それが同社が人工汎用知能と呼んでいるものであり、彼らが目指すところです。 昨年、この方向への一歩が 知覚者、画像、テキスト、ビデオ、サウンド、3D データなど、さまざまな種類の入力を処理できる Transformer アーキテクチャに基づくマルチモーダル モデル。 Gato の作成者自身は、Perceiver が将来の一般的なシステムのモード数をさらに拡大するのに役立つ可能性があると考えています。

の投稿から抜粋した記事 Luca Sambucciを読みたい場合は、投稿全体はここをクリック 


イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

最近の記事

未来はここにあります: 海運業界が世界経済をどのように変革しているか

海軍部門は真の世界経済大国であり、150 億市場に向けて舵を切り続けています...

1月2024

パブリッシャーと OpenAI が人工知能によって処理される情報の流れを規制する契約に署名

先週の月曜日、フィナンシャル・タイムズ紙はOpenAIとの契約を発表した。 FT は世界クラスのジャーナリズムにライセンスを供与しています…

4月30 2024

オンライン支払い: ストリーミング サービスで永久に支払いができる仕組みをご紹介します

何百万人もの人々がストリーミング サービスに月額料金を払っています。あなたは…というのが一般的な意見です。

4月29 2024

Veeam は、保護から対応、回復まで、ランサムウェアに対する最も包括的なサポートを備えています

Coveware by Veeam は、サイバー恐喝インシデント対応サービスを引き続き提供します。 Coveware はフォレンジックと修復機能を提供します…

4月23 2024

あなたの言語でイノベーションを読む

イノベーションニュースレター
イノベーションに関する最も重要なニュースをお見逃しなく。 メールで受け取るにはサインアップしてください。

Seguici