Články

Microsoft představil model umělé inteligence, který rozpoznává obsah obrázků a opravuje vizuální problémy

Nový model AI Kosmos-1 je multimodální Large Language Model (MLLM), schopný reagovat nejen na lingvistické podněty, ale také na vizuální podněty, a proto lépe reagovat na relace otázek a odpovědí.

Multimodální umělá inteligence (MLLM) by mohla být klíčem k rozvoji umělé obecné inteligence, technologie, která by v budoucnu mohla nahradit člověka v jakémkoli intelektuálním úkolu nebo práci.

Co je Kosmos-1

Kosmos-1 je multimodální model vyvinutý výzkumníky společnosti Microsoft. Minulé pondělí byl představen jako model schopný:

  • číst obsah obrázků,
  • řešit vizuální hádanky,
  • rozpoznávat text na obrázcích,
  • dobré skóre ve vizuálních IQ testech
  • porozumět pokynům v přirozeném jazyce.

VývojUmělá inteligence multimodální je považován za zásadní krok k vytvoření umělé obecné inteligence (AGI), schopné plnit obecné úkoly na lidské úrovni.

Jazyk není vše, co potřebujete: Sladění vnímání s jazykovými modely

„Jako základní součást inteligence je multimodální vnímání nezbytností k dosažení umělé obecné inteligence, pokud jde o získávání znalostí a začlenění do reálného světa,“ píší vědci ve své akademické práci. Jazyk není vše, co potřebujete: Sladění vnímání s jazykovým modelem.

Model Kosmos-1 dokáže analyzovat obrázky a odpovídat na otázky o nich, číst text z obrázku, psát popisky k obrázkům a dosáhnout 22 až 26 procent ve vizuálním IQ testu, jak je ukázáno na vizuálních příkladech v Kosmos-1. studie.

Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

AGI pro OpenAI

OpenAI, klíčový obchodní partner Microsoftu v oblasti umělé inteligence, stanovil AGI jako svůj primární cíl. Kosmos-1 se zdá být exkluzivní iniciativou společnosti Microsoft bez pomoci OpenAI.

BlogInnovazione.it

Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

Nedávné články

Budoucnost je tady: Jak lodní průmysl revolucionizuje globální ekonomiku

Námořní sektor je skutečnou globální ekonomickou velmocí, která se dostala na 150miliardový trh...

1. května 2024

Vydavatelé a OpenAI podepisují dohody o regulaci toku informací zpracovávaných umělou inteligencí

Minulé pondělí Financial Times oznámily dohodu s OpenAI. FT licencuje svou prvotřídní žurnalistiku…

30. dubna 2024

Online platby: Zde je návod, jak vám streamovací služby umožňují platit navždy

Miliony lidí platí za streamovací služby a platí měsíční předplatné. Je obecný názor, že jste…

29. dubna 2024

Veeam nabízí nejkomplexnější podporu pro ransomware, od ochrany po reakci a obnovu

Společnost Coveware od společnosti Veeam bude i nadále poskytovat služby reakce na incidenty v oblasti kybernetického vydírání. Coveware nabídne forenzní a sanační schopnosti…

23. dubna 2024