Cikkek

A Microsoft bemutatott egy mesterséges intelligencia modellt, amely felismeri a képtartalmat és kijavítja a vizuális problémákat

Az AI Kosmos-1 új modellje egy multimodális Large Language Model (MLLM), amely nem csak a nyelvi, hanem a vizuális jelzésekre is képes reagálni, ezért jobban reagál a kérdés-felelet ülésekre.

A multimodális mesterséges intelligencia (MLLM) lehet a kulcsa az általános mesterséges intelligencia fejlesztésének, amely technológia a jövőben bármilyen intellektuális feladatban vagy munkában helyettesítheti az embert.

Mi az a Kosmos-1

A Kosmos-1 a Microsoft kutatói által kifejlesztett multimodális modell. Múlt hétfőn olyan modellként mutatták be, amely képes:

  • olvassa el a képek tartalmát,
  • vizuális rejtvényeket megoldani,
  • szöveg felismerése a képeken,
  • jól teljesít a vizuális IQ-teszteken
  • megérti a természetes nyelven adott utasításokat.

AMesterséges intelligencia A multimodális létfontosságú lépésnek tekintik az általános emberi szintű feladatok elvégzésére képes általános mesterséges intelligencia (AGI) létrehozása felé.

A nyelv nem minden, amire szüksége van: az észlelés és a nyelvi modellek összehangolása

„Az intelligencia alapvető részeként a multimodális észlelés elengedhetetlen az általános mesterséges intelligencia eléréséhez, a tudás megszerzése és a valós világba való beágyazódás szempontjából” – írják a kutatók tanulmányukban. A nyelv nem minden, amire szüksége van: az észlelés és a nyelvi modell összehangolása.

A Kosmos-1 modell képes elemezni a képeket és válaszolni a rájuk vonatkozó kérdésekre, szöveget olvasni egy képről, feliratokat írni a képekhez, és 22 és 26 százalék közötti pontszámot érhet el egy vizuális IQ-teszten, ahogy azt a Kozmosz-1 vizuális példái is bemutatják. tanulmány.

Innovációs hírlevél
Ne maradjon le az innovációval kapcsolatos legfontosabb hírekről. Regisztráljon, hogy megkapja őket e-mailben.

AGI az OpenAI számára

Az OpenAI, a Microsoft kulcsfontosságú üzleti partnere a mesterséges intelligencia területén az AGI-t helyezte elsődleges fókuszpontnak. A Kosmos-1 a Microsoft exkluzív kezdeményezése, az OpenAI segítsége nélkül.

BlogInnovazione.it

Innovációs hírlevél
Ne maradjon le az innovációval kapcsolatos legfontosabb hírekről. Regisztráljon, hogy megkapja őket e-mailben.

Friss cikkek

A színező oldalak előnyei gyerekeknek – a varázslatok világa minden korosztály számára

A finom motoros készségek színezéssel történő fejlesztése felkészíti a gyerekeket olyan összetettebb készségekre, mint az írás. Kiszínezni…

Május 2 2024

A jövő itt van: Hogyan forradalmasítja a hajózási ágazat a globális gazdaságot

A haditengerészeti szektor igazi világgazdasági hatalom, amely egy 150 milliárdos piac felé navigált...

Május 1 2024

A kiadók és az OpenAI megállapodásokat írnak alá a mesterséges intelligencia által feldolgozott információáramlás szabályozására

Múlt hétfőn a Financial Times bejelentette, hogy megállapodást köt az OpenAI-val. Az FT engedélyezi világszínvonalú újságírását…

30 április 2024

Online fizetés: Így fizethet örökké a streaming szolgáltatások

Emberek milliói fizetnek a streaming szolgáltatásokért, havi előfizetési díjat fizetve. Általános vélemény, hogy Ön…

29 április 2024