Articole

Microsoft a dezvăluit un model AI care recunoaște conținutul imaginii și remediază problemele vizuale

Noul model de AI Kosmos-1 este un Multimodal Large Language Model (MLLM), capabil să răspundă nu numai la indiciile lingvistice, ci și la indiciile vizuale și, prin urmare, să răspundă mai bine la sesiunile de întrebări și răspunsuri.

Inteligența artificială multimodală (MLLM) ar putea fi cheia dezvoltării inteligenței artificiale generale, o tehnologie care ar putea înlocui în viitor oamenii în orice sarcină sau muncă intelectuală.

Ce este Kosmos-1

Kosmos-1 este un model multimodal dezvoltat de cercetătorii Microsoft. Luni trecută, a fost dezvăluit ca un model capabil de:

  • citiți conținutul imaginilor,
  • rezolva puzzle-uri vizuale,
  • recunoaște textul din imagini,
  • scor bun la testele de IQ vizual
  • înţelege instrucţiunile date în limbaj natural.

DezvoltareaInteligență artificială multimodal este văzut ca un pas crucial către crearea unei inteligențe generale artificiale (AGI) capabilă să îndeplinească sarcini generale la nivel uman.

Limbajul nu este tot ce ai nevoie: alinierea percepției cu modelele de limbaj

„Fiind o parte fundamentală a inteligenței, percepția multimodală este o necesitate pentru a obține inteligența generală artificială, în ceea ce privește achiziționarea de cunoștințe și integrarea în lumea reală”, scriu cercetătorii în lucrarea lor academică, Limbajul nu este tot ce ai nevoie: alinierea percepției cu modelul lingvistic.

Modelul Kosmos-1 poate analiza imagini și răspunde la întrebări despre ele, poate citi text dintr-o imagine, poate scrie subtitrări pentru imagini și poate nota între 22 și 26% la un test vizual IQ, așa cum este demonstrat în exemplele vizuale din Kosmos-1. studiu.

Buletin informativ de inovare
Nu rata cele mai importante știri despre inovație. Înscrieți-vă pentru a le primi pe e-mail.

AGI pentru OpenAI

OpenAI, partenerul cheie de afaceri al Microsoft în inteligența artificială, și-a stabilit AGI ca obiectiv principal. Kosmos-1 pare a fi o inițiativă exclusivă a Microsoft, fără asistența OpenAI.

BlogInnovazione.it

Buletin informativ de inovare
Nu rata cele mai importante știri despre inovație. Înscrieți-vă pentru a le primi pe e-mail.

Articole recente

Plăți online: Iată cum serviciile de streaming vă fac să plătiți pentru totdeauna

Milioane de oameni plătesc pentru serviciile de streaming, plătind taxe lunare de abonament. Este o părere comună că tu...

Aprilie 29 2024

Veeam oferă cel mai complet suport pentru ransomware, de la protecție la răspuns și recuperare

Coveware de la Veeam va continua să ofere servicii de răspuns la incidente de extorcare cibernetică. Coveware va oferi capacități criminalistice și de remediere...

Aprilie 23 2024

Revoluția verde și digitală: cum întreținerea predictivă transformă industria petrolului și gazelor

Întreținerea predictivă revoluționează sectorul petrolului și gazelor, cu o abordare inovatoare și proactivă a managementului uzinelor...

Aprilie 22 2024

Autoritatea de reglementare antitrust din Marea Britanie ridică alarma BigTech cu privire la GenAI

CMA din Marea Britanie a emis un avertisment cu privire la comportamentul Big Tech pe piața inteligenței artificiale. Acolo…

Aprilie 18 2024