Artikler

Microsoft avduket en AI-modell som gjenkjenner bildeinnhold og løser visuelle problemer

Den nye modellen av AI Kosmos-1 er en multimodal Large Language Model (MLLM), i stand til å svare ikke bare på språklige signaler, men også på visuelle signaler, og reagerer derfor bedre på spørsmål-og-svar-økter.

Multimodal kunstig intelligens (MLLM) kan være nøkkelen til utviklingen av kunstig generell intelligens, en teknologi som i fremtiden kan erstatte mennesker i enhver intellektuell oppgave eller arbeid.

Hva er Kosmos-1

Kosmos-1 er en multimodal modell utviklet av Microsoft-forskere. Sist mandag ble den avduket som en modell som kan:

  • les innholdet i bildene,
  • løse visuelle gåter,
  • gjenkjenne tekst i bilder,
  • score godt på visuelle IQ-tester
  • forstå instruksjoner gitt på naturlig språk.

Utviklingen avKunstig intelligens multimodal blir sett på som et avgjørende skritt mot å skape en kunstig generell intelligens (AGI) som er i stand til å utføre generelle oppgaver på menneskelig nivå.

Språk er ikke alt du trenger: samkjøre persepsjon med språkmodeller

"Som en grunnleggende del av intelligens, er multimodal persepsjon en nødvendighet for å oppnå kunstig generell intelligens, når det gjelder kunnskapsinnhenting og innbygging i den virkelige verden," skriver forskerne i sin akademiske artikkel, Språk er ikke alt du trenger: samkjøre persepsjon med språkmodell.

Kosmos-1-modellen kan analysere bilder og svare på spørsmål om dem, lese tekst fra et bilde, skrive bildetekster for bilder og score mellom 22 og 26 prosent på en visuell IQ-test, som vist i de visuelle eksemplene i Kosmos-1 studere.

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

AGI for OpenAI

OpenAI, Microsofts viktigste forretningspartner innen kunstig intelligens, har satt AGI som sitt primære fokus. Kosmos-1 ser ut til å være et eksklusivt initiativ fra Microsoft, uten hjelp fra OpenAI.

BlogInnovazione.it

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Siste artikler

Utgivere og OpenAI signerer avtaler for å regulere flyten av informasjon som behandles av kunstig intelligens

Sist mandag kunngjorde Financial Times en avtale med OpenAI. FT lisensierer sin journalistikk i verdensklasse...

30 april 2024

Nettbetalinger: Her er hvordan strømmetjenester får deg til å betale for alltid

Millioner av mennesker betaler for strømmetjenester og betaler månedlige abonnementsavgifter. Det er vanlig oppfatning at du...

29 april 2024

Veeam har den mest omfattende støtten for løsepengevare, fra beskyttelse til respons og gjenoppretting

Coveware by Veeam vil fortsette å tilby responstjenester for cyberutpressing. Coveware vil tilby kriminaltekniske og utbedringsmuligheter...

23 april 2024

Grønn og digital revolusjon: Hvordan prediktivt vedlikehold transformerer olje- og gassindustrien

Prediktivt vedlikehold revolusjonerer olje- og gasssektoren, med en innovativ og proaktiv tilnærming til anleggsledelse...

22 april 2024