Multimodal kunstig intelligens (MLLM) kan være nøkkelen til utviklingen av kunstig generell intelligens, en teknologi som i fremtiden kan erstatte mennesker i enhver intellektuell oppgave eller arbeid.
Kosmos-1 er en multimodal modell utviklet av Microsoft-forskere. Sist mandag ble den avduket som en modell som kan:
Utviklingen avKunstig intelligens multimodal blir sett på som et avgjørende skritt mot å skape en kunstig generell intelligens (AGI) som er i stand til å utføre generelle oppgaver på menneskelig nivå.
"Som en grunnleggende del av intelligens, er multimodal persepsjon en nødvendighet for å oppnå kunstig generell intelligens, når det gjelder kunnskapsinnhenting og innbygging i den virkelige verden," skriver forskerne i sin akademiske artikkel, Språk er ikke alt du trenger: samkjøre persepsjon med språkmodell.
Kosmos-1-modellen kan analysere bilder og svare på spørsmål om dem, lese tekst fra et bilde, skrive bildetekster for bilder og score mellom 22 og 26 prosent på en visuell IQ-test, som vist i de visuelle eksemplene i Kosmos-1 studere.
OpenAI, Microsofts viktigste forretningspartner innen kunstig intelligens, har satt AGI som sitt primære fokus. Kosmos-1 ser ut til å være et eksklusivt initiativ fra Microsoft, uten hjelp fra OpenAI.
BlogInnovazione.it
Sist mandag kunngjorde Financial Times en avtale med OpenAI. FT lisensierer sin journalistikk i verdensklasse...
Millioner av mennesker betaler for strømmetjenester og betaler månedlige abonnementsavgifter. Det er vanlig oppfatning at du...
Coveware by Veeam vil fortsette å tilby responstjenester for cyberutpressing. Coveware vil tilby kriminaltekniske og utbedringsmuligheter...
Prediktivt vedlikehold revolusjonerer olje- og gasssektoren, med en innovativ og proaktiv tilnærming til anleggsledelse...