Multimodal kunstig intelligens (MLLM) kunne være nøglen til udviklingen af kunstig generel intelligens, en teknologi, der i fremtiden kan erstatte mennesker i enhver intellektuel opgave eller arbejde.
Kosmos-1 er en multimodal model udviklet af Microsoft-forskere. Sidste mandag blev den afsløret som en model, der er i stand til:
Udviklingen afKunstig intelligens multimodal ses som et afgørende skridt hen imod at skabe en kunstig generel intelligens (AGI), der er i stand til at udføre generelle opgaver på menneskeligt niveau.
"Som en grundlæggende del af intelligens er multimodal perception en nødvendighed for at opnå kunstig generel intelligens, hvad angår videnstilegnelse og indlejring i den virkelige verden," skriver forskerne i deres akademiske papir. Sprog er ikke alt, hvad du behøver: At tilpasse opfattelsen til sprogmodellen.
Kosmos-1-modellen kan analysere billeder og besvare spørgsmål om dem, læse tekst fra et billede, skrive billedtekster til billeder og score mellem 22 og 26 procent på en visuel IQ-test, som vist i de visuelle eksempler i Kosmos-1 undersøgelse.
OpenAI, Microsofts vigtigste forretningspartner inden for kunstig intelligens, har sat AGI som sit primære fokus. Kosmos-1 ser ud til at være et eksklusivt initiativ fra Microsoft uden hjælp fra OpenAI.
BlogInnovazione.it
Coveware by Veeam vil fortsætte med at levere responstjenester til cyberafpresning. Coveware vil tilbyde kriminaltekniske og afhjælpende funktioner...
Forudsigende vedligeholdelse revolutionerer olie- og gassektoren med en innovativ og proaktiv tilgang til anlægsstyring...
Det britiske CMA har udsendt en advarsel om Big Techs adfærd på markedet for kunstig intelligens. Der…
Dekretet om "grønne huse", der er formuleret af Den Europæiske Union for at øge bygningers energieffektivitet, har afsluttet sin lovgivningsproces med...