Artikler

Microsoft afslørede en AI-model, der genkender billedindhold og løser visuelle problemer

Den nye model af AI Kosmos-1 er en Multimodal Large Language Model (MLLM), i stand til at reagere ikke kun på sproglige signaler, men også på visuelle signaler, og derfor reagerer bedre på spørgsmål-og-svar-sessioner.

Multimodal kunstig intelligens (MLLM) kunne være nøglen til udviklingen af kunstig generel intelligens, en teknologi, der i fremtiden kan erstatte mennesker i enhver intellektuel opgave eller arbejde.

Hvad er Kosmos-1

Kosmos-1 er en multimodal model udviklet af Microsoft-forskere. Sidste mandag blev den afsløret som en model, der er i stand til:

læse indholdet af billederne,
løse visuelle gåder,
genkende tekst i billeder,
score godt på visuelle IQ-tests
forstå instruktioner givet i naturligt sprog.

Udviklingen afKunstig intelligens multimodal ses som et afgørende skridt hen imod at skabe en kunstig generel intelligens (AGI), der er i stand til at udføre generelle opgaver på menneskeligt niveau.

Sprog er ikke alt, hvad du behøver: Afstem opfattelse med sprogmodeller

"Som en grundlæggende del af intelligens er multimodal perception en nødvendighed for at opnå kunstig generel intelligens, hvad angår videnstilegnelse og indlejring i den virkelige verden," skriver forskerne i deres akademiske papir. Sprog er ikke alt, hvad du behøver: At tilpasse opfattelsen til sprogmodellen.

Kosmos-1-modellen kan analysere billeder og besvare spørgsmål om dem, læse tekst fra et billede, skrive billedtekster til billeder og score mellem 22 og 26 procent på en visuel IQ-test, som vist i de visuelle eksempler i Kosmos-1 undersøgelse.

AGI for OpenAI

OpenAI, Microsofts vigtigste forretningspartner inden for kunstig intelligens, har sat AGI som sit primære fokus. Kosmos-1 ser ud til at være et eksklusivt initiativ fra Microsoft uden hjælp fra OpenAI.

BlogInnovazione.it

tags: chatbotchat gptkunstig intelligenslarge language modelsLLMmicrosoft

2. marts 2023 kl. 4:45

Efter Sensormatic Solutions af Johnson Controls fejrer succesfuldt Hard Tag Sustainable Recycling-program forud for EuroShop 2023 »

Forrige « Oplev fremtidens netværk i dag med Juniper Networks

Seneste artikler

Comunicati Stampa

Veeam har den mest omfattende support til ransomware, fra beskyttelse til respons og gendannelse

Coveware by Veeam vil fortsætte med at levere responstjenester til cyberafpresning. Coveware vil tilbyde kriminaltekniske og afhjælpende funktioner...

23 April 2024

Artikler

Grøn og digital revolution: Hvordan prædiktiv vedligeholdelse transformerer olie- og gasindustrien

Forudsigende vedligeholdelse revolutionerer olie- og gassektoren med en innovativ og proaktiv tilgang til anlægsstyring...

22 April 2024

Artikler

Britisk antitrust-tilsynsmyndighed rejser BigTech-alarm over GenAI

Det britiske CMA har udsendt en advarsel om Big Techs adfærd på markedet for kunstig intelligens. Der…

18 April 2024

Comunicati Stampa

Casa Green: energirevolution for en bæredygtig fremtid i Italien

Dekretet om "grønne huse", der er formuleret af Den Europæiske Union for at øge bygningers energieffektivitet, har afsluttet sin lovgivningsproces med...

18 April 2024