Multimodal artificiell intelligens (MLLM) kan vara nyckeln till utvecklingen av artificiell allmän intelligens, en teknik som i framtiden kan ersätta människor i vilken intellektuell uppgift eller arbete som helst.
Kosmos-1 är en multimodal modell utvecklad av Microsofts forskare. I måndags presenterades den som en modell som kan:
Utvecklingen avArtificiell intelligens multimodal ses som ett avgörande steg mot att skapa en artificiell allmän intelligens (AGI) som kan utföra allmänna uppgifter på mänsklig nivå.
"Som en grundläggande del av intelligens är multimodal perception en nödvändighet för att uppnå artificiell allmän intelligens, när det gäller kunskapsinhämtning och inbäddning i den verkliga världen", skriver forskarna i sin akademiska uppsats, Språk är inte allt du behöver: anpassa perception med språkmodell.
Kosmos-1-modellen kan analysera bilder och svara på frågor om dem, läsa text från en bild, skriva bildtexter för bilder och få mellan 22 och 26 procent på ett visuellt IQ-test, som visas i de visuella exemplen i Kosmos-1 studie.
OpenAI, Microsofts viktigaste affärspartner inom artificiell intelligens, har satt AGI som sitt primära fokus. Kosmos-1 verkar vara ett exklusivt initiativ från Microsoft, utan hjälp av OpenAI.
BlogInnovazione.it
Att utveckla finmotorik genom färgläggning förbereder barn för mer komplexa färdigheter som att skriva. Att färglägga…
Marinesektorn är en sann global ekonomisk makt, som har navigerat mot en marknad på 150 miljarder...
I måndags tillkännagav Financial Times ett avtal med OpenAI. FT licensierar sin journalistik i världsklass...
Miljontals människor betalar för streamingtjänster och betalar månatliga prenumerationsavgifter. Det är en allmän uppfattning att du...