Artikel

Microsoft ngumumake model AI sing ngenali isi gambar lan ndandani masalah visual

Model anyar AI Kosmos-1 yaiku Multimodal Large Language Model (MLLM), bisa nanggapi ora mung kanggo isyarat linguistik, nanging uga kanggo isyarat visual, lan mulane nanggapi luwih apik kanggo sesi pitakonan-jawaban.

Multimodal Artificial Intelligence (MLLM) bisa dadi kunci pangembangan intelijen umum buatan, teknologi sing bisa ngganti manungsa ing tugas utawa karya intelektual apa wae.

Apa Kosmos-1

Kosmos-1 minangka model multimodal sing dikembangake dening peneliti Microsoft. Dina Senin kepungkur, diumumake minangka model sing bisa:

  • maca isi gambar,
  • ngrampungake teka-teki visual,
  • ngenali teks ing gambar,
  • skor apik ing tes IQ visual
  • ngerti instruksi diwenehi ing basa alam.

Pangembangan sakaArtificial Intelligence multimodal katon minangka langkah penting kanggo nggawe kecerdasan umum buatan (AGI) sing bisa nindakake tugas tingkat manungsa umum.

Basa Ora Kabeh Sampeyan Perlu: Nyelarasake Persepsi karo Model Basa

"Dadi bagean dhasar saka intelijen, persepsi multimodal minangka kabutuhan kanggo entuk intelijen umum buatan, ing babagan akuisisi pengetahuan lan embedment ing donya nyata," para peneliti nulis ing kertas akademik, Basa Ora Kabeh Sampeyan Perlu: Nyelarasake Persepsi karo Model Basa.

Model Kosmos-1 bisa nganalisa gambar lan njawab pitakonan, maca teks saka gambar, nulis katrangan kanggo gambar, lan ngetung antarane 22 lan 26 persen ing tes IQ visual, kayata sing dituduhake ing conto visual ing Kosmos-1. sinau.

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

AGI kanggo OpenAI

OpenAI, mitra bisnis utama Microsoft ing intelijen buatan, wis nyetel AGI minangka fokus utama. Kosmos-1 katon minangka inisiatif eksklusif Microsoft, tanpa bantuan OpenAI.

BlogInnovazione.it

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

Artikel anyar

Intervensi inovatif ing Augmented Reality, karo panampil Apple ing Poliklinik Catania

Operasi ophthalmoplasty nggunakake penampil komersial Apple Vision Pro ditindakake ing Poliklinik Catania…

3 May 2024

Keuntungan saka Mewarnai Kaca kanggo Bocah-bocah - jagad sihir kanggo kabeh umur

Ngembangake katrampilan motorik sing apik liwat pewarnaan nyiapake bocah kanggo katrampilan sing luwih rumit kaya nulis. Kanggo mewarnai…

2 May 2024

Masa Depan Iki: Kepiye Industri Pengiriman Revolusi Ekonomi Global

Sektor angkatan laut minangka kekuwatan ekonomi global sing sejatine, sing wis ngarahake pasar 150 milyar ...

1 May 2024

Penerbit lan OpenAI menehi tandha persetujuan kanggo ngatur aliran informasi sing diproses dening Artificial Intelligence

Senin kepungkur, Financial Times ngumumake kesepakatan karo OpenAI. FT menehi lisensi jurnalisme kelas donya…

30 April 2024