artikel

Microsoft melancarkan model AI yang mengenali kandungan imej dan menyelesaikan masalah visual

Model baharu AI Kosmos-1 ialah Multimodal Large Language Model (MLLM), mampu bertindak balas bukan sahaja kepada isyarat linguistik, tetapi juga kepada isyarat visual, dan oleh itu bertindak balas dengan lebih baik kepada sesi soal jawab.

Kecerdasan buatan multimodal (MLLM) boleh menjadi kunci kepada pembangunan kecerdasan am buatan, teknologi yang pada masa hadapan boleh menggantikan manusia dalam sebarang tugas atau kerja intelektual.

Apa itu Kosmos-1

Kosmos-1 ialah model multimodal yang dibangunkan oleh penyelidik Microsoft. Isnin lalu, ia telah diperkenalkan sebagai model yang mampu:

  • membaca kandungan gambar,
  • menyelesaikan teka-teki visual,
  • mengenali teks dalam imej,
  • mendapat markah yang baik pada ujian IQ visual
  • memahami arahan yang diberikan dalam bahasa semula jadi.

PerkembanganKecerdasan Buatan multimodal dilihat sebagai langkah penting ke arah mewujudkan kecerdasan am buatan (AGI) yang mampu melaksanakan tugas umum peringkat manusia.

Bahasa Bukan Semua yang Anda Perlukan: Menyelaraskan Persepsi dengan Model Bahasa

"Sebagai bahagian asas kecerdasan, persepsi pelbagai mod adalah satu keperluan untuk mencapai kecerdasan am buatan, dari segi pemerolehan pengetahuan dan penerapan dunia sebenar," tulis para penyelidik dalam kertas akademik mereka, Bahasa Bukan Semua yang Anda Perlukan: Menyelaraskan Persepsi dengan Model Bahasa.

Model Kosmos-1 boleh menganalisis imej dan menjawab soalan mengenainya, membaca teks daripada imej, menulis kapsyen untuk imej dan skor antara 22 dan 26 peratus pada ujian IQ visual, seperti ditunjukkan dalam contoh visual dalam Kosmos-1 belajar.

Surat berita inovasi
Jangan terlepas berita paling penting tentang inovasi. Daftar untuk menerimanya melalui e-mel.

AGI untuk OpenAI

OpenAI, rakan perniagaan utama Microsoft dalam kecerdasan buatan, telah menetapkan AGI sebagai fokus utamanya. Kosmos-1 nampaknya merupakan inisiatif eksklusif Microsoft, tanpa bantuan OpenAI.

BlogInnovazione.it

Surat berita inovasi
Jangan terlepas berita paling penting tentang inovasi. Daftar untuk menerimanya melalui e-mel.

Artikel baru-baru ini

Masa Depan Di Sini: Bagaimana Industri Perkapalan Merevolusikan Ekonomi Global

Sektor tentera laut adalah kuasa ekonomi global yang sebenar, yang telah menavigasi ke arah pasaran 150 bilion...

1 Mei 2024

Penerbit dan OpenAI menandatangani perjanjian untuk mengawal selia aliran maklumat yang diproses oleh Kepintaran Buatan

Isnin lalu, Financial Times mengumumkan perjanjian dengan OpenAI. FT melesenkan kewartawanannya bertaraf dunia…

30 April 2024

Pembayaran Dalam Talian: Begini Cara Perkhidmatan Penstriman Membuat Anda Membayar Selama-lamanya

Berjuta-juta orang membayar untuk perkhidmatan penstriman, membayar yuran langganan bulanan. Adalah menjadi pendapat umum bahawa anda…

29 April 2024

Veeam menampilkan sokongan paling komprehensif untuk perisian tebusan, daripada perlindungan kepada tindak balas dan pemulihan

Coveware oleh Veeam akan terus menyediakan perkhidmatan tindak balas insiden pemerasan siber. Coveware akan menawarkan keupayaan forensik dan pemulihan…

23 April 2024