Kecerdasan buatan multimodal (MLLM) boleh menjadi kunci kepada pembangunan kecerdasan am buatan, teknologi yang pada masa hadapan boleh menggantikan manusia dalam sebarang tugas atau kerja intelektual.
Kosmos-1 ialah model multimodal yang dibangunkan oleh penyelidik Microsoft. Isnin lalu, ia telah diperkenalkan sebagai model yang mampu:
PerkembanganKecerdasan Buatan multimodal dilihat sebagai langkah penting ke arah mewujudkan kecerdasan am buatan (AGI) yang mampu melaksanakan tugas umum peringkat manusia.
"Sebagai bahagian asas kecerdasan, persepsi pelbagai mod adalah satu keperluan untuk mencapai kecerdasan am buatan, dari segi pemerolehan pengetahuan dan penerapan dunia sebenar," tulis para penyelidik dalam kertas akademik mereka, Bahasa Bukan Semua yang Anda Perlukan: Menyelaraskan Persepsi dengan Model Bahasa.
Model Kosmos-1 boleh menganalisis imej dan menjawab soalan mengenainya, membaca teks daripada imej, menulis kapsyen untuk imej dan skor antara 22 dan 26 peratus pada ujian IQ visual, seperti ditunjukkan dalam contoh visual dalam Kosmos-1 belajar.
OpenAI, rakan perniagaan utama Microsoft dalam kecerdasan buatan, telah menetapkan AGI sebagai fokus utamanya. Kosmos-1 nampaknya merupakan inisiatif eksklusif Microsoft, tanpa bantuan OpenAI.
BlogInnovazione.it
Sektor tentera laut adalah kuasa ekonomi global yang sebenar, yang telah menavigasi ke arah pasaran 150 bilion...
Isnin lalu, Financial Times mengumumkan perjanjian dengan OpenAI. FT melesenkan kewartawanannya bertaraf dunia…
Berjuta-juta orang membayar untuk perkhidmatan penstriman, membayar yuran langganan bulanan. Adalah menjadi pendapat umum bahawa anda…
Coveware oleh Veeam akan terus menyediakan perkhidmatan tindak balas insiden pemerasan siber. Coveware akan menawarkan keupayaan forensik dan pemulihan…