towary

Microsoft zaprezentował model AI, który rozpoznaje zawartość obrazu i rozwiązuje problemy wizualne

Nowy model AI Kosmos-1 jest multimodalny Large Language Model (MLLM), potrafiący reagować nie tylko na sygnały językowe, ale także na sygnały wizualne, dzięki czemu lepiej reagują na sesje pytań i odpowiedzi.

Multimodalna sztuczna inteligencja (MLLM) może być kluczem do rozwoju sztucznej inteligencji ogólnej, technologii, która mogłaby w przyszłości zastąpić człowieka w każdym zadaniu intelektualnym lub pracy.

Co to jest Kosmos-1

Kosmos-1 to multimodalny model opracowany przez badaczy firmy Microsoft. W zeszły poniedziałek został zaprezentowany jako model zdolny do:

  • zapoznaj się z treścią obrazków,
  • rozwiązywać zagadki wizualne,
  • rozpoznawać tekst na obrazach,
  • dobry wynik w wizualnych testach IQ
  • rozumieć instrukcje wydawane w języku naturalnym.

RozwójSztuczna inteligencja Multimodalność jest postrzegana jako kluczowy krok w kierunku stworzenia sztucznej inteligencji ogólnej (AGI) zdolnej do wykonywania ogólnych zadań na poziomie człowieka.

Język to nie wszystko, czego potrzebujesz: dostosowanie percepcji do modeli językowych

„Będąc fundamentalną częścią inteligencji, percepcja multimodalna jest koniecznością do osiągnięcia sztucznej inteligencji ogólnej, jeśli chodzi o zdobywanie wiedzy i osadzenie w świecie rzeczywistym”, piszą naukowcy w swoim artykule naukowym, Język to nie wszystko, czego potrzebujesz: dostosowanie percepcji do modelu językowego.

Model Kosmos-1 może analizować obrazy i odpowiadać na pytania dotyczące nich, odczytywać tekst z obrazu, pisać podpisy pod obrazami i uzyskiwać od 22 do 26 procent w wizualnym teście IQ, jak pokazano na wizualnych przykładach w Kosmos-1 badanie.

Biuletyn innowacji
Nie przegap najważniejszych wiadomości dotyczących innowacji. Zarejestruj się, aby otrzymywać je e-mailem.

AGI dla OpenAI

OpenAI, kluczowy partner biznesowy Microsoftu w dziedzinie sztucznej inteligencji, skupił się na AGI. Kosmos-1 wydaje się być wyłączną inicjatywą Microsoftu, bez pomocy OpenAI.

BlogInnovazione.it

Biuletyn innowacji
Nie przegap najważniejszych wiadomości dotyczących innowacji. Zarejestruj się, aby otrzymywać je e-mailem.

Najnowsze artykuły

Veeam oferuje najbardziej wszechstronną obsługę oprogramowania ransomware, od ochrony po reagowanie i odzyskiwanie

Coveware by Veeam będzie w dalszym ciągu świadczyć usługi reagowania na incydenty związane z wyłudzeniami cybernetycznymi. Coveware będzie oferować funkcje kryminalistyczne i naprawcze…

Kwiecień 23 2024

Rewolucja ekologiczna i cyfrowa: jak konserwacja predykcyjna zmienia przemysł naftowy i gazowy

Konserwacja predykcyjna rewolucjonizuje sektor naftowo-gazowy dzięki innowacyjnemu i proaktywnemu podejściu do zarządzania zakładami.…

Kwiecień 22 2024

Brytyjski organ antymonopolowy podnosi alarm BigTech w związku z GenAI

Brytyjskie CMA wydało ostrzeżenie dotyczące zachowań Big Tech na rynku sztucznej inteligencji. Tam…

Kwiecień 18 2024

Casa Green: rewolucja energetyczna dla zrównoważonej przyszłości we Włoszech

Rozporządzenie w sprawie zielonych domów, opracowane przez Unię Europejską w celu zwiększenia efektywności energetycznej budynków, zakończyło proces legislacyjny…

Kwiecień 18 2024