bens

A Microsoft revelou um modelo de IA que reconhece o conteúdo da imagem e corrige problemas visuais

O novo modelo do AI Kosmos-1 é um Multimodal Large Language Model (MLLM), capaz de responder não apenas a pistas linguísticas, mas também a pistas visuais e, portanto, responder melhor a sessões de perguntas e respostas.

A inteligência artificial multimodal (MLLM) pode ser a chave para o desenvolvimento da inteligência artificial geral, uma tecnologia que poderá no futuro substituir os humanos em qualquer tarefa ou trabalho intelectual.

O que é o Cosmos-1

Kosmos-1 é um modelo multimodal desenvolvido por pesquisadores da Microsoft. Na passada segunda-feira, foi apresentado como um modelo capaz de:

  • leia o conteúdo das imagens,
  • resolver quebra-cabeças visuais,
  • reconhecer texto em imagens,
  • pontuar bem em testes de QI visual
  • compreender instruções dadas em linguagem natural.

O desenvolvimento doInteligência artificial multimodal é visto como um passo crucial para a criação de uma inteligência artificial geral (AGI) capaz de realizar tarefas gerais de nível humano.

A linguagem não é tudo que você precisa: alinhando a percepção com os modelos de linguagem

“Sendo uma parte fundamental da inteligência, a percepção multimodal é uma necessidade para alcançar a inteligência artificial geral, em termos de aquisição de conhecimento e incorporação no mundo real”, escrevem os pesquisadores em seu artigo acadêmico, A linguagem não é tudo que você precisa: alinhando a percepção com o modelo de linguagem.

O modelo Kosmos-1 pode analisar imagens e responder a perguntas sobre elas, ler o texto de uma imagem, escrever legendas para imagens e pontuar entre 22 e 26 por cento em um teste de QI visual, como demonstrado nos exemplos visuais no Kosmos-1 estudar.

Boletim de inovação
Não perca as notícias mais importantes sobre inovação. Cadastre-se para recebê-los por e-mail.

AGI para OpenAI

A OpenAI, principal parceira de negócios da Microsoft em inteligência artificial, definiu a AGI como seu foco principal. Kosmos-1 parece ser uma iniciativa exclusiva da Microsoft, sem o auxílio da OpenAI.

BlogInnovazione.it

Boletim de inovação
Não perca as notícias mais importantes sobre inovação. Cadastre-se para recebê-los por e-mail.

Artigos recentes

Intervenção inovadora em Realidade Aumentada, com visualizador Apple na Policlínica de Catânia

Uma operação de oftalmoplastia usando o visualizador comercial Apple Vision Pro foi realizada na Policlínica Catania…

3 Maio 2024

Os benefícios das páginas para colorir para crianças - um mundo de magia para todas as idades

O desenvolvimento de habilidades motoras finas por meio da coloração prepara as crianças para habilidades mais complexas, como escrever. Colorir…

2 Maio 2024

O futuro está aqui: como a indústria naval está revolucionando a economia global

O setor naval é uma verdadeira potência económica global, que navegou para um mercado de 150 mil milhões...

1 Maio 2024

Editoras e OpenAI assinam acordos para regular o fluxo de informações processadas por Inteligência Artificial

Na segunda-feira passada, o Financial Times anunciou um acordo com a OpenAI. O FT licencia seu jornalismo de classe mundial…

Abril 30 2024