A inteligência artificial multimodal (MLLM) pode ser a chave para o desenvolvimento da inteligência artificial geral, uma tecnologia que poderá no futuro substituir os humanos em qualquer tarefa ou trabalho intelectual.
Kosmos-1 é um modelo multimodal desenvolvido por pesquisadores da Microsoft. Na passada segunda-feira, foi apresentado como um modelo capaz de:
O desenvolvimento doInteligência artificial multimodal é visto como um passo crucial para a criação de uma inteligência artificial geral (AGI) capaz de realizar tarefas gerais de nível humano.
“Sendo uma parte fundamental da inteligência, a percepção multimodal é uma necessidade para alcançar a inteligência artificial geral, em termos de aquisição de conhecimento e incorporação no mundo real”, escrevem os pesquisadores em seu artigo acadêmico, A linguagem não é tudo que você precisa: alinhando a percepção com o modelo de linguagem.
O modelo Kosmos-1 pode analisar imagens e responder a perguntas sobre elas, ler o texto de uma imagem, escrever legendas para imagens e pontuar entre 22 e 26 por cento em um teste de QI visual, como demonstrado nos exemplos visuais no Kosmos-1 estudar.
A OpenAI, principal parceira de negócios da Microsoft em inteligência artificial, definiu a AGI como seu foco principal. Kosmos-1 parece ser uma iniciativa exclusiva da Microsoft, sem o auxílio da OpenAI.
BlogInnovazione.it
Uma operação de oftalmoplastia usando o visualizador comercial Apple Vision Pro foi realizada na Policlínica Catania…
O desenvolvimento de habilidades motoras finas por meio da coloração prepara as crianças para habilidades mais complexas, como escrever. Colorir…
O setor naval é uma verdadeira potência económica global, que navegou para um mercado de 150 mil milhões...
Na segunda-feira passada, o Financial Times anunciou um acordo com a OpenAI. O FT licencia seu jornalismo de classe mundial…