novembro 2, 2024

Atibaia Connection

Encontre todos os artigos mais recentes e assista a programas de TV, reportagens e podcasts relacionados ao Brasil

Avanço da IA: máquinas que dominam tarefas humanas por meio da linguagem

Avanço da IA: máquinas que dominam tarefas humanas por meio da linguagem

resumo: Os investigadores deram um grande salto no campo da inteligência artificial ao desenvolver uma inteligência artificial capaz de aprender novas tarefas a partir de instruções verbais ou escritas e depois descrever essas tarefas verbalmente para outra inteligência artificial, permitindo-lhe realizar as mesmas tarefas. Este desenvolvimento destaca pela primeira vez uma capacidade única e semelhante à humana na IA: converter instruções em ações e comunicar linguisticamente essas ações aos seus pares.

A equipe usou um modelo neural artificial conectado a uma rede de compreensão de linguagem pré-treinada, para simular as áreas de processamento de linguagem do cérebro. Este avanço não só faz avançar a nossa compreensão da interação entre linguagem e comportamento, mas também é uma grande promessa para a robótica, prevendo um futuro onde as máquinas possam comunicar e aprender umas com as outras de forma semelhante aos humanos.

Principais fatos:

  1. Aprendizagem e comunicação semelhantes às humanas em inteligência artificial: A equipe da Universidade de Genebra criou um modelo de IA que pode executar tarefas com base em instruções verbais ou escritas e comunicar essas tarefas a outras IAs.
  2. Integração avançada de modelo neural: Ao combinar um modelo de linguagem pré-treinado com uma rede mais simples, os pesquisadores imitaram as áreas do cérebro humano responsáveis ​​pela percepção, interpretação e produção da linguagem.
  3. Aplicações promissoras em robótica: Esta inovação abre novas possibilidades para a robótica, permitindo o desenvolvimento de robôs humanóides que entendem e se comunicam com os humanos e entre si.

fonte: Universidade de Genebra

Executar uma nova tarefa com base apenas em instruções verbais ou escritas e depois descrevê-la a outros para que possam reproduzi-la é uma pedra angular da comunicação humana que continua a resistir à inteligência artificial.

Uma equipe da Universidade de Genebra (UNIGE) modelou com sucesso uma rede neural artificial capaz dessa capacidade cognitiva. Depois de aprender e realizar uma série de tarefas básicas, esta IA foi capaz de fornecer uma descrição linguística delas à IA “irmã”, que então as executou.

READ  Uma inovadora vela solar de fissão financiada pela NASA pode levar a ciência a novos destinos emocionantes

Estes resultados promissores, especialmente no que diz respeito à robótica, foram publicados em Neurociência normal.

Na primeira fase da experiência, os neurocientistas treinaram esta rede para imitar a área de Wernicke, a parte do nosso cérebro que nos permite perceber e interpretar a linguagem. Crédito: Notícias de Neurociências

Executar uma nova tarefa sem treinamento prévio, baseada apenas em instruções verbais ou escritas, é uma habilidade exclusivamente humana. Além disso, uma vez aprendida a tarefa, somos capazes de descrevê-la para que outra pessoa possa reproduzi-la.

Esta dupla capacidade distingue-nos de outras espécies que, para aprender uma nova tarefa, necessitam de inúmeras experiências acompanhadas de sinais de reforço positivos ou negativos, sem serem capazes de comunicá-los aos seus pares.

Um subcampo da inteligência artificial (IA) – processamento de linguagem natural – procura recriar esta capacidade humana, utilizando máquinas que compreendem e respondem a dados de áudio ou texto. Esta tecnologia é baseada em redes neurais artificiais inspiradas em nossos neurônios biológicos e na forma como os sinais elétricos são transmitidos entre si no cérebro.

No entanto, os cálculos neurais que tornariam possível o feito cognitivo descrito acima ainda são pouco compreendidos.

“Atualmente, os agentes conversacionais que utilizam IA podem combinar informações linguísticas para produzir um texto ou uma imagem. Mas, até onde sabemos, ainda não são capazes de traduzir instruções verbais ou escritas em ações sensório-motoras, muito menos explicá-las a outra IA, de modo que isso do que reproduzi-los”, explica Alexandre Puget, professor titular do Departamento de Neurociências Básicas da Faculdade de Medicina da UNIGE.

Cérebro modelo

O pesquisador e sua equipe conseguiram desenvolver um modelo neural artificial com essa dupla capacidade, ainda que com treinamento prévio. '

“Começamos com um modelo existente de neurônios artificiais, o S-Bert, que contém 300 milhões de neurônios e foi pré-treinado para compreender a linguagem. Nós o conectamos a outra rede mais simples, de alguns milhares de neurônios”, explica Reidar Reifland, PhD. estudante do Departamento de Neurociências Básicas da Faculdade de Medicina da UNIGE e primeiro autor do estudo.

READ  Uma possível nova chuva de meteoros de um cometa esmaga os cientistas

Na primeira fase da experiência, os neurocientistas treinaram esta rede para imitar a área de Wernicke, a parte do nosso cérebro que nos permite perceber e interpretar a linguagem. Na segunda etapa, a rede foi treinada para reproduzir a área de Broca, que sob influência da área de Wernicke é responsável pela produção e pronúncia das palavras. Todo o processo foi realizado em laptops tradicionais. Instruções escritas em inglês foram então enviadas à Amnistia Internacional.

Por exemplo: indicar o local – esquerdo ou direito – onde o estímulo é percebido; Resposta na direção oposta ao estímulo. Ou, de forma mais complexa, entre dois estímulos visuais com uma ligeira diferença de contraste, que parece mais brilhante. Os cientistas avaliaram então os resultados de um modelo que simulava a intenção de movimento, ou neste caso, a deixa.

Uma vez aprendidas essas tarefas, a rede foi capaz de descrevê-las para uma segunda rede – uma cópia da primeira rede – para que pudesse reproduzi-las. “Até onde sabemos, esta é a primeira vez que dois sistemas de inteligência artificial conseguem comunicar entre si de uma forma puramente linguística”, afirma Alexandre Pouget, que liderou a investigação.

Para os humanos no futuro

Este modelo abre novos horizontes para a compreensão da interação entre linguagem e comportamento. Isto é particularmente promissor para o setor da robótica, onde o desenvolvimento de tecnologias que permitam às máquinas comunicar entre si é uma questão importante.

''A rede que desenvolvemos é muito pequena. Nada impede agora o desenvolvimento de redes mais complexas, nesta base, que possam ser integradas em robôs humanóides capazes de nos compreender, mas também uns aos outros.

Sobre estas notícias de pesquisa de IA

autor: Antoine Guinot
fonte: Universidade de Genebra
comunicação: Antoine Guénot – Universidade de Genebra
foto: Imagem creditada ao Neuroscience News

READ  Astrônomo diz que novas imagens do Telescópio Espacial Webb 'quase o fizeram chorar'

Pesquisa original: Acesso livre.
Instruções de linguagem natural induzem generalização sintática em redes neurais“Por Alexandre Puget et al. Neurociência normal


um resumo

Instruções de linguagem natural induzem generalização sintática em redes neurais

Uma das realizações cognitivas humanas fundamentais é interpretar instruções linguísticas para realizar novas tarefas sem experiência explícita de tarefas. No entanto, os cálculos neurais que podem ser usados ​​para conseguir isso ainda são pouco compreendidos. Usamos avanços no processamento de linguagem natural para criar um modelo neural de generalização baseado em instruções linguísticas.

Os modelos são treinados em um conjunto de tarefas psicofísicas comuns e recebem instruções incorporadas em um modelo de linguagem pré-treinado. Nossos melhores modelos podem realizar uma tarefa sem precedentes com um desempenho médio correto de 83% baseado apenas em instruções linguísticas (ou seja, aprendizagem zero).

Descobrimos que a linguagem suporta representações sensório-motoras, de modo que atividades de tarefas inter-relacionadas compartilham uma arquitetura comum com representações semânticas de instruções, permitindo que a linguagem indique a combinação apropriada de habilidades praticadas em ambientes não visuais.

Mostramos como este modelo gera uma descrição linguística de uma nova tarefa definida usando apenas feedback motor, que pode posteriormente orientar um modelo parceiro para realizar a tarefa.

Nossos modelos fazem várias previsões testáveis ​​experimentalmente que explicam como a informação linguística é representada para facilitar a cognição flexível e geral no cérebro humano.