O chatbot ChatGPT amplamente utilizado foi projetado para criar texto digital, desde poesia a trabalhos de pesquisa e programas de computador. Mas quando uma equipe de pesquisadores de inteligência artificial da empresa de chips de computador Nvidia colocou as mãos na tecnologia subjacente do chatbot, eles perceberam que ele poderia fazer muito mais.
Em poucas semanas, eles o ensinaram a jogar Minecraft, um dos videogames mais populares do mundo. No mundo digital do Minecraft, aprendi a nadar, colher plantas, caçar porcos, extrair ouro e construir casas.
“Ele pode entrar no mundo do Minecraft e explorar por conta própria, coletar materiais por conta própria e melhorar todos os tipos de habilidades”, disse Linxi Fan, pesquisador sênior da Nvidia, conhecido como Jim.
O projeto Este foi um sinal precoce de que os principais investigadores de IA do mundo estão a transformar os chatbots num novo tipo de sistema autónomo denominado agente de IA. Esses agentes podem fazer mais do que apenas conversar. Eles podem usar aplicativos de software, sites e outras ferramentas online, incluindo planilhas, calendários online, sites de viagens e muito mais.
Com o tempo, dizem muitos investigadores, os agentes de IA poderão tornar-se muito mais sofisticados, poderão substituir trabalhadores de escritório e automatizar quase todas as funções administrativas.
“É uma enorme oportunidade de negócio, potencialmente valendo trilhões de dólares”, disse Jeff Clune, professor de ciência da computação na Universidade da Colúmbia Britânica, que trabalhou anteriormente nesse tipo de tecnologia como pesquisador na OpenAI, uma startup de São Francisco que construiu a tecnologia. Bate-papoGPT. “Isso tem uma enorme vantagem – e sérias consequências – para a sociedade.”
Agente da Nvidia jogando. Agentes semelhantes podem agendar reuniões, editar arquivos, analisar dados e criar gráficos de barras multicoloridos. A ideia é que esses sistemas automatizados atuem eventualmente como assistentes pessoais capazes de lidar com uma ampla gama de tarefas online.
Os agentes de hoje são limitados e não conseguem organizar exatamente a sua vida. O ChatGPT pode pesquisar no site de viagens Expedia voos para Nova York, mas você ainda precisa fazer a reserva sozinho.
Esta tecnologia, à medida que os investigadores a melhorem, poderá tornar os trabalhadores de escritório e os consumidores mais eficientes. Também poderia mudar a natureza dos videogames, proporcionando uma nova onda de bots com os quais os jogadores podem jogar e conversar.
GPT-4, a tecnologia que alimenta o ChatGPT, é o que os pesquisadores chamam de grande modelo de linguagem. É um sistema de inteligência artificial que aprende habilidades analisando grandes quantidades de dados.
Nos últimos meses, essa tecnologia impressionou centenas de milhões de pessoas com a maneira como cria e-mails, escreve discursos e canta sobre quase todos os assuntos. Mas sua habilidade mais importante pode ser o talento para escrever programas de computador.
Ele pode criar instantaneamente um programa que desenha um unicórnio ou coloca flocos de neve digitalmente na tela de seu laptop. Os desenvolvedores de software profissionais podem encomendar códigos que podem ser integrados em programas maiores, incluindo tudo, desde aplicativos de mídia social até mecanismos de pesquisa. Mas isto é apenas parte do que esta tecnologia pode fazer. Também pode gerar código de computador que pode ser usado em outros aplicativos de software e sites.
Foi assim que o Dr. Fan e outros pesquisadores da Nvidia ensinaram ao GPT-4 como jogar Minecraft. “A palavra mais importante aqui é código”, disse Fan. “O código pode agir.”
As pessoas usam aplicativos de software e sites tocando em botões, menus e outras ferramentas gráficas. Os agentes de IA usam aplicativos e sites acessando suas interfaces de programação de aplicativos, ou APIs – o código de software subjacente que lhes permite se comunicar com outros serviços online.
Se você pedir a um agente para enviar um vídeo para a Internet, por exemplo, ele poderá gerar um código chamado interface de programação de aplicativos (API) fornecido pelo YouTube. “Uma API é apenas um texto usado para conversar com uma máquina”, disse Selin Nayhin, pesquisadora que ajuda a executar o projeto de agente autônomo de IA, AutoGPT.
Em teoria, um chatbot pode escrever código para acessar qualquer API na Internet. Mas os chatbots de hoje não são qualificados o suficiente para realizar mais do que tarefas simples. Mesmo que fosse esse o caso, permitir-lhes circular livremente online seria um enorme risco de segurança. Então as empresas começaram pequenas.
Alguns meses depois que a OpenAI revelou o ChatGPT, ela lançou discretamente uma maneira de um chatbot fazer mais do que apenas gerar texto. Depois de instalar vários plug-ins – software que aprimora o que o bot pode fazer – você pode solicitar que ele pesquise voos disponíveis em sites de viagens como o Expedia, obtenha um mapa de sua cidade no Google Earth ou até mesmo converta uma planilha detalhando seus gastos anuais. .. Gráfico de barras multicoloridas.
Por vir com um plugin chamado compilador de código, o ChatGPT pode não apenas escrever código, mas também executá-lo. Isso permitiu que a tecnologia executasse instantaneamente tarefas que não conseguia realizar no passado, incluindo edição de planilhas e conversão de imagens estáticas em vídeos. Google, Microsoft e outras empresas estão explorando tecnologias semelhantes.
“Esses são projetos em que imaginamos a IA trabalhando essencialmente com outra IA em seu nome”, disse Ashley Lawrence, vice-presidente da Microsoft.
Projetos independentes como o AutoGPT estão tentando levar esse tipo de coisa vários passos adiante. A ideia é dar ao sistema objetivos como “criar uma empresa” ou “ganhar algum dinheiro”. Em seguida, procurará maneiras de atingir esse objetivo, fazendo perguntas a si mesmo e conectando-se a outros serviços de Internet.
Hoje isso não funciona tão bem. Sistemas como o AutoGPT tendem a ficar presos em loops intermináveis. Mas pesquisadores como o Dr. Fan estão constantemente trabalhando para melhorar esse tipo de tecnologia na tentativa de torná-la mais útil e confiável.
Outros pesquisadores estão construindo um novo tipo de agente de inteligência artificial projetado para usar ferramentas de software. No verão de 2022, o Dr. Clune fez parte de uma equipe de pesquisadores da OpenAI que construiu um agente capaz disso Use programas de computador tanto quanto uma pessoa usaria – Clique do mouse após clique do mouse, pressionamento de tecla após pressionamento de tecla.
Clune e seus colegas alimentaram o sistema com horas de vídeos online que mostravam pessoas jogando Minecraft. Ao analisar a maneira como as pessoas usam o mouse e o teclado para navegar pelo mundo digital do Minecraft, o sistema aprendeu a rodar o jogo sozinho.
Outras empresas estão construindo, incluindo uma startup chamada Adept Agentes semelhantes Que usa sites como Wikipedia, Redfin e Craigslist e aplicativos de escritório populares de empresas como Salesforce.
Clune diz que esse tipo de agente eventualmente permitirá que a IA use uma gama muito mais ampla de aplicativos de software e sites. Todos terão acesso a um assistente digital que poderá fazer quase tudo na Internet, disse ele. Isso facilitaria a vida, mas também poderia substituir inúmeros empregos.
“Se a IA pode fazer tudo o que podemos fazer, não é apenas substituir tarefas chatas”, disse ele. “Ele substitui todas as tarefas.”
More Stories
O próximo mini drone 4K da DJI cabe na palma da sua mão
Vazamentos revelam o nome e design do suposto dispositivo PS5 Pro
Os jogadores reclamam do longo tempo de matchmaking no PS5 conforme os números do Concord caem