abril 29, 2024

Atibaia Connection

Encontre todos os artigos mais recentes e assista a programas de TV, reportagens e podcasts relacionados ao Brasil

OpenAI lança versão 3 do DALL-E

OpenAI lança versão 3 do DALL-E

OpenAI anunciou a terceira versão de sua plataforma de artes visuais baseada em IA DALL-E, que agora permite aos usuários usar ChatGPT para criar reivindicações e inclui mais opções de segurança.

DALL-E converte prompts de texto em imagens. Mas mesmo o DALL-E 2 errou, muitas vezes ignorando certas palavras. A versão mais recente entende o contexto muito melhor, disseram os pesquisadores da OpenAI.

Uma novidade do DALL-E 3 é a integração com ChatGPT. Com o ChatGPT, ninguém precisa fornecer seus próprios detalhes Roteador para roteamento DALL-E 3; Eles podem simplesmente pedir ao ChatGPT para apresentar um prompt, e o chatbot escreverá um parágrafo (DALL-E funciona melhor com frases mais longas) para o DALL-E seguir 3. Outros usuários ainda podem usar seus próprios prompts se tiverem ideias específicas para DALL-E.

Na demonstração para A beira, Aditya Ramesh, investigador principal e líder da equipe DALL-E, pediu ao ChatGPT que o ajudasse a criar um logotipo para um restaurante de ramen nas montanhas. O ChatGPT então escreveu um prompt mais longo e o DALL-E apresentou quatro opções. Meu favorito era o desenho de uma montanha com coberturas de neve para o ramen, caldo fluindo como uma cachoeira e ovos em conserva no chão como pedras de jardim – embora parecesse mais uma ilustração de algumas guloseimas fofas do que o logotipo de um restaurante tradicional. Essa conexão com o chatbot permite que mais pessoas criem arte de IA porque não precisam ser muito boas em criar prompts, disse OpenAI.

DALL-E foi lançado pela primeira vez em janeiro de 2021, à frente de outras plataformas de arte de IA de texto para imagem da Stability AI e Midjourney. Quando o DALL-E 2 foi lançado em 2022, a OpenAI havia aberto uma lista de espera para controlar quem poderia usar a plataforma após críticas de que o DALL-E poderia criar imagens claras e realistas e mostrou preconceito na criação das imagens. A empresa retirou a lista de espera em setembro do ano passado e abriu o DALL-E 2 ao público.

READ  Revisão do carregador sem fio Tesla com FreePower

Esta nova versão do DALL-E será lançada primeiro para usuários do ChatGPT Plus e ChatGPT Enterprise em outubro, seguida pelo Research Labs e seu serviço API no outono. A OpenAI planeja adiar o lançamento do DALL-E 3, mas não se comprometeu com uma data de lançamento para a versão pública gratuita.

A OpenAI afirma ter concentrado muito trabalho no DALL-E 3 na criação de medidas de segurança robustas para evitar a criação de imagens obscenas ou potencialmente questionáveis. A OpenAI disse que trabalhou com uma equipe vermelha externa – um grupo que tenta intencionalmente quebrar o sistema para testar sua integridade – e contou com classificadores de entrada, um método de ensinar modelos de linguagem a ignorar certas palavras para evitar avisos explícitos ou violentos. O DALL-E 3 também não poderá recriar imagens de figuras públicas – desde que mencionem especificamente o nome.

Sandhini Agarwal, investigadora política da empresa, disse ter “alta confiança” nas suas medidas de segurança, mas explicou que o modelo está em constante melhoria e não é perfeito. O DALL-E 3 foi treinado para se recusar a criar imagens no estilo de artistas vivos, disseram representantes da OpenAI por e-mail. Ao contrário do DALL-E 2 que, quando solicitado, consegue imitar a arte no estilo de determinados artistas.

A OpenAI também permitirá, para evitar ações judiciais, que os artistas optem por não receber suas obras de arte em versões futuras de modelos de IA de texto para imagem. Os criadores podem enviar uma imagem da qual detêm os direitos e solicitar sua remoção em um formulário em seu site. Uma versão futura do DALL-E poderia suprimir resultados semelhantes à imagem e ao estilo do artista. Os artistas processaram os concorrentes do DALL-E, Stability AI e Midjourney, junto com o site de arte DeviantArt, por supostamente usarem seus trabalhos protegidos por direitos autorais para treinar modelos de texto para imagem.

READ  O Google pode ter revelado inadvertidamente a existência de um telefone Pixel como nenhum outro