Apple lança modelos de IA de código aberto que rodam no dispositivo

A Apple lançou hoje vários modelos de linguagem grande (LLMs) de código aberto projetados para serem executados no dispositivo, e não por meio de servidores em nuvem. Chamados de OpenELM (Open Source Efficient Language Models), os programas LLM estão disponíveis em A peça central do rosto que abraçauma comunidade para compartilhar código de IA.

Como mostrado no documento branco [PDF]Existem oito modelos OpenELM no total, quatro dos quais são pré-treinados usando a biblioteca CoreNet e quatro são modelos ajustados por instrução. A Apple usa uma estratégia de escalonamento de camadas que visa melhorar a precisão e a eficiência.

A Apple forneceu código, registros de treinamento e várias versões, em vez de apenas o modelo de treinamento final, e os pesquisadores por trás do projeto esperam que isso leve a um progresso mais rápido e a “resultados mais confiáveis” no campo da IA de linguagem natural.

OpenELM, um modelo de linguagem aberta e em evolução. OpenELM usa uma estratégia de escalonamento de camada para alocar parâmetros com eficiência dentro de cada camada do modelo do transformador, resultando em maior precisão. Por exemplo, com um orçamento de parâmetros de cerca de 1 bilhão de parâmetros, o OpenELM mostra uma melhoria de 2,36% na precisão em relação ao OLMo, ao mesmo tempo que requer 2x menos tokens para pré-treinamento.

Rompendo com práticas anteriores que fornecem apenas pesos de modelo, código de inferência e pré-treinamento em conjuntos de dados privados, nossa versão inclui a estrutura completa para treinamento e avaliação do modelo de linguagem em conjuntos de dados disponíveis publicamente, incluindo logs de treinamento, vários pontos de verificação e pré- pontos. Configurações de treinamento.

A Apple afirma que está lançando modelos OpenELM para “capacitar e enriquecer a comunidade de pesquisa aberta” com modelos de linguagem modernos. O compartilhamento de modelos de código aberto oferece aos pesquisadores uma maneira de investigar riscos, dados e preconceitos de modelos. Desenvolvedores e empresas podem usar os modelos como estão ou fazer modificações neles.

READ O monitor de jogos LG OLED de 27 polegadas está à venda por US$ 340

O compartilhamento aberto de informações tornou-se uma ferramenta importante para a Apple recrutar engenheiros, cientistas e especialistas de ponta, pois oferece oportunidades para trabalhos de pesquisa que normalmente não seriam publicados de acordo com as políticas de confidencialidade da Apple.

A Apple ainda não trouxe esses tipos de recursos de IA para seus dispositivos, mas espera-se que o iOS 18 inclua uma série de novos recursos de IA, e rumores sugerem que a Apple planeja executar seus próprios modelos de linguagem grande no dispositivo para fins de privacidade.

Hugo Fernandes

Hugo Fernandes é autor do Atibaia Connection e cobre notícias, política, negócios, tecnologia, esportes, entretenimento e estilo de vida. Seu foco é oferecer informações claras, atuais e relevantes, ajudando os leitores a acompanhar os principais acontecimentos e temas de interesse do dia a dia.

JOVI prepara evento no Brasil e pode lançar a aguardada linha X300 focada em fotografia móvel

WhatsApp testa nova animação para mensagens no Android em versão beta

Google Play Store ganha novo visual e facilita acesso a apps em promoção

JOVI prepara evento no Brasil e pode lançar a aguardada linha X300 focada em fotografia móvel

Açúcar associado à origem da vida é detectado no espaço pela primeira vez, dizem cientistas

Conab passa a projetar safra recorde de milho no Brasil em 2025/26

Epic Games libera dois jogos gratuitos para PC; veja como resgatar os títulos

Deixe um comentário Cancelar resposta

More Stories

JOVI prepara evento no Brasil e pode lançar a aguardada linha X300 focada em fotografia móvel

WhatsApp testa nova animação para mensagens no Android em versão beta

Google Play Store ganha novo visual e facilita acesso a apps em promoção

You may have missed

JOVI prepara evento no Brasil e pode lançar a aguardada linha X300 focada em fotografia móvel

Açúcar associado à origem da vida é detectado no espaço pela primeira vez, dizem cientistas

Conab passa a projetar safra recorde de milho no Brasil em 2025/26

Epic Games libera dois jogos gratuitos para PC; veja como resgatar os títulos