Red Hat em modelos de idiomas abertos e pequenos para a IA prática e responsável
24 de Abril de 2025
JasonRoberts
0
Influências geopolíticas no desenvolvimento e uso da IA
À medida que os eventos globais continuam a moldar nosso mundo, é inevitável que eles impactem o setor de tecnologia, particularmente o mercado de IA. Essa influência se estende à forma como a IA é desenvolvida, suas metodologias e sua aplicação nas empresas. O cenário atual da IA é uma mistura de excitação e ceticismo, com alguns abraçando seu potencial, enquanto outros permanecem cautelosos devido aos seus estágios iniciais de desenvolvimento.
Os tradicionais modelos de idiomas de circuito fechado (LLMS), como os de provedores conhecidos, estão enfrentando concorrência de modelos mais novos e mais abertos, como Llama, Deepseek e Ernie X1, do Baidu. Por outro lado, o desenvolvimento de código aberto oferece transparência e a oportunidade de contribuição da comunidade, alinhando-se com o conceito de "IA responsável". Essa abordagem considera impactos ambientais, ética de uso, fontes de dados de aprendizado e questões relacionadas à soberania de dados, idioma e política.
A Red Hat, uma empresa conhecida por seu bem-sucedido modelo de negócios de código aberto, está interessado em aplicar sua abordagem colaborativa e transparente à IA. Em uma conversa recente com Julio Guijarro, a CTO da Red Hat for EMEA, discutimos sua estratégia para aproveitar o poder da IA generativa de uma maneira que agregue valor às empresas de forma responsável e sustentável.
A necessidade de educação e transparência
Julio enfatizou a necessidade de mais educação em torno da IA, apontando que sua natureza complexa geralmente o torna uma "caixa preta" para muitos. "O funcionamento interno da IA, profundamente enraizado em ciências e matemática complexas, permanecem amplamente desconhecidos", disse ele. "Essa falta de transparência é exacerbada quando a IA é desenvolvida em ambientes fechados".
Desafios adicionais incluem a sub-representação de certos idiomas, preocupações com a soberania de dados e questões de confiança. Julio observou: "Os dados são os ativos mais valiosos de uma organização, e as empresas devem estar cientes dos riscos de expor dados confidenciais a plataformas públicas com políticas de privacidade variadas".
Abordagem de Red Hat para AI
A resposta da Red Hat à demanda global por IA se concentra em fornecer benefícios aos usuários finais, abordando as dúvidas e limitações associadas aos serviços tradicionais de IA. Julio destacou o potencial de modelos de idiomas pequenos (SLMs) como uma solução. Esses modelos podem ser executados localmente ou em nuvens híbridas usando hardware não especialista e podem acessar dados comerciais locais. Os SLMs são eficientes e específicos de tarefas, exigindo menos recursos que o LLMS.
Uma das principais vantagens do SLMS é a capacidade de se manter atualizado com os dados comerciais em rápida mudança. "Os grandes modelos de linguagem podem ficar obsoletos rapidamente, porque a geração de dados ocorre fora das grandes nuvens, ao lado de seus processos de negócios", explicou Julio.
O custo é outro fator crítico. "As consultas de atendimento ao cliente usando um LLM podem incorrer em custos ocultos significativos", disse Julio. "Antes da IA, as consultas de dados tinham um escopo e custo previsíveis. Com o LLMS, cada interação pode escalar custos porque eles operam em um modelo iterativo. Executar modelos no local permite um maior controle sobre os custos, pois estão ligados à sua infraestrutura, não por taxas por quadro".
Felizmente, as organizações não precisam investir pesadamente em hardware especializado como as GPUs. A Red Hat está trabalhando na otimização de modelos para ser executada em hardware padrão, concentrando-se nos modelos específicos que as empresas precisam, em vez de processar conjuntos de dados grandes e de uso geral em todas as consultas.
A importância de modelos menores e localizados
Ao usar e referenciar dados locais, os resultados podem ser adaptados a necessidades específicas. Julio referenciou projetos em regiões como os mundos de língua árabe e portuguesa, que não são bem servidos pelo LLMS centrado em inglês.
Existem desafios práticos com os LLMs, incluindo problemas de latência que podem afetar aplicativos sensíveis ao tempo ou voltados para o cliente. Manter os recursos e os resultados próximos ao usuário podem mitigar esses problemas.
A confiança é outro aspecto crucial da IA responsável. A Red Hat defende plataformas, ferramentas e modelos abertos para aumentar a transparência e permitir um envolvimento mais amplo da comunidade. "É fundamental para todos", afirmou Julio. "Estamos construindo capacidades para democratizar a IA, não apenas publicando modelos, mas fornecendo ferramentas para os usuários replicarem, sintonizarem e servirem".
A recente aquisição da Red Hat da Magic Neural visa ajudar as empresas a dimensionar a IA com mais facilidade, melhorar o desempenho da inferência e oferecer mais opções na construção e implantação de cargas de trabalho de IA através do projeto VLLM. Além disso, em colaboração com a IBM Research, a Red Hat lançou o InstructLab, abrindo o desenvolvimento da IA para cientistas não-dados que possuem um conhecimento comercial valioso.
O futuro da IA
Embora exista muita especulação sobre a bolha da IA, o Red Hat acredita em um futuro em que a IA é adaptada a casos de uso específicos e permanece de código aberto. Essa abordagem será economicamente viável e acessível a todos. Como Matt Hicks, CEO da Red Hat, afirmou: "O futuro da IA está aberto".

Artigo relacionado
Recupere as horas com automação de gerenciamento de tempo de AI
Lutando com inúmeras listas de tarefas e prazos perdidos? A IA poderia ser sua resposta que você sente que você está se afogando em um mar de tarefas e prazos que continuam deslizando pelos dedos? Em nosso mundo em ritmo acelerado, o tempo é uma mercadoria preciosa, e gerenciá-lo efetivamente pode parecer um impossível
Primeira reunião de gabinete de Trump: uma análise aprofundada do caos
A primeira reunião de gabinete de Donald Trump de seu novo mandato foi tudo menos comum, marcada por uma série de momentos incomuns e uma enxurrada de desinformação que deixou observadores intrigados e preocupados com o estado da economia e a confiança do consumidor. Este artigo mergulha nos momentos -chave do M
Notebooklm do Google agora reúne fontes de pesquisa de graça
O Notebooklm do Google é uma ferramenta fantástica para quem mergulha em um projeto pesado de pesquisa. Normalmente, você precisaria caçar e adicionar manualmente todas as suas fontes, mas agora, o Notebooklm está definido para otimizar seu processo de pesquisa ainda mais, fazendo o levantamento pesado para você. Na quarta -feira, o Google Unveiled
Comentários (0)
0/200






Influências geopolíticas no desenvolvimento e uso da IA
À medida que os eventos globais continuam a moldar nosso mundo, é inevitável que eles impactem o setor de tecnologia, particularmente o mercado de IA. Essa influência se estende à forma como a IA é desenvolvida, suas metodologias e sua aplicação nas empresas. O cenário atual da IA é uma mistura de excitação e ceticismo, com alguns abraçando seu potencial, enquanto outros permanecem cautelosos devido aos seus estágios iniciais de desenvolvimento.
Os tradicionais modelos de idiomas de circuito fechado (LLMS), como os de provedores conhecidos, estão enfrentando concorrência de modelos mais novos e mais abertos, como Llama, Deepseek e Ernie X1, do Baidu. Por outro lado, o desenvolvimento de código aberto oferece transparência e a oportunidade de contribuição da comunidade, alinhando-se com o conceito de "IA responsável". Essa abordagem considera impactos ambientais, ética de uso, fontes de dados de aprendizado e questões relacionadas à soberania de dados, idioma e política.
A Red Hat, uma empresa conhecida por seu bem-sucedido modelo de negócios de código aberto, está interessado em aplicar sua abordagem colaborativa e transparente à IA. Em uma conversa recente com Julio Guijarro, a CTO da Red Hat for EMEA, discutimos sua estratégia para aproveitar o poder da IA generativa de uma maneira que agregue valor às empresas de forma responsável e sustentável.
A necessidade de educação e transparência
Julio enfatizou a necessidade de mais educação em torno da IA, apontando que sua natureza complexa geralmente o torna uma "caixa preta" para muitos. "O funcionamento interno da IA, profundamente enraizado em ciências e matemática complexas, permanecem amplamente desconhecidos", disse ele. "Essa falta de transparência é exacerbada quando a IA é desenvolvida em ambientes fechados".
Desafios adicionais incluem a sub-representação de certos idiomas, preocupações com a soberania de dados e questões de confiança. Julio observou: "Os dados são os ativos mais valiosos de uma organização, e as empresas devem estar cientes dos riscos de expor dados confidenciais a plataformas públicas com políticas de privacidade variadas".
Abordagem de Red Hat para AI
A resposta da Red Hat à demanda global por IA se concentra em fornecer benefícios aos usuários finais, abordando as dúvidas e limitações associadas aos serviços tradicionais de IA. Julio destacou o potencial de modelos de idiomas pequenos (SLMs) como uma solução. Esses modelos podem ser executados localmente ou em nuvens híbridas usando hardware não especialista e podem acessar dados comerciais locais. Os SLMs são eficientes e específicos de tarefas, exigindo menos recursos que o LLMS.
Uma das principais vantagens do SLMS é a capacidade de se manter atualizado com os dados comerciais em rápida mudança. "Os grandes modelos de linguagem podem ficar obsoletos rapidamente, porque a geração de dados ocorre fora das grandes nuvens, ao lado de seus processos de negócios", explicou Julio.
O custo é outro fator crítico. "As consultas de atendimento ao cliente usando um LLM podem incorrer em custos ocultos significativos", disse Julio. "Antes da IA, as consultas de dados tinham um escopo e custo previsíveis. Com o LLMS, cada interação pode escalar custos porque eles operam em um modelo iterativo. Executar modelos no local permite um maior controle sobre os custos, pois estão ligados à sua infraestrutura, não por taxas por quadro".
Felizmente, as organizações não precisam investir pesadamente em hardware especializado como as GPUs. A Red Hat está trabalhando na otimização de modelos para ser executada em hardware padrão, concentrando-se nos modelos específicos que as empresas precisam, em vez de processar conjuntos de dados grandes e de uso geral em todas as consultas.
A importância de modelos menores e localizados
Ao usar e referenciar dados locais, os resultados podem ser adaptados a necessidades específicas. Julio referenciou projetos em regiões como os mundos de língua árabe e portuguesa, que não são bem servidos pelo LLMS centrado em inglês.
Existem desafios práticos com os LLMs, incluindo problemas de latência que podem afetar aplicativos sensíveis ao tempo ou voltados para o cliente. Manter os recursos e os resultados próximos ao usuário podem mitigar esses problemas.
A confiança é outro aspecto crucial da IA responsável. A Red Hat defende plataformas, ferramentas e modelos abertos para aumentar a transparência e permitir um envolvimento mais amplo da comunidade. "É fundamental para todos", afirmou Julio. "Estamos construindo capacidades para democratizar a IA, não apenas publicando modelos, mas fornecendo ferramentas para os usuários replicarem, sintonizarem e servirem".
A recente aquisição da Red Hat da Magic Neural visa ajudar as empresas a dimensionar a IA com mais facilidade, melhorar o desempenho da inferência e oferecer mais opções na construção e implantação de cargas de trabalho de IA através do projeto VLLM. Além disso, em colaboração com a IBM Research, a Red Hat lançou o InstructLab, abrindo o desenvolvimento da IA para cientistas não-dados que possuem um conhecimento comercial valioso.
O futuro da IA
Embora exista muita especulação sobre a bolha da IA, o Red Hat acredita em um futuro em que a IA é adaptada a casos de uso específicos e permanece de código aberto. Essa abordagem será economicamente viável e acessível a todos. Como Matt Hicks, CEO da Red Hat, afirmou: "O futuro da IA está aberto".



5 etapas fáceis para recuperar sua privacidade de dados on -line - comece hoje
Tweaks to Us Data Centers podem desbloquear 76 GW de nova capacidade de energia O órgão de IA do Reino Unido renomeia o Security Institute, Signs Mou com antropia Nvidia revela as GPUs de próxima geração: Blackwell Ultra, Vera Rubin, Feynman Telli, um ex-aluno da YC, protege o financiamento pré-semente para agentes de voz de IA








