opção
Lar
Notícias
O processamento de dados em lote é muito lento para a IA em tempo real: como o Apache Airflow 3.0 de código aberto resolve o desafio com a orquestração de dados orientada por eventos

O processamento de dados em lote é muito lento para a IA em tempo real: como o Apache Airflow 3.0 de código aberto resolve o desafio com a orquestração de dados orientada por eventos

8 de Maio de 2025
66

O processamento de dados em lote é muito lento para a IA em tempo real: como o Apache Airflow 3.0 de código aberto resolve o desafio com a orquestração de dados orientada por eventos

Mover dados de várias fontes para o local apropriado para aplicativos de IA não é uma tarefa pequena. É aqui que as ferramentas de orquestração de dados como o Apache Airflow entram em jogo, tornando o processo mais suave e mais eficiente.

A comunidade Apache Airflow acaba de lançar sua atualização mais significativa em anos com o lançamento da versão 3.0. Isso marca a primeira grande atualização em quatro anos, após melhorias constantes na série 2.x, incluindo as versões 2.9 e 2.10 em 2024, que se concentraram fortemente nos aprimoramentos de IA.

O Apache Airflow se tornou a ferramenta preferida para os engenheiros de dados, cimentando seu lugar como a plataforma de orquestração de fluxo de trabalho de código aberto superior. Com mais de 3.000 colaboradores e uso generalizado entre empresas da Fortune 500, fica claro por que é tão popular. Existem também vários serviços comerciais construídos sobre ele, como astrônomo Astro, Google Cloud Composer, Amazon Gerenciou Work Flows for Apache Airflow (MWAA) e o fluxo de ar gerenciado por fábrica de dados do Microsoft Azure, para citar alguns.

À medida que as empresas lidam com a coordenação de fluxos de trabalho de dados em diferentes sistemas, nuvens e cargas de trabalho de IA cada vez mais, a necessidade de soluções robustas cresce. O Apache Airflow 3.0 etapas para atender a essas necessidades corporativas com uma revisão arquitetônica que promete aprimorar como as organizações desenvolvem e implantam aplicativos de dados.

"Para mim, o Airflow 3 é um novo começo, uma base para um conjunto de capacidades muito mais amplo", Vikram Koka, membro do Apache Airflow PMC (Comitê de Gerenciamento de Projetos) e diretor de estratégia do astrônomo, compartilhou uma entrevista exclusiva ao Venturebeat. "Este é quase um refator completo com base no que as empresas nos disseram que precisavam para o próximo nível de adoção de missão crítica".

A complexidade dos dados corporativos mudou as necessidades de orquestração de dados

Com as empresas dependem cada vez mais de dados para a tomada de decisão, a complexidade dos fluxos de trabalho de dados disparou. As empresas agora concutulam a pipelines complexos que abrangem vários ambientes em nuvem, diversas fontes de dados e cargas de trabalho de IA cada vez mais sofisticadas.

O Airflow 3.0 é adaptado para atender a essas necessidades corporativas em evolução. Ao contrário de seus antecessores, essa versão se afasta de uma estrutura monolítica para um modelo de cliente distribuído, oferecendo maior flexibilidade e segurança. Esta nova arquitetura capacita as empresas para:

  1. Execute tarefas em vários ambientes de nuvem.
  2. Implementar controles de segurança detalhados.
  3. Apoie uma variedade de linguagens de programação.
  4. Ativar implantações verdadeiras de várias nuvens.

O suporte expandido da linguagem no Airflow 3.0 é particularmente digno de nota. Enquanto as versões anteriores foram focadas principalmente em Python, o novo lançamento agora suporta nativamente várias linguagens de programação. Airflow 3.0 atualmente suporta Python e Go, com planos de incluir Java, TypeScript e Rust. Essa flexibilidade significa que os engenheiros de dados podem usar sua linguagem de programação preferida, tornando o desenvolvimento e a integração do fluxo de trabalho mais suave.

Recursos orientados a eventos transformam fluxos de trabalho de dados

Tradicionalmente, o fluxo de ar tem sido ótimo no processamento de lote programado, mas as empresas agora estão exigindo recursos de processamento de dados em tempo real. Airflow 3.0 Pasta para atender a essa demanda.

"Uma mudança importante no fluxo de ar 3 é o que chamamos de agendamento orientado a eventos", explicou Koka.

Em vez de executar um trabalho de processamento de dados em um cronograma definido, como a cada hora, o fluxo de ar agora pode acionar o trabalho quando ocorre um evento específico, como quando um arquivo de dados é carregado em um balde do Amazon S3 ou uma mensagem aparece no Apache Kafka. Esse agendamento orientado a eventos ponta a lacuna entre as ferramentas tradicionais de ETL (extrair, transformar e carregar) e estruturas de processamento de fluxos, como o Apache Flink ou o Apache Spark Structure Structering, permitindo que as organizações gerenciem os fluxos de trabalho agendados e acionados por eventos com uma única camada de orquestração.

O fluxo de ar acelerará a execução de inferência da IA ​​corporativa e composto ai

A introdução da orquestração de dados orientada por eventos também aumentará a capacidade do Airflow de suportar a rápida execução de inferência de IA.

Koka forneceu um exemplo de uso de inferência em tempo real para serviços profissionais, como o rastreamento legal de tempo. Nesse cenário, o fluxo de ar ajuda a coletar dados brutos de fontes como calendários, e -mails e documentos. Um grande modelo de linguagem (LLM) transforma esses dados não estruturados em informações estruturadas. Outro modelo pré-treinado pode analisar esses dados de rastreamento de tempo estruturado, determinar se o trabalho é faturável e atribuir códigos e taxas de cobrança apropriados.

Koka refere -se a isso como um sistema de IA composto - um fluxo de trabalho que combina diferentes modelos de IA para concluir de maneira eficiente e inteligente uma tarefa complexa. A arquitetura orientada a eventos do Airflow 3.0 torna viável esse tipo de processo de inferência em tempo real e em várias etapas em vários casos de uso corporativo.

A IA composta, um conceito definido pela primeira vez pelo Centro de Pesquisa de Inteligência Artificial de Berkeley em 2024, difere da IA ​​agêntica. Koka explicou que, embora o Agentic AI permita a tomada de decisão autônoma de IA, a IA composta segue os fluxos de trabalho predefinidos que são mais previsíveis e confiáveis ​​para aplicativos de negócios.

Jogando bola com fluxo de ar, como os Texas Rangers parecem se beneficiar

O time de beisebol da Major League do Texas Rangers está entre os muitos usuários de fluxo de ar. Oliver Dykstra, um engenheiro de dados de pilha completa do Texas Rangers Baseball Club, compartilhou com a VentureBeat que a equipe usa o fluxo de ar, hospedado na plataforma Astro do astrônomo, como o 'centro nervoso' de suas operações de dados de beisebol. Todo o desenvolvimento de jogadores, contratos, análises e dados do jogo são orquestrados através do fluxo de ar.

"Estamos ansiosos para atualizar para o fluxo de ar 3 e seus aprimoramentos para a programação, observabilidade e linhagem de dados orientados a eventos", disse Dykstra. "Como já contamos com o fluxo de ar para gerenciar nossos pipelines críticos de IA/ML, a eficiência e a confiabilidade adicionais do fluxo de ar 3 ajudarão a aumentar a confiança e a resiliência desses produtos de dados em toda a nossa organização".

O que isso significa para a adoção da IA ​​corporativa

Para os tomadores de decisão técnicos que avaliam sua estratégia de orquestração de dados, o Airflow 3.0 oferece benefícios tangíveis que podem ser implementados gradualmente.

A primeira etapa é avaliar os fluxos de trabalho de dados atuais que podem se beneficiar dos novos recursos orientados a eventos. As organizações podem identificar pipelines de dados atualmente usando trabalhos programados, mas seriam mais eficientes com os gatilhos baseados em eventos. Essa mudança pode reduzir significativamente a latência de processamento e eliminar operações desnecessárias de votação.

Em seguida, os líderes de tecnologia devem revisar seus ambientes de desenvolvimento para verificar se o suporte de linguagem expandido do Airflow pode ajudar a consolidar ferramentas de orquestração fragmentada. As equipes atualmente gerenciando ferramentas de orquestração separadas para diferentes ambientes de idiomas podem começar a planejar uma estratégia de migração para otimizar sua pilha de tecnologia.

Para empresas na vanguarda da implementação da IA, o Airflow 3.0 representa um componente de infraestrutura crucial que aborda um desafio importante na adoção da IA: orquestrando fluxos de trabalho de IA complexos e multi-estágios em uma escala corporativa. A capacidade da plataforma de coordenar sistemas compostos de IA pode ajudar as organizações a ir além da prova de conceito para a implantação da IA ​​em toda a empresa, garantindo governança, segurança e confiabilidade adequadas.

Artigo relacionado
Julius AI : 계산 인텔리전스로 데이터 분석을 혁신합니다 Julius AI : 계산 인텔리전스로 데이터 분석을 혁신합니다 오늘날의 데이터 중심 세계에서 데이터 분석은 정보에 입각 한 결정을 내리는 데 중추적 인 역할을합니다. 그러나 많은 사람들에게 프로세스는 여전히 어려움을 겪고 시간이 많이 걸립니다. 데이터 분석을 탈취하고 사용자 수준의 통찰력을 가진 사용자에게 권한을 부여하도록 설계된 혁신적인 계산 AI 도구 인 Julius AI를 입력하십시오.
인공지능 기반 주식 분석: 기술적 분석 자동화 인공지능 기반 주식 분석: 기술적 분석 자동화 AI를 활용한 주식 시장 분석의 힘을 해방시키기인공지능을 활용하여 더 똑똑한 투자 결정을 내릴 수 있는 방법을 궁금해 본 적이 있으신가요? AI 기반 대시보드를 사용하여 기술적 주식 분석을 자동화하는 이 포괄적인 가이드로 들어가 보세요. 당신이 데이 트레이더이든 장기 투자자이든, 트레이딩 전략을 향상시킬 수 있는 실용적인
Vizly: 박사 연구자를 위한 종합 인공지능 데이터 분석 도구 Vizly: 박사 연구자를 위한 종합 인공지능 데이터 분석 도구 데이터 분석은 박사 연구의 필수 요소지만, 그것을 어렵게 느껴질 필요는 없습니다. 코드 학습의 높은 난이도를 넘어서 바로 데이터에서 통찰력을 얻을 수 있다면 어떨까요? 그것이 AI 기반 도구인 Vizly가 등장하는 이유이며, 데이터 분석 과정을 단순화하겠다고 약속합니다. 이번 종합 리뷰에서는 Vizly의 기능, 사용성,
Comentários (5)
0/200
KevinScott
KevinScott 9 de Maio de 2025 à0 00:00:00 GMT

Apache Airflow 3.0 has really sped up my data processing for AI! The event-driven approach is a game-changer. It's not perfect, though; the learning curve is steep. But once you get the hang of it, it's super efficient. 🚀

BillyThomas
BillyThomas 9 de Maio de 2025 à0 00:00:00 GMT

Apache Airflow 3.0 realmente ha acelerado mi procesamiento de datos para IA. El enfoque basado en eventos es un cambio de juego. No es perfecto, la curva de aprendizaje es empinada. Pero una vez que lo dominas, es súper eficiente. 🚀

RobertMartin
RobertMartin 9 de Maio de 2025 à0 00:00:00 GMT

Apache Airflow 3.0は、私のAI向けデータ処理を本当にスピードアップしました!イベント駆動のアプローチはゲームチェンジャーです。ただし、完璧ではありません。学習曲線が急です。でも、一度慣れれば超効率的です。🚀

PaulGonzalez
PaulGonzalez 8 de Maio de 2025 à0 00:00:00 GMT

Apache Airflow 3.0 hat meinen Datenverarbeitungsprozess für KI wirklich beschleunigt! Der ereignisgesteuerte Ansatz ist ein Game-Changer. Es ist nicht perfekt; die Lernkurve ist steil. Aber sobald man es beherrscht, ist es super effizient. 🚀

RobertRoberts
RobertRoberts 9 de Maio de 2025 à0 00:00:00 GMT

Apache Airflow 3.0 thực sự đã tăng tốc quá trình xử lý dữ liệu của tôi cho AI! Cách tiếp cận dựa trên sự kiện là một bước đột phá. Tuy nhiên, nó không hoàn hảo; đường cong học tập rất dốc. Nhưng khi bạn làm quen được, nó cực kỳ hiệu quả. 🚀

De volta ao topo
OR