Option
Heim
Nachricht
Die Verarbeitung von Stapeldaten ist für Echtzeit-KI zu langsam: Wie Open-Source-Airflow 3.0 die Herausforderung mit ereignisgesteuerter Datenorchestrierung löst

Die Verarbeitung von Stapeldaten ist für Echtzeit-KI zu langsam: Wie Open-Source-Airflow 3.0 die Herausforderung mit ereignisgesteuerter Datenorchestrierung löst

8. Mai 2025
66

Die Verarbeitung von Stapeldaten ist für Echtzeit-KI zu langsam: Wie Open-Source-Airflow 3.0 die Herausforderung mit ereignisgesteuerter Datenorchestrierung löst

Das Verschieben von Daten aus verschiedenen Quellen an den geeigneten Ort für AI -Anwendungen ist keine geringe Leistung. Hier werden Datenorchestrierungs -Tools wie Apache Airstrow ins Spiel kommen, wodurch der Prozess reibungsloser und effizienter wird.

Die Apache Airflow Community hat gerade ihr bedeutendes Update seit Jahren mit dem Start von Version 3.0 veröffentlicht. Dies ist das erste große Update seit vier Jahren, nachdem die 2.x -Serie stetig verbessert wurde, einschließlich der Release von 2,9 und 2.10 im Jahr 2024, die sich stark auf KI -Verbesserungen konzentrierten.

Apache Airflow ist zum Anlaufwerk für Dateningenieure geworden und festigt seinen Platz als oberste Open-Source-Workflow-Orchestrierungsplattform. Mit über 3.000 Mitwirkenden und weit verbreiteter Verwendung bei Fortune 500 -Unternehmen ist klar, warum es so beliebt ist. Darüber hinaus basieren mehrere kommerzielle Dienste wie Astronomer Astro, Google Cloud Composer, Amazon Managed Workflows für Apache Airflow (MWAA) und Microsoft Azure Data Factory Managed Airflow, um nur einige zu nennen.

Während sich Unternehmen mit den Koordinierung von Datenworkflows über verschiedene Systeme, Wolken und zunehmend KI -Workloads auseinandersetzen, wächst die Notwendigkeit robuster Lösungen. Apache Airflow 3.0 Schritte, um diese Unternehmensbedürfnisse mit einer architektonischen Überarbeitung zu erfüllen, die verspricht, die Entwicklung und Bereitstellung von Datenanwendungen zu verbessern.

"Für mich ist Airflow 3 ein neuer Anfang, eine Grundlage für eine viel breitere Reihe von Fähigkeiten", Vikram Koka, ein Mitglied des Airflow -PMC (Projektmanagementausschusses) und Chief Strategy Officer bei Astronomer, teilte in einem exklusiven Interview mit Venturebeat. "Dies ist fast ein vollständiger Refaktor, der darauf basiert, was Unternehmen uns mitgeteilt haben, dass sie für die nächste Ebene der missionskritischen Adoption benötigt werden."

Unternehmensdatenkomplexität hat die Datenorchestrierungsanforderungen geändert

Da Unternehmen zunehmend auf Daten zur Entscheidungsfindung angewiesen sind, ist die Komplexität von Datenworkflows in die Höhe geschossen. Unternehmen jonglieren jetzt komplexe Pipelines, die mehrere Cloud -Umgebungen, verschiedene Datenquellen und zunehmend ausgefeiltere KI -Workloads umfassen.

Der Airflow 3.0 ist auf diese sich entwickelnden Unternehmensanforderungen zugeschnitten. Im Gegensatz zu seinen Vorgängern wechselt diese Veröffentlichung von einer monolithischen Struktur zu einem verteilten Kundenmodell und bietet eine größere Flexibilität und Sicherheit. Diese neue Architektur befähigt Unternehmen:

  1. Führen Sie Aufgaben in mehreren Cloud -Umgebungen aus.
  2. Detaillierte Sicherheitskontrollen implementieren.
  3. Unterstützen Sie eine Vielzahl von Programmiersprachen.
  4. Aktivieren Sie echte Multi-Cloud-Bereitstellungen.

Die erweiterte Sprachunterstützung in Airflow 3.0 ist besonders bemerkenswert. Während frühere Versionen hauptsächlich pythonorientiert waren, unterstützt die neue Veröffentlichung nun mehrere Programmiersprachen. Airflow 3.0 unterstützt derzeit Python und Go mit den Plänen, Java, Typscript und Rost zu enthalten. Diese Flexibilität bedeutet, dass Dateningenieure ihre bevorzugte Programmiersprache verwenden können, wodurch Workflow -Entwicklung und Integration reibungsloser werden können.

Ereignisgesteuerte Funktionen transformieren Datenworkflows

Traditionell war der Luftstrom in der geplanten Stapelverarbeitung großartig, aber Unternehmen fordern nun Echtzeit-Datenverarbeitungsfunktionen. Luftstrom 3.0 Schritte, um diese Nachfrage zu befriedigen.

"Eine wichtige Änderung des Airflow 3 ist das, was wir als ereignisgesteuerte Planung bezeichnen", erklärte Koka.

Anstatt einen Datenverarbeitungsjob in einem festgelegten Zeitplan auszuführen, wie jede Stunde, kann der Air -Flow nun den Job auslösen, wenn ein bestimmtes Ereignis auftritt, z. Diese ereignisgesteuerte Planung überbrückt die Lücke zwischen herkömmlichen ETL-Tools (Extrakt-, Transformations- und Lade-) Tools und Stream-Verarbeitungs-Frameworks wie Apache Flink oder Apache Spark Structured Streaming, mit der Unternehmen sowohl geplante als auch ereignisgestützte Workflows mit einer einzelnen Orchestrierungsschicht verwalten können.

Der Luftstrom beschleunigt die Ausführung der Unternehmens -Inferenz von Unternehmen und die Verbesserung von AI

Die Einführung ereignisgesteuerter Datenorchestrierung wird auch die Fähigkeit von Airflow erhöhen, eine schnelle Ausführung von AI-Inferenz zu unterstützen.

Koka gab ein Beispiel für die Verwendung von Echtzeit-Inferenz für professionelle Dienste wie die Verfolgung von Rechtszeiten. In diesem Szenario hilft Airflow dabei, Rohdaten aus Quellen wie Kalendern, E -Mails und Dokumenten zu sammeln. Ein großes Sprachmodell (LLM) verwandelt diese unstrukturierten Daten dann in strukturierte Informationen. Ein weiteres vorgebildetes Modell kann diese strukturierten Zeitverfolgungsdaten analysieren, feststellen, ob die Arbeiten abrechnungsfähig sind, und entsprechende Abrechnungscodes und -raten zuweisen.

Koka bezeichnet dies als ein zusammengesetzendes KI -System - einen Workflow, der verschiedene KI -Modelle kombiniert, um eine komplexe Aufgabe effizient und intelligent zu erledigen. Die ereignisorientierte Architektur von Airflow 3.0 macht diese Art von Multi-Schritt-Inferenzprozess in Echtzeit in verschiedenen Unternehmensnutzungsfällen durchführbar.

Compound AI, ein Konzept, das erstmals vom Berkeley Artificial Intelligence Research Center im Jahr 2024 definiert wurde, unterscheidet sich von der Agentic AI. Koka erklärte, dass die Agent-KI zwar autonomes KI-Entscheidungsfindung ermöglicht, die zusammengestellte AI vordefinierte Workflows folgt, die für Geschäftsanwendungen vorhersehbarer und zuverlässig sind.

Ball mit Luftstrom spielen, wie die Texas Rangers profitieren wollen

Das Baseballteam der Texas Rangers Major League gehört zu den vielen Nutzern von Airflow. Oliver Dykstra, ein Full-Stack-Dateningenieur im Texas Rangers Baseball Club, teilte VentureBeat mit, dass das Team Airflow verwendet, das auf der Astro-Plattform des Astronomen als "Nervenzentrum" ihrer Baseball-Datenbetriebe gehostet wird. Alle Spielerentwicklung, Verträge, Analysen und Spieldaten werden durch den Luftstrom orchestriert.

"Wir freuen uns darauf, auf Airflow 3 und seine Verbesserungen zu ereignisgesteuerter Planung, Beobachtbarkeit und Datenlinie zu verbessern", sagte Dykstra. "Da wir uns bereits auf den Luftstrom verlassen, um unsere kritischen KI/ML -Pipelines zu verwalten, wird die zusätzliche Effizienz und Zuverlässigkeit von Luftstrom 3 dazu beitragen, das Vertrauen und die Ausfallsicherheit dieser Datenprodukte in unserer gesamten Organisation zu erhöhen."

Was dies für die Einführung von Unternehmen KI bedeutet

Für technische Entscheidungsträger, die ihre Datenorchestrierungsstrategie bewerten, bietet Airflow 3.0 greifbare Vorteile, die schrittweise implementiert werden können.

Der erste Schritt besteht darin, aktuelle Datenworkflows zu bewerten, die von den neuen ereignisgesteuerten Funktionen profitieren könnten. Unternehmen können Datenpipelines derzeit mit geplanten Jobs bestimmen, wären jedoch mit ereignisbasierten Auslösern effizienter. Diese Verschiebung kann die Verarbeitungslatenz erheblich verringern und unnötige Wahlbetriebe beseitigen.

Als nächstes sollten Technologieführer ihre Entwicklungsumgebungen überprüfen, um festzustellen, ob die erweiterte Sprachunterstützung von Airflow dazu beitragen könnte, fragmentierte Orchestrierungswerkzeuge zu konsolidieren. Teams, die derzeit separate Orchestrierungs -Tools für verschiedene Sprachumgebungen verwalten, können mit der Planung einer Migrationsstrategie beginnen, um ihren Technologie -Stack zu rationalisieren.

Für Unternehmen an der Spitze der KI-Implementierung stellt Airflow 3.0 eine entscheidende Infrastrukturkomponente dar, die eine wichtige Herausforderung in der KI-Einführung angeht: komplexe, mehrstufige KI-Workflows auf einer Enterprise-Skala orchestrieren. Die Fähigkeit der Plattform, zusammengesetzte KI-Systeme zu koordinieren, könnte Organisationen helfen, über den Proof-of-Concept für unternehmensweite KI-Bereitstellungen hinauszugehen und die ordnungsgemäße Governance, Sicherheit und Zuverlässigkeit sicherzustellen.

Verwandter Artikel
Julius AI : 계산 인텔리전스로 데이터 분석을 혁신합니다 Julius AI : 계산 인텔리전스로 데이터 분석을 혁신합니다 오늘날의 데이터 중심 세계에서 데이터 분석은 정보에 입각 한 결정을 내리는 데 중추적 인 역할을합니다. 그러나 많은 사람들에게 프로세스는 여전히 어려움을 겪고 시간이 많이 걸립니다. 데이터 분석을 탈취하고 사용자 수준의 통찰력을 가진 사용자에게 권한을 부여하도록 설계된 혁신적인 계산 AI 도구 인 Julius AI를 입력하십시오.
인공지능 기반 주식 분석: 기술적 분석 자동화 인공지능 기반 주식 분석: 기술적 분석 자동화 AI를 활용한 주식 시장 분석의 힘을 해방시키기인공지능을 활용하여 더 똑똑한 투자 결정을 내릴 수 있는 방법을 궁금해 본 적이 있으신가요? AI 기반 대시보드를 사용하여 기술적 주식 분석을 자동화하는 이 포괄적인 가이드로 들어가 보세요. 당신이 데이 트레이더이든 장기 투자자이든, 트레이딩 전략을 향상시킬 수 있는 실용적인
Vizly: 박사 연구자를 위한 종합 인공지능 데이터 분석 도구 Vizly: 박사 연구자를 위한 종합 인공지능 데이터 분석 도구 데이터 분석은 박사 연구의 필수 요소지만, 그것을 어렵게 느껴질 필요는 없습니다. 코드 학습의 높은 난이도를 넘어서 바로 데이터에서 통찰력을 얻을 수 있다면 어떨까요? 그것이 AI 기반 도구인 Vizly가 등장하는 이유이며, 데이터 분석 과정을 단순화하겠다고 약속합니다. 이번 종합 리뷰에서는 Vizly의 기능, 사용성,
Kommentare (5)
0/200
KevinScott
KevinScott 9. Mai 2025 00:00:00 GMT

Apache Airflow 3.0 has really sped up my data processing for AI! The event-driven approach is a game-changer. It's not perfect, though; the learning curve is steep. But once you get the hang of it, it's super efficient. 🚀

BillyThomas
BillyThomas 9. Mai 2025 00:00:00 GMT

Apache Airflow 3.0 realmente ha acelerado mi procesamiento de datos para IA. El enfoque basado en eventos es un cambio de juego. No es perfecto, la curva de aprendizaje es empinada. Pero una vez que lo dominas, es súper eficiente. 🚀

RobertMartin
RobertMartin 9. Mai 2025 00:00:00 GMT

Apache Airflow 3.0は、私のAI向けデータ処理を本当にスピードアップしました!イベント駆動のアプローチはゲームチェンジャーです。ただし、完璧ではありません。学習曲線が急です。でも、一度慣れれば超効率的です。🚀

PaulGonzalez
PaulGonzalez 8. Mai 2025 00:00:00 GMT

Apache Airflow 3.0 hat meinen Datenverarbeitungsprozess für KI wirklich beschleunigt! Der ereignisgesteuerte Ansatz ist ein Game-Changer. Es ist nicht perfekt; die Lernkurve ist steil. Aber sobald man es beherrscht, ist es super effizient. 🚀

RobertRoberts
RobertRoberts 9. Mai 2025 00:00:00 GMT

Apache Airflow 3.0 thực sự đã tăng tốc quá trình xử lý dữ liệu của tôi cho AI! Cách tiếp cận dựa trên sự kiện là một bước đột phá. Tuy nhiên, nó không hoàn hảo; đường cong học tập rất dốc. Nhưng khi bạn làm quen được, nó cực kỳ hiệu quả. 🚀

Zurück nach oben
OR