Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA

La confiance en l'intelligence artificielle est une question délicate, reposant entièrement sur la qualité des données sur lesquelles elle est construite. Le problème de l'intégrité des données, un défi de longue date même pour les organisations les plus sophistiquées, a resurgi avec force. Les experts de l'industrie tirent la sonnette d'alarme, avertissant que les utilisateurs de l'IA générative pourraient être à la merci de données incomplètes, répétitives ou carrément erronées en raison des fondations de données fragmentées ou faibles de ces systèmes.
Selon une analyse récente d'Ashish Verma, directeur des données et de l'analytique chez Deloitte US, et de ses co-auteurs, "l'IA et l'IA générative établissent de nouvelles normes pour la qualité des données." Ils soulignent qu'en l'absence d'une architecture de données robuste couvrant divers types et modalités, et prenant en compte la diversité et les biais des données, les stratégies d'IA générative sont vouées à échouer. Ils insistent également sur la nécessité d'une transformation des données adaptée aux systèmes probabilistes.
Les exigences uniques des architectures de données prêtes pour l'IA
Les systèmes d'IA, qui reposent sur des modèles probabilistes, introduisent des défis uniques. Les résultats peuvent varier en fonction des probabilités et des données sous-jacentes au moment d'une requête, ce qui complique la conception des systèmes de données. Verma et son équipe soulignent que les systèmes de données traditionnels pourraient ne pas être à la hauteur, ce qui pourrait gonfler les coûts de formation et de reformation des modèles d'IA. Ils plaident pour des transformations de données incluant des ontologies, une gouvernance, des initiatives de renforcement de la confiance et le développement de requêtes reflétant des scénarios réels.
À ces complexités s'ajoutent des problèmes comme les hallucinations de l'IA et la dérive des modèles, soulignant le besoin de supervision humaine et d'efforts pour aligner et garantir la cohérence des données.
Le rôle crucial de la confiance en l'IA
Ian Clayton, directeur des produits chez Redpoint Global, a déclaré à ZDNET que la confiance pourrait être l'actif le plus précieux dans le paysage de l'IA. Il a insisté sur l'importance d'un environnement de données renforcé par une gouvernance solide, une traçabilité claire des données et des politiques de confidentialité transparentes. Une telle fondation favorise non seulement une utilisation éthique de l'IA, mais empêche également l'IA de dévier de sa trajectoire, ce qui pourrait entraîner des expériences client incohérentes.
Les préoccupations de l'industrie concernant la préparation des données pour l'IA
Gordon Robinson, directeur principal de la gestion des données chez SAS, a fait écho au sentiment que la qualité des données a été un défi persistant pour les entreprises. Avant de se lancer dans un parcours d'IA, il conseille aux entreprises de poser deux questions cruciales : "Comprenez-vous quelles données vous possédez, leur qualité et leur fiabilité ?" et "Disposez-vous des compétences et des outils nécessaires pour préparer vos données pour l'IA ?"
Clayton a également souligné le besoin urgent de mesures améliorées de consolidation et de qualité des données pour relever les défis de l'IA, plaidant pour l'intégration des données provenant de silos et des contrôles de qualité rigoureux comme la déduplication et l'assurance de la cohérence.
Nouvelles dimensions de la sécurité des données avec l'IA
L'introduction de l'IA met également en lumière de nouvelles considérations de sécurité. Omar Khawaja, directeur de la sécurité de l'information chez Databricks, a mis en garde contre le contournement des mesures de sécurité dans la précipitation pour déployer des solutions d'IA, car cela pourrait entraîner une supervision inadéquate.
Éléments essentiels pour des données fiables pour l'IA
- Pipelines de données agiles : Clayton a noté que l'évolution rapide de l'IA nécessite des pipelines de données agiles et évolutifs. Ces derniers sont cruciaux pour s'adapter aux nouvelles applications d'IA, en particulier pendant la phase de formation.
- Visualisation : Clayton a également souligné que si les data scientists peinent à accéder et à visualiser leurs données, cela entrave considérablement leur efficacité dans le développement de l'IA.
- Programmes de gouvernance robustes : Robinson a insisté sur l'importance d'une gouvernance des données solide pour éviter les problèmes de qualité des données qui pourraient entraîner des insights erronés et de mauvaises décisions. Une telle gouvernance aide également à comprendre le paysage des données de l'organisation et à garantir le respect des réglementations.
- Mesures approfondies et continues : Khawaja a souligné que la performance des modèles d'IA dépend directement de la qualité de leurs données d'entraînement. Il a recommandé des métriques régulières, comme les taux d'adoption mensuels, pour surveiller la rapidité avec laquelle les capacités d'IA sont adoptées, indiquant si ces outils et processus répondent aux besoins des utilisateurs.
Clayton a plaidé pour une architecture de données prête pour l'IA qui permet aux équipes informatiques et de données de mesurer des résultats tels que la qualité, la précision, l'exhaustivité, la cohérence des données et la performance des modèles d'IA. Il a exhorté les organisations à s'assurer que leurs initiatives d'IA apportent des avantages tangibles, plutôt que de déployer l'IA juste pour le plaisir de le faire.
Intéressé par plus d'histoires sur l'IA ? Abonnez-vous à notre newsletter hebdomadaire, Innovation.
Article connexe
Révolution de l'IA : Les systèmes superintelligents redéfiniront-ils l'humanité ?
Le concept de singularité technologique passe de la fiction à la réalité. Cet article examine le potentiel de l'intelligence artificielle à évoluer en une force transformatrice, modifiant fondamentale
Meta Renforce la Sécurité IA avec des Outils Llama Avancés
Meta a publié de nouveaux outils de sécurité Llama pour renforcer le développement IA et protéger contre les menaces émergentes.Ces outils de sécurité du modèle IA Llama améliorés sont associés aux no
Façonner TechCrunch Disrupt 2025 : Votez pour les meilleures sessions
Nous avons été ravis par la réponse massive pour intervenir à TechCrunch Disrupt 2025, prévu du 27 au 29 octobre à Moscone West à San Francisco.Après une évaluation minutieuse, nous avons sélectionné
commentaires (32)
0/200
StephenMiller
6 août 2025 07:00:59 UTC+02:00
This article really opened my eyes to how crucial data quality is for AI. It’s wild to think even big companies struggle with this! 😮 Makes me wonder if we’ll ever fully trust AI decisions.
0
JohnGarcia
22 juillet 2025 09:35:51 UTC+02:00
¡Qué interesante! La confianza en la IA depende tanto de los datos, ¿no? Me preocupa que incluso las grandes empresas luchen con esto. ¿Cómo aseguramos datos fiables sin caer en un caos ético? 🤔
0
CarlGarcia
23 avril 2025 10:28:37 UTC+02:00
Ferramenta muito útil para garantir a integridade dos dados para integração com IA. No entanto, pode ser um pouco complicada devido à terminologia técnica. Uma versão mais simples para iniciantes seria ótima! 😅
0
JamesWhite
21 avril 2025 20:20:42 UTC+02:00
एआई इंटीग्रेशन के लिए डेटा की विश्वसनीयता सुनिश्चित करने के लिए यह टूल बहुत उपयोगी है। लेकिन तकनीकी शब्दावली के कारण यह थोड़ा जटिल हो सकता है। शुरुआती लोगों के लिए एक सरल संस्करण बहुत अच्छा होगा! 😅
0
LarryMartin
21 avril 2025 12:56:38 UTC+02:00
이 도구는 AI에서 데이터 무결성의 중요성을 깨닫게 해주었어요. 기술적 용어가 많아서 조금 압도적이지만, AI와 관련된 사람들에게는 필수적이에요. 다만, 실용적인 예시가 더 있었으면 좋겠어요. 그래도 데이터 전문가에게는必読입니다! 📚🔍
0
GaryGonzalez
21 avril 2025 00:09:55 UTC+02:00
このツールはAIにおけるデータの整合性の重要性を教えてくれました。技術的な専門用語が多くて少し圧倒されますが、AIに携わる人には必須です。ただ、もう少し実用的例が欲しかったです。でも、データの専門家には必読ですね!📚🔍
0
La confiance en l'intelligence artificielle est une question délicate, reposant entièrement sur la qualité des données sur lesquelles elle est construite. Le problème de l'intégrité des données, un défi de longue date même pour les organisations les plus sophistiquées, a resurgi avec force. Les experts de l'industrie tirent la sonnette d'alarme, avertissant que les utilisateurs de l'IA générative pourraient être à la merci de données incomplètes, répétitives ou carrément erronées en raison des fondations de données fragmentées ou faibles de ces systèmes.
Selon une analyse récente d'Ashish Verma, directeur des données et de l'analytique chez Deloitte US, et de ses co-auteurs, "l'IA et l'IA générative établissent de nouvelles normes pour la qualité des données." Ils soulignent qu'en l'absence d'une architecture de données robuste couvrant divers types et modalités, et prenant en compte la diversité et les biais des données, les stratégies d'IA générative sont vouées à échouer. Ils insistent également sur la nécessité d'une transformation des données adaptée aux systèmes probabilistes.
Les exigences uniques des architectures de données prêtes pour l'IA
Les systèmes d'IA, qui reposent sur des modèles probabilistes, introduisent des défis uniques. Les résultats peuvent varier en fonction des probabilités et des données sous-jacentes au moment d'une requête, ce qui complique la conception des systèmes de données. Verma et son équipe soulignent que les systèmes de données traditionnels pourraient ne pas être à la hauteur, ce qui pourrait gonfler les coûts de formation et de reformation des modèles d'IA. Ils plaident pour des transformations de données incluant des ontologies, une gouvernance, des initiatives de renforcement de la confiance et le développement de requêtes reflétant des scénarios réels.
À ces complexités s'ajoutent des problèmes comme les hallucinations de l'IA et la dérive des modèles, soulignant le besoin de supervision humaine et d'efforts pour aligner et garantir la cohérence des données.
Le rôle crucial de la confiance en l'IA
Ian Clayton, directeur des produits chez Redpoint Global, a déclaré à ZDNET que la confiance pourrait être l'actif le plus précieux dans le paysage de l'IA. Il a insisté sur l'importance d'un environnement de données renforcé par une gouvernance solide, une traçabilité claire des données et des politiques de confidentialité transparentes. Une telle fondation favorise non seulement une utilisation éthique de l'IA, mais empêche également l'IA de dévier de sa trajectoire, ce qui pourrait entraîner des expériences client incohérentes.
Les préoccupations de l'industrie concernant la préparation des données pour l'IA
Gordon Robinson, directeur principal de la gestion des données chez SAS, a fait écho au sentiment que la qualité des données a été un défi persistant pour les entreprises. Avant de se lancer dans un parcours d'IA, il conseille aux entreprises de poser deux questions cruciales : "Comprenez-vous quelles données vous possédez, leur qualité et leur fiabilité ?" et "Disposez-vous des compétences et des outils nécessaires pour préparer vos données pour l'IA ?"
Clayton a également souligné le besoin urgent de mesures améliorées de consolidation et de qualité des données pour relever les défis de l'IA, plaidant pour l'intégration des données provenant de silos et des contrôles de qualité rigoureux comme la déduplication et l'assurance de la cohérence.
Nouvelles dimensions de la sécurité des données avec l'IA
L'introduction de l'IA met également en lumière de nouvelles considérations de sécurité. Omar Khawaja, directeur de la sécurité de l'information chez Databricks, a mis en garde contre le contournement des mesures de sécurité dans la précipitation pour déployer des solutions d'IA, car cela pourrait entraîner une supervision inadéquate.
Éléments essentiels pour des données fiables pour l'IA
- Pipelines de données agiles : Clayton a noté que l'évolution rapide de l'IA nécessite des pipelines de données agiles et évolutifs. Ces derniers sont cruciaux pour s'adapter aux nouvelles applications d'IA, en particulier pendant la phase de formation.
- Visualisation : Clayton a également souligné que si les data scientists peinent à accéder et à visualiser leurs données, cela entrave considérablement leur efficacité dans le développement de l'IA.
- Programmes de gouvernance robustes : Robinson a insisté sur l'importance d'une gouvernance des données solide pour éviter les problèmes de qualité des données qui pourraient entraîner des insights erronés et de mauvaises décisions. Une telle gouvernance aide également à comprendre le paysage des données de l'organisation et à garantir le respect des réglementations.
- Mesures approfondies et continues : Khawaja a souligné que la performance des modèles d'IA dépend directement de la qualité de leurs données d'entraînement. Il a recommandé des métriques régulières, comme les taux d'adoption mensuels, pour surveiller la rapidité avec laquelle les capacités d'IA sont adoptées, indiquant si ces outils et processus répondent aux besoins des utilisateurs.
Clayton a plaidé pour une architecture de données prête pour l'IA qui permet aux équipes informatiques et de données de mesurer des résultats tels que la qualité, la précision, l'exhaustivité, la cohérence des données et la performance des modèles d'IA. Il a exhorté les organisations à s'assurer que leurs initiatives d'IA apportent des avantages tangibles, plutôt que de déployer l'IA juste pour le plaisir de le faire.
Intéressé par plus d'histoires sur l'IA ? Abonnez-vous à notre newsletter hebdomadaire, Innovation.



This article really opened my eyes to how crucial data quality is for AI. It’s wild to think even big companies struggle with this! 😮 Makes me wonder if we’ll ever fully trust AI decisions.




¡Qué interesante! La confianza en la IA depende tanto de los datos, ¿no? Me preocupa que incluso las grandes empresas luchen con esto. ¿Cómo aseguramos datos fiables sin caer en un caos ético? 🤔




Ferramenta muito útil para garantir a integridade dos dados para integração com IA. No entanto, pode ser um pouco complicada devido à terminologia técnica. Uma versão mais simples para iniciantes seria ótima! 😅




एआई इंटीग्रेशन के लिए डेटा की विश्वसनीयता सुनिश्चित करने के लिए यह टूल बहुत उपयोगी है। लेकिन तकनीकी शब्दावली के कारण यह थोड़ा जटिल हो सकता है। शुरुआती लोगों के लिए एक सरल संस्करण बहुत अच्छा होगा! 😅




이 도구는 AI에서 데이터 무결성의 중요성을 깨닫게 해주었어요. 기술적 용어가 많아서 조금 압도적이지만, AI와 관련된 사람들에게는 필수적이에요. 다만, 실용적인 예시가 더 있었으면 좋겠어요. 그래도 데이터 전문가에게는必読입니다! 📚🔍




このツールはAIにおけるデータの整合性の重要性を教えてくれました。技術的な専門用語が多くて少し圧倒されますが、AIに携わる人には必須です。ただ、もう少し実用的例が欲しかったです。でも、データの専門家には必読ですね!📚🔍












