Maison
Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA

La confiance en l'intelligence artificielle est une question délicate, reposant entièrement sur la qualité des données sur lesquelles elle est construite. Le problème de l'intégrité des données, un défi de longue date même pour les organisations les plus sophistiquées, a resurgi avec force. Les experts de l'industrie tirent la sonnette d'alarme, avertissant que les utilisateurs de l'IA générative pourraient être à la merci de données incomplètes, répétitives ou carrément erronées en raison des fondations de données fragmentées ou faibles de ces systèmes.
Selon une analyse récente d'Ashish Verma, directeur des données et de l'analytique chez Deloitte US, et de ses co-auteurs, "l'IA et l'IA générative établissent de nouvelles normes pour la qualité des données." Ils soulignent qu'en l'absence d'une architecture de données robuste couvrant divers types et modalités, et prenant en compte la diversité et les biais des données, les stratégies d'IA générative sont vouées à échouer. Ils insistent également sur la nécessité d'une transformation des données adaptée aux systèmes probabilistes.
Les exigences uniques des architectures de données prêtes pour l'IA
Les systèmes d'IA, qui reposent sur des modèles probabilistes, introduisent des défis uniques. Les résultats peuvent varier en fonction des probabilités et des données sous-jacentes au moment d'une requête, ce qui complique la conception des systèmes de données. Verma et son équipe soulignent que les systèmes de données traditionnels pourraient ne pas être à la hauteur, ce qui pourrait gonfler les coûts de formation et de reformation des modèles d'IA. Ils plaident pour des transformations de données incluant des ontologies, une gouvernance, des initiatives de renforcement de la confiance et le développement de requêtes reflétant des scénarios réels.
À ces complexités s'ajoutent des problèmes comme les hallucinations de l'IA et la dérive des modèles, soulignant le besoin de supervision humaine et d'efforts pour aligner et garantir la cohérence des données.
Le rôle crucial de la confiance en l'IA
Ian Clayton, directeur des produits chez Redpoint Global, a déclaré à ZDNET que la confiance pourrait être l'actif le plus précieux dans le paysage de l'IA. Il a insisté sur l'importance d'un environnement de données renforcé par une gouvernance solide, une traçabilité claire des données et des politiques de confidentialité transparentes. Une telle fondation favorise non seulement une utilisation éthique de l'IA, mais empêche également l'IA de dévier de sa trajectoire, ce qui pourrait entraîner des expériences client incohérentes.
Les préoccupations de l'industrie concernant la préparation des données pour l'IA
Gordon Robinson, directeur principal de la gestion des données chez SAS, a fait écho au sentiment que la qualité des données a été un défi persistant pour les entreprises. Avant de se lancer dans un parcours d'IA, il conseille aux entreprises de poser deux questions cruciales : "Comprenez-vous quelles données vous possédez, leur qualité et leur fiabilité ?" et "Disposez-vous des compétences et des outils nécessaires pour préparer vos données pour l'IA ?"
Clayton a également souligné le besoin urgent de mesures améliorées de consolidation et de qualité des données pour relever les défis de l'IA, plaidant pour l'intégration des données provenant de silos et des contrôles de qualité rigoureux comme la déduplication et l'assurance de la cohérence.
Nouvelles dimensions de la sécurité des données avec l'IA
L'introduction de l'IA met également en lumière de nouvelles considérations de sécurité. Omar Khawaja, directeur de la sécurité de l'information chez Databricks, a mis en garde contre le contournement des mesures de sécurité dans la précipitation pour déployer des solutions d'IA, car cela pourrait entraîner une supervision inadéquate.
Éléments essentiels pour des données fiables pour l'IA
- Pipelines de données agiles : Clayton a noté que l'évolution rapide de l'IA nécessite des pipelines de données agiles et évolutifs. Ces derniers sont cruciaux pour s'adapter aux nouvelles applications d'IA, en particulier pendant la phase de formation.
- Visualisation : Clayton a également souligné que si les data scientists peinent à accéder et à visualiser leurs données, cela entrave considérablement leur efficacité dans le développement de l'IA.
- Programmes de gouvernance robustes : Robinson a insisté sur l'importance d'une gouvernance des données solide pour éviter les problèmes de qualité des données qui pourraient entraîner des insights erronés et de mauvaises décisions. Une telle gouvernance aide également à comprendre le paysage des données de l'organisation et à garantir le respect des réglementations.
- Mesures approfondies et continues : Khawaja a souligné que la performance des modèles d'IA dépend directement de la qualité de leurs données d'entraînement. Il a recommandé des métriques régulières, comme les taux d'adoption mensuels, pour surveiller la rapidité avec laquelle les capacités d'IA sont adoptées, indiquant si ces outils et processus répondent aux besoins des utilisateurs.
Clayton a plaidé pour une architecture de données prête pour l'IA qui permet aux équipes informatiques et de données de mesurer des résultats tels que la qualité, la précision, l'exhaustivité, la cohérence des données et la performance des modèles d'IA. Il a exhorté les organisations à s'assurer que leurs initiatives d'IA apportent des avantages tangibles, plutôt que de déployer l'IA juste pour le plaisir de le faire.
Intéressé par plus d'histoires sur l'IA ? Abonnez-vous à notre newsletter hebdomadaire, Innovation.
Article connexe
China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données
L'«équipe nationale» et la figure de proue de l'université Tsinghua dans le domaine des grands modèles renforcent leur alliance stratégique. Le 1er mars 2026, selon les dernières données d'enregistrem
Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires
Le groupe TaoTian a récemment lancé le « Plan de productivité IA », conçu pour accélérer l'intégration de la technologie IA dans les opérations de commerce électronique et les processus de R&D grâce à
Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché
La course à la domination du marché de l'IA d'entreprise s'accélère. Microsoft intègre Copilot à Office, Google intègre Gemini à Workspace, tandis qu'OpenAI et Anthropic commercialisent leurs produits
Recommandations de sujets spéciaux liés
commentaires (38)
あれ、AIの信頼性って結局はデータの質次第なんだ。この記事を読んで、うちの会社のデータ管理が結構ずさんかも…と思っちゃった😅 最近はやりの生成AIに品質の悪いデータを入れたら、めちゃくちゃな答えが返ってきそうで怖いわ。
This article really hits the nail on the head! Data quality is everything for AI. I’ve seen companies rush into AI without cleaning their data, and it’s a mess—garbage in, garbage out. Curious how small startups handle this compared to big players. 🤔
This article really opened my eyes to how crucial data quality is for AI. It's wild to think that even big companies struggle with this! I wonder how smaller startups manage to keep their data trustworthy. 🤔
This article really opened my eyes to how crucial data quality is for AI. It’s wild to think that even big companies struggle with this! Makes me wonder if we’re rushing AI integration too fast. 🤔
This article really opened my eyes to how crucial data quality is for AI. It’s wild to think that even big companies struggle with this. Makes me wonder if we’ll ever fully trust AI decisions 🤔.

La confiance en l'intelligence artificielle est une question délicate, reposant entièrement sur la qualité des données sur lesquelles elle est construite. Le problème de l'intégrité des données, un défi de longue date même pour les organisations les plus sophistiquées, a resurgi avec force. Les experts de l'industrie tirent la sonnette d'alarme, avertissant que les utilisateurs de l'IA générative pourraient être à la merci de données incomplètes, répétitives ou carrément erronées en raison des fondations de données fragmentées ou faibles de ces systèmes.
Selon une analyse récente d'Ashish Verma, directeur des données et de l'analytique chez Deloitte US, et de ses co-auteurs, "l'IA et l'IA générative établissent de nouvelles normes pour la qualité des données." Ils soulignent qu'en l'absence d'une architecture de données robuste couvrant divers types et modalités, et prenant en compte la diversité et les biais des données, les stratégies d'IA générative sont vouées à échouer. Ils insistent également sur la nécessité d'une transformation des données adaptée aux systèmes probabilistes.
Les exigences uniques des architectures de données prêtes pour l'IA
Les systèmes d'IA, qui reposent sur des modèles probabilistes, introduisent des défis uniques. Les résultats peuvent varier en fonction des probabilités et des données sous-jacentes au moment d'une requête, ce qui complique la conception des systèmes de données. Verma et son équipe soulignent que les systèmes de données traditionnels pourraient ne pas être à la hauteur, ce qui pourrait gonfler les coûts de formation et de reformation des modèles d'IA. Ils plaident pour des transformations de données incluant des ontologies, une gouvernance, des initiatives de renforcement de la confiance et le développement de requêtes reflétant des scénarios réels.
À ces complexités s'ajoutent des problèmes comme les hallucinations de l'IA et la dérive des modèles, soulignant le besoin de supervision humaine et d'efforts pour aligner et garantir la cohérence des données.
Le rôle crucial de la confiance en l'IA
Ian Clayton, directeur des produits chez Redpoint Global, a déclaré à ZDNET que la confiance pourrait être l'actif le plus précieux dans le paysage de l'IA. Il a insisté sur l'importance d'un environnement de données renforcé par une gouvernance solide, une traçabilité claire des données et des politiques de confidentialité transparentes. Une telle fondation favorise non seulement une utilisation éthique de l'IA, mais empêche également l'IA de dévier de sa trajectoire, ce qui pourrait entraîner des expériences client incohérentes.
Les préoccupations de l'industrie concernant la préparation des données pour l'IA
Gordon Robinson, directeur principal de la gestion des données chez SAS, a fait écho au sentiment que la qualité des données a été un défi persistant pour les entreprises. Avant de se lancer dans un parcours d'IA, il conseille aux entreprises de poser deux questions cruciales : "Comprenez-vous quelles données vous possédez, leur qualité et leur fiabilité ?" et "Disposez-vous des compétences et des outils nécessaires pour préparer vos données pour l'IA ?"
Clayton a également souligné le besoin urgent de mesures améliorées de consolidation et de qualité des données pour relever les défis de l'IA, plaidant pour l'intégration des données provenant de silos et des contrôles de qualité rigoureux comme la déduplication et l'assurance de la cohérence.
Nouvelles dimensions de la sécurité des données avec l'IA
L'introduction de l'IA met également en lumière de nouvelles considérations de sécurité. Omar Khawaja, directeur de la sécurité de l'information chez Databricks, a mis en garde contre le contournement des mesures de sécurité dans la précipitation pour déployer des solutions d'IA, car cela pourrait entraîner une supervision inadéquate.
Éléments essentiels pour des données fiables pour l'IA
- Pipelines de données agiles : Clayton a noté que l'évolution rapide de l'IA nécessite des pipelines de données agiles et évolutifs. Ces derniers sont cruciaux pour s'adapter aux nouvelles applications d'IA, en particulier pendant la phase de formation.
- Visualisation : Clayton a également souligné que si les data scientists peinent à accéder et à visualiser leurs données, cela entrave considérablement leur efficacité dans le développement de l'IA.
- Programmes de gouvernance robustes : Robinson a insisté sur l'importance d'une gouvernance des données solide pour éviter les problèmes de qualité des données qui pourraient entraîner des insights erronés et de mauvaises décisions. Une telle gouvernance aide également à comprendre le paysage des données de l'organisation et à garantir le respect des réglementations.
- Mesures approfondies et continues : Khawaja a souligné que la performance des modèles d'IA dépend directement de la qualité de leurs données d'entraînement. Il a recommandé des métriques régulières, comme les taux d'adoption mensuels, pour surveiller la rapidité avec laquelle les capacités d'IA sont adoptées, indiquant si ces outils et processus répondent aux besoins des utilisateurs.
Clayton a plaidé pour une architecture de données prête pour l'IA qui permet aux équipes informatiques et de données de mesurer des résultats tels que la qualité, la précision, l'exhaustivité, la cohérence des données et la performance des modèles d'IA. Il a exhorté les organisations à s'assurer que leurs initiatives d'IA apportent des avantages tangibles, plutôt que de déployer l'IA juste pour le plaisir de le faire.
Intéressé par plus d'histoires sur l'IA ? Abonnez-vous à notre newsletter hebdomadaire, Innovation.
China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données
L'«équipe nationale» et la figure de proue de l'université Tsinghua dans le domaine des grands modèles renforcent leur alliance stratégique. Le 1er mars 2026, selon les dernières données d'enregistrem
Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires
Le groupe TaoTian a récemment lancé le « Plan de productivité IA », conçu pour accélérer l'intégration de la technologie IA dans les opérations de commerce électronique et les processus de R&D grâce à
Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché
La course à la domination du marché de l'IA d'entreprise s'accélère. Microsoft intègre Copilot à Office, Google intègre Gemini à Workspace, tandis qu'OpenAI et Anthropic commercialisent leurs produits
あれ、AIの信頼性って結局はデータの質次第なんだ。この記事を読んで、うちの会社のデータ管理が結構ずさんかも…と思っちゃった😅 最近はやりの生成AIに品質の悪いデータを入れたら、めちゃくちゃな答えが返ってきそうで怖いわ。
This article really hits the nail on the head! Data quality is everything for AI. I’ve seen companies rush into AI without cleaning their data, and it’s a mess—garbage in, garbage out. Curious how small startups handle this compared to big players. 🤔
This article really opened my eyes to how crucial data quality is for AI. It's wild to think that even big companies struggle with this! I wonder how smaller startups manage to keep their data trustworthy. 🤔
This article really opened my eyes to how crucial data quality is for AI. It’s wild to think that even big companies struggle with this! Makes me wonder if we’re rushing AI integration too fast. 🤔
This article really opened my eyes to how crucial data quality is for AI. It’s wild to think that even big companies struggle with this. Makes me wonder if we’ll ever fully trust AI decisions 🤔.











