Maison
La guerre des technologies de santé basées sur l'IA s'intensifie avec les nouveaux lancements d'OpenAI, de Google et d'Anthropic
À quelques jours d'intervalle ce mois-ci, OpenAI, Google et Anthropic ont tous dévoilé des capacités d'IA spécialisées dans le domaine médical. Cette succession d'annonces témoigne d'une pression concurrentielle plutôt que d'une simple coïncidence. Cependant, aucune de ces solutions n'est homologuée en tant que dispositif médical, approuvée pour un usage clinique ou disponible pour le diagnostic direct des patients — malgré un discours marketing qui met l'accent sur la transformation des soins de santé.
Le 7 janvier, OpenAI a lancé ChatGPT Health, permettant aux utilisateurs américains de connecter leurs dossiers médicaux grâce à des partenariats avec b.well, Apple Health, Function et MyFitnessPal. Google a publié MedGemma 1.5 le 13 janvier, étendant son modèle d'IA médicale ouvert pour interpréter les scans 3D de tomodensitométrie et d'IRM ainsi que les images histopathologiques de lames entières.
Anthropic a emboîté le pas le 11 janvier avec Claude for Healthcare, proposant des connecteurs conformes à la loi HIPAA vers les bases de données de couverture CMS, les systèmes de codage CIM-10 et le registre national des identifiants de prestataires.
Ces trois entreprises ciblent les mêmes difficultés administratives — examens des autorisations préalables, traitement des demandes de remboursement et documentation clinique — avec des approches techniques similaires mais des stratégies de commercialisation différentes.
Des plateformes pour développeurs, pas des produits de diagnostic
Les similitudes architecturales sont frappantes. Chaque système utilise des modèles linguistiques multimodaux de grande envergure, affinés à partir de la littérature médicale et d’ensembles de données cliniques. Chacun met l’accent sur la protection de la vie privée et les clauses de non-responsabilité réglementaires. Chacun se positionne comme un soutien, et non un substitut, au jugement clinique.

Les différences résident dans les modèles de déploiement et d’accès. ChatGPT Health d’OpenAI fonctionne comme un service destiné aux consommateurs, avec une liste d’attente pour les abonnés à ChatGPT Free, Plus et Pro hors de l’EEE, de la Suisse et du Royaume-Uni. MedGemma 1.5 de Google est publié en tant que modèle ouvert via son programme Health AI Developer Foundations, disponible en téléchargement via Hugging Face ou en déploiement via Vertex AI de Google Cloud.
Claude for Healthcare d’Anthropic s’intègre aux flux de travail d’entreprise existants via Claude for Enterprise, ciblant les acheteurs institutionnels plutôt que les consommateurs individuels. Les trois adoptent une position réglementaire cohérente.
OpenAI précise explicitement que Health « n’est pas destiné au diagnostic ou au traitement ». Google positionne MedGemma comme « un point de départ permettant aux développeurs d’évaluer et d’adapter le modèle à leurs cas d’utilisation médicaux ». Anthropic souligne que les résultats « ne sont pas destinés à éclairer directement le diagnostic clinique, les décisions de prise en charge des patients, les recommandations de traitement ou toute autre application directe à la pratique clinique ».

Performances de référence par rapport à la validation clinique
Les scores de référence de l'IA médicale ont connu des améliorations substantielles dans les trois versions, bien que l'écart entre les performances en test et le déploiement clinique réel reste important. Google indique que MedGemma 1.5 a atteint une précision de 92,3 % sur le MedAgentBench de Stanford, un benchmark de complétion d'agents médicaux, contre 69,6 % pour la référence précédente Sonnet 3.5.
Lors de tests internes, le modèle s'est amélioré de 14 points de pourcentage pour la classification des maladies par IRM et de 3 points de pourcentage pour les résultats de tomodensitométrie. Claude Opus 4.5 d'Anthropic a obtenu un score de 61,3 % aux tests de précision de calcul médical MedCalc avec l'exécution de code Python activée, et de 92,3 % sur MedAgentBench.
La société revendique également des améliorations dans les « évaluations d’honnêteté » concernant les hallucinations factuelles, bien que les indicateurs spécifiques n’aient pas été communiqués.
OpenAI n'a pas publié de comparaisons de référence spécifiques à ChatGPT Health, mais a indiqué que « plus de 230 millions de personnes dans le monde posent chaque semaine des questions liées à la santé et au bien-être sur ChatGPT », d'après une analyse anonymisée de l'utilisation existante.
Ces benchmarks mesurent les performances sur des ensembles de données de test sélectionnés, et non les résultats cliniques. Étant donné que les erreurs médicales peuvent avoir des conséquences mortelles, traduire la précision des benchmarks en utilité clinique réelle est bien plus complexe que dans d’autres domaines de l’IA.
Le cadre réglementaire reste flou
Le paysage réglementaire pour ces outils d'IA médicale reste ambigu. Aux États-Unis, la supervision de la FDA dépend de l'usage prévu. Les logiciels qui « assistent ou fournissent des recommandations à un professionnel de santé en matière de prévention, de diagnostic ou de traitement » peuvent nécessiter un examen préalable à la mise sur le marché en tant que dispositif médical. Aucun des outils annoncés n'a actuellement reçu l'autorisation de la FDA.
Les questions de responsabilité restent également en suspens. Lorsque Mike Reagin, directeur technique de Banner Health, déclare que le système a été « attiré par l’accent mis par Anthropic sur la sécurité de l’IA », cela concerne le choix de la technologie, et non les cadres de responsabilité juridique.
Si un clinicien se fie à l’analyse d’autorisation préalable de Claude et qu’un patient subit un préjudice en raison d’un retard dans les soins, la jurisprudence existante offre peu d’indications quant à l’attribution de la responsabilité.
Les approches réglementaires varient considérablement d'une région à l'autre. Alors que la FDA et le règlement européen sur les dispositifs médicaux offrent des cadres établis pour les logiciels considérés comme des dispositifs médicaux, de nombreux régulateurs de la région Asie-Pacifique n'ont pas encore publié de directives spécifiques sur les outils de diagnostic basés sur l'IA générative.
Cette ambiguïté affecte les délais d’adoption sur des marchés où les lacunes en matière d’infrastructures de santé pourraient autrement accélérer la mise en œuvre, créant une tension entre les besoins cliniques et la prudence réglementaire.
Des flux de travail administratifs, pas des décisions cliniques
Les déploiements réels restent limités. Louise Lind Skov, directrice de la numérisation des contenus chez Novo Nordisk, a décrit l’utilisation de Claude pour « l’automatisation des documents et des contenus dans le développement pharmaceutique », en se concentrant sur les soumissions réglementaires plutôt que sur le diagnostic des patients.
L'Administration nationale de l'assurance maladie de Taïwan a utilisé MedGemma pour extraire des données de 30 000 rapports pathologiques à des fins d'analyse des politiques, et non pour prendre des décisions thérapeutiques.
Cette tendance montre que l'adoption institutionnelle se concentre sur les flux de travail administratifs où les erreurs sont moins dangereuses à court terme — tels que la facturation, la documentation et la rédaction de protocoles — plutôt que sur l'aide directe à la décision clinique où l'IA pourrait avoir l'impact le plus spectaculaire sur les résultats pour les patients.
Les capacités de l'IA médicale progressent plus rapidement que les institutions ne peuvent gérer les complexités liées à la réglementation, à la responsabilité et à l'intégration des flux de travail. La technologie est là. Des outils sophistiqués de raisonnement médical sont accessibles moyennant un abonnement mensuel.
La question de savoir si cela se traduira par une transformation de la prestation des soins de santé dépend de questions cruciales que ces annonces coordonnées n'ont pas encore abordées.
Voir aussi : AstraZeneca mise sur l'IA interne pour accélérer la recherche en oncologie
Vous souhaitez en savoir plus sur l'IA et le big data auprès des leaders du secteur ? Découvrez l'AI & Big Data Expo qui se tiendra à Amsterdam, en Californie et à Londres. Cet événement complet fait partie de TechEx et se déroule en même temps que d'autres événements technologiques de premier plan. Cliquez ici pour plus d'informations.
AI News est proposé par TechForge Media. Découvrez ici d'autres événements et webinaires à venir sur les technologies d'entreprise.
Article connexe
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Recommandations de sujets spéciaux liés
commentaires (1)
Wow, this AI health race is getting intense! Just saw the news about OpenAI, Google, and Anthropic all dropping medical AI tools almost at the same time. It's clearly a strategic move, not a coincidence. Makes you wonder who's really leading the pack and what it means for our future healthcare. Exciting but also a bit scary, right? 🤔
À quelques jours d'intervalle ce mois-ci, OpenAI, Google et Anthropic ont tous dévoilé des capacités d'IA spécialisées dans le domaine médical. Cette succession d'annonces témoigne d'une pression concurrentielle plutôt que d'une simple coïncidence. Cependant, aucune de ces solutions n'est homologuée en tant que dispositif médical, approuvée pour un usage clinique ou disponible pour le diagnostic direct des patients — malgré un discours marketing qui met l'accent sur la transformation des soins de santé.
Le 7 janvier, OpenAI a lancé ChatGPT Health, permettant aux utilisateurs américains de connecter leurs dossiers médicaux grâce à des partenariats avec b.well, Apple Health, Function et MyFitnessPal. Google a publié MedGemma 1.5 le 13 janvier, étendant son modèle d'IA médicale ouvert pour interpréter les scans 3D de tomodensitométrie et d'IRM ainsi que les images histopathologiques de lames entières.
Anthropic a emboîté le pas le 11 janvier avec Claude for Healthcare, proposant des connecteurs conformes à la loi HIPAA vers les bases de données de couverture CMS, les systèmes de codage CIM-10 et le registre national des identifiants de prestataires.
Ces trois entreprises ciblent les mêmes difficultés administratives — examens des autorisations préalables, traitement des demandes de remboursement et documentation clinique — avec des approches techniques similaires mais des stratégies de commercialisation différentes.
Des plateformes pour développeurs, pas des produits de diagnostic
Les similitudes architecturales sont frappantes. Chaque système utilise des modèles linguistiques multimodaux de grande envergure, affinés à partir de la littérature médicale et d’ensembles de données cliniques. Chacun met l’accent sur la protection de la vie privée et les clauses de non-responsabilité réglementaires. Chacun se positionne comme un soutien, et non un substitut, au jugement clinique.

Les différences résident dans les modèles de déploiement et d’accès. ChatGPT Health d’OpenAI fonctionne comme un service destiné aux consommateurs, avec une liste d’attente pour les abonnés à ChatGPT Free, Plus et Pro hors de l’EEE, de la Suisse et du Royaume-Uni. MedGemma 1.5 de Google est publié en tant que modèle ouvert via son programme Health AI Developer Foundations, disponible en téléchargement via Hugging Face ou en déploiement via Vertex AI de Google Cloud.
Claude for Healthcare d’Anthropic s’intègre aux flux de travail d’entreprise existants via Claude for Enterprise, ciblant les acheteurs institutionnels plutôt que les consommateurs individuels. Les trois adoptent une position réglementaire cohérente.
OpenAI précise explicitement que Health « n’est pas destiné au diagnostic ou au traitement ». Google positionne MedGemma comme « un point de départ permettant aux développeurs d’évaluer et d’adapter le modèle à leurs cas d’utilisation médicaux ». Anthropic souligne que les résultats « ne sont pas destinés à éclairer directement le diagnostic clinique, les décisions de prise en charge des patients, les recommandations de traitement ou toute autre application directe à la pratique clinique ».

Performances de référence par rapport à la validation clinique
Les scores de référence de l'IA médicale ont connu des améliorations substantielles dans les trois versions, bien que l'écart entre les performances en test et le déploiement clinique réel reste important. Google indique que MedGemma 1.5 a atteint une précision de 92,3 % sur le MedAgentBench de Stanford, un benchmark de complétion d'agents médicaux, contre 69,6 % pour la référence précédente Sonnet 3.5.
Lors de tests internes, le modèle s'est amélioré de 14 points de pourcentage pour la classification des maladies par IRM et de 3 points de pourcentage pour les résultats de tomodensitométrie. Claude Opus 4.5 d'Anthropic a obtenu un score de 61,3 % aux tests de précision de calcul médical MedCalc avec l'exécution de code Python activée, et de 92,3 % sur MedAgentBench.
La société revendique également des améliorations dans les « évaluations d’honnêteté » concernant les hallucinations factuelles, bien que les indicateurs spécifiques n’aient pas été communiqués.
OpenAI n'a pas publié de comparaisons de référence spécifiques à ChatGPT Health, mais a indiqué que « plus de 230 millions de personnes dans le monde posent chaque semaine des questions liées à la santé et au bien-être sur ChatGPT », d'après une analyse anonymisée de l'utilisation existante.
Ces benchmarks mesurent les performances sur des ensembles de données de test sélectionnés, et non les résultats cliniques. Étant donné que les erreurs médicales peuvent avoir des conséquences mortelles, traduire la précision des benchmarks en utilité clinique réelle est bien plus complexe que dans d’autres domaines de l’IA.
Le cadre réglementaire reste flou
Le paysage réglementaire pour ces outils d'IA médicale reste ambigu. Aux États-Unis, la supervision de la FDA dépend de l'usage prévu. Les logiciels qui « assistent ou fournissent des recommandations à un professionnel de santé en matière de prévention, de diagnostic ou de traitement » peuvent nécessiter un examen préalable à la mise sur le marché en tant que dispositif médical. Aucun des outils annoncés n'a actuellement reçu l'autorisation de la FDA.
Les questions de responsabilité restent également en suspens. Lorsque Mike Reagin, directeur technique de Banner Health, déclare que le système a été « attiré par l’accent mis par Anthropic sur la sécurité de l’IA », cela concerne le choix de la technologie, et non les cadres de responsabilité juridique.
Si un clinicien se fie à l’analyse d’autorisation préalable de Claude et qu’un patient subit un préjudice en raison d’un retard dans les soins, la jurisprudence existante offre peu d’indications quant à l’attribution de la responsabilité.
Les approches réglementaires varient considérablement d'une région à l'autre. Alors que la FDA et le règlement européen sur les dispositifs médicaux offrent des cadres établis pour les logiciels considérés comme des dispositifs médicaux, de nombreux régulateurs de la région Asie-Pacifique n'ont pas encore publié de directives spécifiques sur les outils de diagnostic basés sur l'IA générative.
Cette ambiguïté affecte les délais d’adoption sur des marchés où les lacunes en matière d’infrastructures de santé pourraient autrement accélérer la mise en œuvre, créant une tension entre les besoins cliniques et la prudence réglementaire.
Des flux de travail administratifs, pas des décisions cliniques
Les déploiements réels restent limités. Louise Lind Skov, directrice de la numérisation des contenus chez Novo Nordisk, a décrit l’utilisation de Claude pour « l’automatisation des documents et des contenus dans le développement pharmaceutique », en se concentrant sur les soumissions réglementaires plutôt que sur le diagnostic des patients.
L'Administration nationale de l'assurance maladie de Taïwan a utilisé MedGemma pour extraire des données de 30 000 rapports pathologiques à des fins d'analyse des politiques, et non pour prendre des décisions thérapeutiques.
Cette tendance montre que l'adoption institutionnelle se concentre sur les flux de travail administratifs où les erreurs sont moins dangereuses à court terme — tels que la facturation, la documentation et la rédaction de protocoles — plutôt que sur l'aide directe à la décision clinique où l'IA pourrait avoir l'impact le plus spectaculaire sur les résultats pour les patients.
Les capacités de l'IA médicale progressent plus rapidement que les institutions ne peuvent gérer les complexités liées à la réglementation, à la responsabilité et à l'intégration des flux de travail. La technologie est là. Des outils sophistiqués de raisonnement médical sont accessibles moyennant un abonnement mensuel.
La question de savoir si cela se traduira par une transformation de la prestation des soins de santé dépend de questions cruciales que ces annonces coordonnées n'ont pas encore abordées.
Voir aussi : AstraZeneca mise sur l'IA interne pour accélérer la recherche en oncologie
Vous souhaitez en savoir plus sur l'IA et le big data auprès des leaders du secteur ? Découvrez l'AI & Big Data Expo qui se tiendra à Amsterdam, en Californie et à Londres. Cet événement complet fait partie de TechEx et se déroule en même temps que d'autres événements technologiques de premier plan. Cliquez ici pour plus d'informations.
AI News est proposé par TechForge Media. Découvrez ici d'autres événements et webinaires à venir sur les technologies d'entreprise.
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large
Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Wow, this AI health race is getting intense! Just saw the news about OpenAI, Google, and Anthropic all dropping medical AI tools almost at the same time. It's clearly a strategic move, not a coincidence. Makes you wonder who's really leading the pack and what it means for our future healthcare. Exciting but also a bit scary, right? 🤔











