Diagnostic médical : GTP-4 fait mieux que 99,8% des lecteurs de journaux médicaux

Diagnostic médical : GTP-4 fait mieux que 99,8% des lecteurs de journaux médicaux Dans le tout récent NEJM AI,  Hoifung Poon, un chercheur de Microsoft en Intelligence Artificielle, explore la performance du modèle de langage GPT-4 dans le diagnostic de cas médicaux complexes. Cet examen comparatif révèle une efficacité surprenante, surpassant celle de nombreux lecteurs de journaux médicaux.

Nouvelles frontières en IA médicale

L'intelligence artificielle (IA), longtemps cantonnée à des domaines spécifiques comme l'imagerie médicale, s'aventure aujourd'hui dans des territoires inexplorés. La recherche sur les modèles de langage, notamment le Generative Pretrained Transformer (GPT-4), a ouvert la voie à des applications novatrices telles que la génération de résumés de sortie d'hôpital et de lettres cliniques. Cette évolution souligne la nécessité de développer de nouvelles technologies face au défi croissant posé par la pénurie de médecins et la complexité croissante des diagnostics médicaux.

57% de réussite pour GPT-4

Pour évaluer la capacité de GPT-4 à diagnostiquer des cas cliniques réels, une étude a comparé ses performances à celles des lecteurs de journaux médicaux. Utilisant des défis cliniques complexes publiés en ligne, GPT-4 a démontré une capacité de diagnostic correct dans 57% des cas, surpassant 99,98% des lecteurs. Cette performance indique un potentiel significatif pour l'IA en tant qu'outil de support diagnostique. Cependant, des améliorations, des validations et la prise en compte des considérations éthiques demeurent nécessaires avant une implémentation clinique.

Bien que GPT-4 ait montré des résultats prometteurs, des essais cliniques appropriés sont requis pour garantir la sécurité et l'efficacité de cette technologie en usage clinique. L'avenir de l'IA dans le domaine médical dépendra de son intégration dans un cadre éthique et réglementaire clair, ainsi que de l'amélioration continue de ses capacités diagnostiques.

DOI: 10.1056/AIp2300031

 

Descripteur MESH : Journaux , Diagnostic , Langage , Intelligence , Intelligence artificielle , Face , Éthique , Recherche , Technologie , Médecins , Sécurité , Essais

Informatique médicale: Les +