Article de blog
5 minutes de lecture

Tidsskriftet.no : Le médecin parle de l’utilisation de l’intelligence artificielle : « J’ai plus de temps pour respirer. »

Publié le
mardi 11 mars 2025

De plus en plus de médecins généralistes utilisent des assistants dotés d’intelligence artificielle qui transcrivent les consultations en temps réel. L’une d’entre eux est la spécialiste en médecine générale Benedicte Wardemann.

Si vous le souhaitez, je peux jouer le rôle de patiente et présenter un problème. Nous pourrons alors voir comment le programme capte les différentes parties ?

La médecin généraliste Benedicte Wardemann, de Vest Helse og Trening à Bærum, montre comment fonctionne son assistant basé sur l’intelligence artificielle. Elle appuie sur le bouton « nouvelle consultation » de l’ordinateur avant de commencer à parler :

Bonjour, j’aimerais recevoir de l’aide pour perdre du poids. J’ai déjà essayé et j’ai testé de nombreux régimes différents. Je parviens parfois à perdre cinq kilos, mais je n’arrive pas à maintenir l’effort. Ensuite, je craque et je reprends du poids. C’est évidemment embarrassant pour moi, et j’ai l’impression d’échouer dans quelque chose que tout le monde semble réussir naturellement.

Pendant que Wardemann parle, les mots se transcrivent en temps réel à l’écran, grâce à un petit microphone rond et noir posé sur le bureau. Le programme s’appelle Noteless, un assistant d’intelligence artificielle conçu pour aider les professionnels de santé dans leur documentation.

Wardemann poursuit en jouant le rôle d’une patiente typique avant d’incarner ensuite la médecin dans cette consultation fictive.

Note médicale systématisée

Lorsque la conversation se termine, la médecin généraliste effectue quelques clics sur son ordinateur. Résultat ? Un brouillon complet de note médicale. Elle lit le résumé à voix haute :

Situation actuelle : Souhaite obtenir de l'aide pour perdre du poids. A déjà essayé plusieurs régimes, avec seulement des effets temporaires. Parvient à perdre environ cinq kilos avant que cela ne devienne trop difficile à maintenir, puis reprend le poids perdu. Vit cette situation comme une détresse psychologique, avec des sentiments de honte t d prede contrôle.

Le programme organise systématiquement le contenu de la consultation en sections : situation actuelle, constatations, évaluation et mesures. Selon Wardemann, la note est bien plus longue que ce qu’elle aurait elle-même écrit.

Je trouve fascinant qu’il utilise des formulations aussi bien structurées. Si je l’avais rédigée moi-même, j’aurais probablement écrit une ou deux lignes au maximum. Je n’aurais sans doute pas non plus inclus le fait qu’elle ressent de la honte et une perte de contrôle, qui font pourtant partie de la complexité de la perte de poids.

Après avoir vérifié que tout ce qui figure dans le brouillon est correct, la médecin généraliste copie le texte dans le dossier médical officiel du patient, ce qui permet d’économiser de précieuses minutes dans le processus.

La recherche sur l'IA est en plein essor

Le fait que les notes médicales générées par l’IA pour Wardemann soient plus longues et détaillées, et qu’elles captent des nuances qu’elle n’aurait peut-être pas priorisées, constitue un élément important lorsqu’on examine la recherche sur différents modèles linguistiques. Plusieurs études indiquent que les réponses générées par l’IA à des questions liées à la santé sont souvent perçues comme plus empathiques que celles des médecins réels.

Récemment, Tidskrift a publié une étude intitulée Intelligence artificielle et réponses des médecins aux questions de santé(1). Dans cette étude, 192 questions liées à la santé et leurs réponses correspondantes rédigées par des médecins ont été extraites du site StudenterSpør.no. Le modèle linguistique GPT-4 a ensuite été utilisé pour générer un nouvel ensemble de réponses aux mêmes questions.Lors d’un test à l’aveugle, un groupe de répondants ayant une expérience dans le domaine de la santé a évalué à la fois les réponses des médecins et celles générées par l’IA.

Les résultats ?

Les réponses générées par l’IA ont été perçues comme plus empathiques, mieux informées et plus utiles que celles fournies par les médecins réels.

L’un des chercheurs à l’origine de l’étude, lb Jammer, médecin et anesthésiste à l’Hôpital Universitaire de Haukeland, explique le contexte de la recherche :

Lors d’une de ses conférences, il avait présenté une étude similaire menée aux États-Unis (2), qui examinait la manière dont ChatGPT répondait aux questions liées à la santé.

Les résultats publiés à l’époque montraient que les réponses de ChatGPT étaient souvent jugées significativement meilleures que celles des médecins humains. Cela nous a intrigués. Un ordinateur pourrait-il réellement être meilleur que nous ? Comment est-ce possible ? Et cela s’applique-t-il également en norvégien ?

KI-ASSISTENT: Den lille, runde mikrofonen registrerer lyden i rommet slik at KI-programmet kan lage et utkast til…
Le petit microphone rond capte le son de la pièce, permettant ainsi au programme d’intelligence artificielle de rédiger une note médicale.
Photo: Leikny Havik Skjærseth

Avec ces éléments en tête, Jammer et ses collègues ont réalisé leur étude. Toutefois, malgré les nombreuses recherches montrant que les réponses des modèles linguistiques aux questions de santé sont souvent perçues comme plus pertinentes, il est crucial de reconnaître leurs faiblesses.

Besoin de regulation

Il y a eu des cas où les modèles linguistiques ont formulé des affirmations qu’ils n’auraient jamais dû faire, explique Ishita Barua, médecin titulaire d’un doctorat en intelligence artificielle.

Je crois qu’il y a eu un cas en Belgique où un homme s’est suicidé après avoir suivi les conseils d’un modèle linguistique. Ce sont précisément ce type de conséquences imprévues que nous devons éviter. Une régulation est nécessaire, et c’est ce qui rend ces modèles difficiles à gérer, car la communication humaine est très dynamique. Réguler cela aujourd’hui est compliqué, et cela le restera à l’avenir. Les gens doivent néanmoins comprendre qu’il ne s’agit que d’un modèle linguistique, pas d’une véritable empathie.

Barua estime que les modèles linguistiques peuvent être un outil précieux, tant pour les médecins que pour les patients, à condition qu’ils soient correctement compris et utilisés. Elle souligne toutefois qu’il reste de nombreux aspects à considérer dans leur utilisation, et que certains enjeux ne sont peut-être pas encore connus.

Il y a beaucoup de personnes isolées, sans personne à qui parler, qui trouvent un grand réconfort dans l’utilisation de modèles linguistiques. Par exemple, nous ne sommes actuellement pas en mesure de répondre pleinement à ces besoins en psychiatrie. Puisque cette technologie est là pour rester, nous devons faire tout ce qui est en notre pouvoir pour garantir que ces modèles soient aussi sûrs que possible. Mais je le répète : je ne sais pas s’il est possible de les réguler totalement.

L'IA est-elle meilleure que les médecins, ou pas ?

L’étude publiée dans Tidskrift est l’une des nombreuses recherches récentes examinant l’utilisation des modèles linguistiques dans les soins de santé. Plusieurs de ces études suggèrent que les modèles d’IA produisent de meilleures réponses que les médecins eux-mêmes, explique Ishita Barua.

Au cours des six derniers mois, plusieurs études ont testé des modèles linguistiques sur des questions et des cas médicaux. En général, c’est ChatGPT qui a été évalué, et de nombreux résultats indiquent qu’il fait mieux que les médecins seuls, et même mieux que les médecins qui utilisent un modèle linguistique comme aide. Ce dernier point a été particulièrement surprenant.

Cependant, une étude suédoise récemment publiée dans BMJ Open (3) est arrivée à des conclusions opposées. Barua souligne que cette étude est plus comparable aux conditions norvégiennes, puisqu’elle a été menée dans un pays voisin et qu’elle s’appuie sur des études de cas très proches de situations cliniques réelles.

Dans cette étude, les médecins surpassaient les modèles linguistiques. Les résultats allaient donc dans la direction inverse. Peut-être devrions-nous accorder davantage de poids aux études axées sur des scénarios cliniques réels, où les modèles linguistiques ne sont pas au niveau des médecins

Il est fascinant d’avoir aujourd’hui des études avec des conclusions contradictoires.

Monter dans le train de l'IA

Malgré les différences entre les études, il ne fait aucun doute que l’intelligence artificielle est là pour rester, non seulement dans les soins de santé, mais dans de nombreux secteurs de la société. Certains se sont déjà approprié ces outils, tandis que d’autres restent sceptiques. Pour certains, cette technologie puissante peut même apparaître comme une menace.

Je ne pense pas que l’IA remplacera les professionnels de santé, mais nous pourrions être remplacés par des personnes qui savent utiliser efficacement les outils d’IA. Je dis toujours que nous ne deviendrons pas obsolètes : nous devons simplement trouver de nouveaux espaces où exercer. Résister à l’IA ne servira à rien. Elle arrive. Nous avons une option : l’accepter et monter dans le train, ou rester sur le quai, déclare Barua.

Ishita Barua compare la révolution actuelle de l’IA à l’arrivée d’Internet.

Cela va s’intégrer profondément dans tous les aspects de la société. C’est un peu comme se demander pourquoi nous aurions eu besoin d’apprendre à utiliser Internet. Tout le monde doit acquérir une compréhension de base de ce qu’est l’IA. Lorsque les médecins reçoivent des recommandations issues de modèles d’IA, ils doivent préserver leur intégrité professionnelle. Ils doivent comprendre ce qu’est réellement cette technologie et reconnaître lorsqu’elle entre dans une zone grise nécessitant une intervention humaine. Il est essentiel d’anticiper les erreurs et difficultés potentielles avant qu’elles ne surviennent.

Selon Barua, les domaines qui ont le plus progressé dans l’adoption de l’IA en santé sont ceux qui reposent fortement sur la reconnaissance des formes et des images : radiologie, cardiologie, dermatologie et gastroentérologie.

On observe également un intérêt marqué pour l’IA générative et les modèles linguistiques, ajoute-t-elle.

Les écuils de l'IA en santé

De retour au cabinet de médecine générale de Benedicte Wardemann à Vest Helse og Trening, des affiches informent les patients que l’IA est utilisée pendant les consultations. Selon Wardemann, aucun patient n’a réagi négativement, même s’ils peuvent voir leurs propos retranscrits en direct à l’écran.

Elle précise que le microphone n’enregistre pas la conversation, mais transcrit ce qui est dit. De plus, le système d’IA fonctionne de manière totalement indépendante du dossier médical officiel.

Il n’est pas d’usage de dire à voix haute le nom ou le numéro de naissance d’un patient pendant une consultation. C’est pourquoi le système reste totalement indépendant des données personnelles.

Une fois la consultation terminée, Wardemann passe environ une minute à vérifier la note pour en garantir la précision.

Il faut toujours relire. Le modèle d’IA est “gentil” : il est toujours positif et ne reconnaît pas les limites de sa base de connaissances.

Selon Ishita Barua, cette nécessité de supervision est essentielle.

Je pense que le biais d’automatisation est l’un des plus grands pièges. Nous avons tendance à faire trop confiance aux machines, ce qui nous amène à dépendre excessivement des décisions et recommandations générées par l’IA. Le second problème est le biais algorithmique : certains modèles ne sont peut-être pas entraînés sur un ensemble de données suffisamment diversifié

Nous faisons trop confiance aux machines, ce qui nous rend trop dépendants des décisions et recommandations générées par l’IA

En ce qui concerne le gain de temps, Jammer souligne que l’efficacité des modèles linguistiques dépend fortement de la précision des instructions données.

Si nous n’avions pas fourni d’instructions spécifiques dans notre étude (nous n’avions posé qu’une seule question), nous aurions reçu des réponses nécessitant une révision importante, explique-t-il.

Les médecins restent aux commandes

Pour la médecin généraliste Benedicte Wardemann, qui suit une liste de 1 150 patients, la technologie d’intelligence artificielle lui a permis de respirer davantage dans son quotidien.

Combien de temps pensez-vous gagner en moyenne sur une journée de travail ?

Plus d’une heure. Et cela ne m’a pas conduit à prendre plus de patients : cela m’a simplement donné plus d’espace pour respirer. Je me sens mieux.

Elle estime qu’adopter de nouvelles technologies est essentiel.

Je pense que nous devons oser utiliser de nouvelles technologies qui peuvent nous aider dans notre travail quotidien. J’ai le sentiment de reprendre la maîtrise de mon temps et de consacrer davantage d’attention à mon rôle de médecin. Mon conseil à mes collègues est donc d’essayer, d’être ouverts aux nouvelles technologies, mais de se souvenir que nous restons aux commandes.

Utilisé par des organisations de confiance

Contactez-nous

Notre équipe est disponible pour vous accompagnez et répondre à toutes vos questions ou suggestions. Nous attendons votre retour !

¡Gracias! Tu mensaje se ha enviado. Nos pondremos en contacto con usted pronto.
¡Uy! Algo salió mal al enviar el formulario. Inténtalo de nuevo.