Scientifique

Analyse

Intelligence Artificielle

Durée de lecture : 20min

Texte intelligent, systèmes plus performants : grands modèles linguistiques pour la Performance des Services vétérinaires

publié le

09/05/2025

écrit par

Rédacteur principal

Jennifer Lasley

Jennifer est Coordinatrice de programme senior pour le Processus d’évaluation de la performance des Services vétérinaires (PVS) et les connexions OMS/RSI au sein du Département de Renforcement des capacités de l’OMSA.
À l’OMSA depuis 2010, son travail le plus récent consiste à numériser le Processus PVS et à développer la Base de données d’évaluation initiale et de suivi du PVS, où le traitement du langage naturel et l’apprentissage automatique sont utilisés pour extraire une valeur ajoutée et des informations des données sur la performance des systèmes de santé animale à l’échelle mondiale. 

Barbara Alessandrini

Cheffe du Département de Renforcement des capacités de l’OMSA, Barbara dirige le programme de renforcement des capacités de l’OMSA, qui comprend le Processus d’évaluation de la performance des Services vétérinaires (PVS) et la plateforme de formation, en encourageant l’innovation dans les services dirigés par les pays et dans la formation centrée sur l’apprenant, afin de permettre aux institutions et aux individus d’accueillir les changements culturels et opérationnels, y compris l’approche « Une seule santé ». 

Wasif Raza Mirza

Wasif, directeur de SysReforms International, est une figure de proue dans le domaine des technologies, fort de plus de 22 ans dexpérience dans larchitecture logicielle et la transformation numérique. Son expertise sétend des systèmes existants aux solutions modernes basées sur lIA, notamment la mise en œuvre de grands modèles linguistiques (Large Language Model [LLM]) pour les entreprises et de plateformes danalyse qualitative des données. Cet architecte pratique sest spécialisé dans les technologies cloud natives, le développement full-stack et lintégration de systèmes à grande échelle pour des organisations mondiales telles que lOrganisation mondiale de la santé (OMS), lOrganisation internationale du travail (OIT), le Programme des Nations unies pour le développement (PNUD), lAgence des États-Unis pour le développement international (USAID) et lOrganisation mondiale de la santé animale (OMSA). 

Hana Abdelsattar

Hana est responsable principale des programmes de formation au sein du Service Renforcement des capacités de lOrganisation mondiale de la santé animale (OMSA) et possède une vaste expérience dans le domaine des activités de renforcement des capacités au sein dorganisations internationales. Elle est titulaire dun master en gestion et communication et dirige le développement de la plateforme dapprentissage en ligne de lOMSA, conçue pour répondre à divers besoins dapprentissage et garantir le respect des normes de lOrganisation. Hana sengage en faveur de systèmes de formation accessibles et centrés sur lapprenant qui participent au renforcement des capacités à léchelle mondiale. Elle œuvre au renforcement des Services vétérinaires dans le monde entier afin de leur permettre de relever les défis actuels et futurs.

Partager sur les médias sociaux

Résumé 

Cet article aborde l’intégration de grands modèles linguistiques (LLM) dans l’amélioration du Processus d’évaluation de la Performance des Services vétérinaires (PVS) de l’Organisation mondiale de la santé animale (OMSA), qui contribue à l’amélioration des systèmes de santé animale à l’échelle mondiale. Les LLM, entraînés sur de vastes ensembles de données, sont de puissants outils basés sur l’IA capables à la fois de comprendre et de générer des textes semblables à ceux rédigés par des humains, offrant ainsi des possibilités d’analyse plus efficace des données non structurées. Les rapports d’évaluation PVS de l’OMSA, qui contiennent des évaluations exhaustives des Services vétérinaires nationaux, sont riches en informations mais difficiles à analyser manuellement en raison de leur volume. Les LLM peuvent traiter ces rapports et extraire des informations exploitables à partir des recommandations, des points forts et des points faibles identifiés dans 142 pays. Le présent article explique comment Microsoft Azure OpenAI a été utilisé pour traiter le texte des rapports PVS, en appliquant des techniques de regroupement et de similarité sémantique afin de classer les concepts clés et de générer des tendances. Les défis liés à l’application des LLM génériques, notamment en matière de précision, de cohérence linguistique et de besoins en ressources, ont conduit l’OMSA à développer un LLM interne spécialisé, basé sur Mistral 7B, qui est en cours d’ajustement grâce à des connaissances spécifiques à l’OMSA et au programme PVS. Cet article souligne le potentiel des LLM pour améliorer la prise de décision fondée sur les données et renforcer la formation vétérinaire et le recensement des compétences à l’échelle mondiale. Cette technologie promet pour l’avenir une élaboration plus efficace des politiques, fondée sur des données, et le renforcement continu des systèmes de santé animale dans le monde entier. 

L’intelligence artificielle (IA) a fait des progrès considérables, ses applications couvrant désormais presque tous les domaines. Au cœur de ces progrès se trouvent les grands modèles linguistiques (LLM), des systèmes d’IA puissants capables de comprendre et de générer des textes semblables à ceux rédigés par des humains [1]. Ces modèles transforment notre façon de rechercher des informations, de créer du contenu et de générer des connaissances. Comprendre les possibilités d’application des LLM est essentiel pour progresser dans un monde en mutation rapide.

LOrganisation mondiale de la santé animale (OMSA) fait figure dautorité mondiale en matière de santé animale. Elle sengage à rendre compte de manière transparente des maladies animales et à améliorer la santé animale dans le monde entier, contribuant ainsi à un avenir plus sûr, plus sain et plus durable [2]. Depuis 2006, son Processus dévaluation de la Performance des Services vétérinaires (PVS) soutient lamélioration durable des Services nationaux de santé animale à travers le monde [3]. Compte tenu du volume de texte non structuré et de données quantitatives contenus dans les rapports d’évaluation PVS, l’IA générative, alimentée par les LLM, offre aux décisionnaires et aux responsables politiques la possibilité d’extraire plus efficacement les tendances et les informations, améliorant ainsi l’évaluation et les performances des Services de santé animale [4,5]

Que sont les grands modèles linguistiques ?

Les grands modèles linguistiques (LLM) sont des algorithmes avancés entraînés pour prédire et générer du texte. Le terme « grands » signifie qu’ils sont entraînés sur de vastes ensembles de données, souvent composés de milliards, voire de milliers de milliards de mots, et qu’ils utilisent un nombre considérable de paramètres (poids mathématiques) pour traiter les informations. Ces paramètres permettent aux modèles « d’apprendre » les schémas linguistiques, notamment la grammaire, les connaissances factuelles, les stratégies de raisonnement et les nuances de style et de ton [4]. Les LLM peuvent également être entraînés pour traiter des domaines et des sujets spécialisés. 

Pourquoi utiliser l’intelligence artificielle générative et les grands modèles linguistiques pour comprendre les systèmes de santé animale ?

Les rapports PVS [6] fournissent une évaluation exhaustive des Services de santé animale dun pays, en documentant en détail leurs performances et leurs capacités. Ils comprennent des conclusions et des recommandations destinées à informer et à venir en appui aux gouvernements, aux investisseurs et aux partenaires [68]. Cependant, le volume considérable de texte rend difficile leur transformation, leur analyse et leur synthèse efficaces (Figure 1). En conséquence, la plupart des analyses se concentrent uniquement sur les Stades davancement⁽ᵃ⁾ attribués à chaque Compétence critique⁽ᵇ⁾ dans lOutil PVS, qui évalue les performances conformément aux normes internationales de lOMSA [9-11]. 

Figure 1. Extrait dun chapitre consacré aux Compétences critiques dun rapport dévaluation PVS, illustrant la grande quantité de données textuelles non structurées mais riches disponibles, qui étaient auparavant inexploitables

Bien que les données des Stades d’avancement soient précieuses et régulièrement utilisées par des partenaires tels que la Banque mondiale, l’Organisation mondiale de la santé, le Fonds de lutte contre les pandémies et les bailleurs de fonds pour suivre les performances, elles ne reflètent qu’une fraction des informations contenues dans les rapports PVS. Les scores relatifs au Stade d’avancement peuvent indiquer la capacité des systèmes de santé animale, mais ils sont moins sensibles aux changements dans le temps en raison des nombreuses variables prises en compte dans leur calcul. 

Le personnel affecté au programme PVS a émis l’hypothèse que l’analyse quantitative des textes pourrait fournir une mesure plus sensible des progrès accomplis en mettant l’accent sur les recommandations formulées et les mesures prises pour y donner suite. Pour vérifier cela, l’équipe a commencé à développer une base de données mondiale compilant les recommandations les plus fréquentes, les points forts et les points faibles des Services de santé animale issus des évaluations PVS menées à la demande des autorités nationales. 

Traitement des textes pour mieux comprendre les systèmes de santé animale

À l’aide de Microsoft (MS) Azure OpenAI, 25 656 recommandations, 17 234 points forts et 19 930 points faibles ont été traités à partir de chaque chapitre de 236 rapports d’évaluation PVS couvrant 142 pays. Ces rapports ont été rédigés en anglais (n = 152), en français (n = 52) et en espagnol (n = 32). 

Tout d’abord, chaque recommandation a été résumée dans un « concept clé ». Des méthodes statistiques telles que le coefficient de similarité de Jaccard⁽ᶜ⁾ et la similarité sémantique BERT⁽ᵈ⁾ ont ensuite été appliquées pour trier, regrouper et classer les concepts similaires [12,13]. Les groupes ainsi créés ont ensuite été affinés pour former des « concepts génériques » (n = 2125), ce qui a permis de dégager des tendances concernant le type et la fréquence des recommandations formulées pour les Compétences critiques tant dans un contexte mondial que régional (Figure 2). Enfin, tous les textes bruts, les concepts clés et les concepts génériques ont été traduits dans les deux autres langues, supprimant ainsi les limitations précédentes en matière d’analyse globale et régionale entre les langues [14]. 

Figure 2. Recommandations les plus fréquentes figurant dans les rapports dévaluation PVS (n=236 rapports dévaluation PVS)

Leçons tirées de l’expérimentation et de l’utilisation de grands modèles linguistiques

Si l’application initiale d’un LLM à l’ensemble de données PVS a produit des résultats dignes d’être publiés, plusieurs défis ont conduit à l’adoption d’une approche LLM interne dédiée au PVS. Il s’agissait notamment de limitations de la taille des entrées (c’est-à-dire la fenêtre contextuelle⁽ᵉ⁾), de la nécessité de procéder à des tests itératifs et à des modifications répétées des invites, d’incohérences dans les réponses selon les domaines et les langues, d’une intervention manuelle importante et de ressources considérables pour la correction des résultats. Lorsque l’on tient compte du temps et du volume de données, les résultats s’avèrent imprévisibles, tant en termes de qualité que de précision. Les « hallucinations » (contenu convaincant mais inexact) et les limites des tokens ont constitué d’autres problèmes, qui ont encore compliqué le traitement de l’important ensemble de données PVS. 

Après avoir évalué cinq modèles de base de LLM libres, Mistral 7B a été identifié comme le plus performant par rapport à MS Azure OpenAI, sur la base de critères d’évaluation coût-bénéfice-risque adaptés à une utilisation intergouvernementale. Le développement d’un LLM interne basé sur les connaissances de l’OMSA permet une spécialisation qui n’est actuellement pas réalisable avec des modèles standard. Grâce à sa formation préalable approfondie sur les modèles linguistiques généraux, alimentée par les développeurs originaux à partir d’énormes volumes de livres, de sites web, d’articles et d’autres sources accessibles au public, le modèle Mistral 7B peut être rapidement perfectionné grâce à un réglage précis avec des connaissances spécifiques au PVS et à l’OMSA. 

Ce peaufinage est en cours et intègre notamment des connaissances contextuelles sur le mandat, les normes internationales, les lignes directrices et les cadres de coopération de l’OMSA ainsi que les spécificités nationales, pour n’en citer que quelques-unes. Les développeurs ajusteront le comportement du modèle LLM dédié au PVS de l’OMSA en lui fournissant des données et des instructions plus ciblées. Cela implique à la fois un apprentissage supervisé, où le modèle est entraîné à partir d’exemples de questions et de réponses, et un apprentissage par renforcement, où il est récompensé lorsqu’il donne des réponses utiles. Les commentaires des évaluateurs humains permettront d’aligner davantage le modèle sur les exigences de l’OMSA, améliorant ainsi sa précision et sa conformité avec ses normes internationales et le contexte du PVS. 

Le LLM du PVS de l’OMSA aidera les experts PVS à rédiger des rapports, à résumer les progrès réalisés par les pays au fil du temps, à analyser les rapports antérieurs, à élaborer des enquêtes, à extraire des données à partir de textes non structurés et à soutenir l’analyse des données. 

Applications des grands modèles linguistiques au renforcement des capacités des effectifs vétérinaires mondiaux

L’un des principaux avantages de l’application des LLM dans le cadre du Processus PVS et de la formation continue est la possibilité de tirer parti des connaissances spécialisées sur l’OMSA et le PVS pour soutenir les domaines d’activité essentiels de l’Organisation. Le LLM du PVS de l’OMSA aidera les experts PVS à rédiger des rapports, à résumer les progrès réalisés par les pays au fil du temps, à analyser les rapports antérieurs, à élaborer des enquêtes, à extraire des données à partir de textes non structurés et à soutenir l’analyse des données. 

De nouvelles approches sont en cours d’élaboration afin de relier les besoins d’apprentissage des Membres de l’OMSA aux systèmes de connaissances de l’Organisation, le LLM du PVS de l’OMSA jouant un rôle stratégique dans cette transformation. Cette innovation simplifie la conversion des données non structurées en informations exploitables et élargit les possibilités d’utilisation de l’IA générative pour soutenir une formation dynamique et centrée sur l’apprenant tout au long du cycle d’apprentissage, allant de l’évaluation des besoins à la conception, en passant par la mise en œuvre et l’évaluation des progrès. 

Des publications récentes soulignent le potentiel des LLM lorsqu’ils sont utilisés dans le recensement des compétences et la conception de programmes d’enseignement vétérinaire et sanitaire. Les analyses intégrées aux LLM se sont également révélées efficaces pour suivre l’implication des apprenants et définir les priorités en matière de formation [14,15]. En intégrant les LLM dans la méthodologie d’évaluation des besoins d’apprentissage et dans le cycle de formation au sens large, l’OMSA peut générer des recommandations d’apprentissage adaptatives en temps réel, améliorer le recensement des compétences et renforcer la mise en adéquation avec son cadre de formation basé sur les compétences. Une fois consolidé, un système interne garantira également la fiabilité et la qualité des retours générés par lIA, fournissant ainsi un appui immédiat et adapté pour renforcer les acquis pédagogiques.

 

Prochaines étapes

Au fur et à mesure que le projet pilote de LLM du PVS de l’OMSA progressera, le déploiement et l’extension de la formation à d’autres domaines d’expertise au sein de l’OMSA permettront de maximiser l’impact des informations fournies par l’IA et d’améliorer l’efficacité des activités phares de l’Organisation. 

Les opportunités offertes par l’IA générative constituent un appel clair à l’action, mais elles exigent une utilisation responsable et critique, assortie de garanties solides en matière de confidentialité, de validité et de fiabilité des données. En s’appuyant sur l’environnement sécurisé du système d’information du Processus PVS [6], l’ajustement de l’intelligence du LLM du PVS de l’OMSA à l’aide de données de haute qualité permettra de créer un écosystème de connaissances puissant et exclusif à l’OMSA. Cet écosystème intégrera des informations provenant de l’OMSA et d’autres sources, notamment le PVS, des ressources d’apprentissage en ligne, des publications, des normes internationales, des lignes directrices et de la documentation scientifique. 

Le LLM du PVS de l’OMSA peut contribuer à garantir que les décisions politiques sont solidement fondées sur les données et la science. Les politiques fondées sur des données et des éléments probants doivent servir de fil conducteur aux décisionnaires, et les données doivent étayer les approches appliquées dont les résultats ont été démontrés et documentés. Forts de ces nouvelles connaissances, les Services vétérinaires disposeront d’outils plus puissants pour mener des actions et réaliser des investissements ciblés, prendre des décisions mieux informées, améliorer la mise en œuvre des normes internationales de l’OMSA, renforcer leurs capacités de plaidoyer et consolider leurs compétences afin de répondre aux besoins des citoyens en matière de sécurité sanitaire des aliments, de santé animale et d’amélioration de la nutrition. 

Traduit de l’original en anglais. 

Image principale : ©Krot Studio

DOI : https://doi.org/10.20506/woah.3641

Remerciements 

Les auteurs tiennent à remercier les membres de l’équipe du projet pour leur contribution, dont les efforts depuis la conception du projet ont été essentiels. Par ordre alphabétique : Mario Ignacio Algüerno, Emmanuel Appiah, Maud Carron, François Caya, Oshin Dhand, Amy Hammond, Hasan Irtaza Mirza, Aminata Niang, Paul Nicoullaud, Roycelynne Reyes, Taimour Taj Shami, Valentyna Sharandak et Sania Zeb. 

(a) Le Stade d’avancement fait référence à la capacité observée et attribuée aux Services de santé animale d’un pays par un expert indépendant, dans un domaine particulier (c’est-à-dire une Compétence critique), représentée par une note semi-qualitative : 1 = Aucune ou peu de capacité, 2 = Une certaine capacité, 3 = Une capacité minimale, 4 = Une bonne capacité, 5 = Une excellente capacité. 

(b) La Compétence critique est un domaine spécifique considéré comme essentiel au bon fonctionnement des Services de santé animale dans un pays, conformément aux normes internationales de l’OMSA. 

(c) Le coefficient de similarité de Jaccard est une mesure utilisée pour déterminer la similitude entre deux ensembles de données, dans ce cas des données textuelles. 

(d) La similarité sémantique BERT est une mesure utilisée pour déterminer le degré de proximité entre deux phrases en termes de sens. BERT (Bidirectional Encoder Representations from Transformers) est un modèle puissant basé sur les transformateurs qui excelle dans la capture des relations contextuelles entre les mots. 

(e) « Une fenêtre contextuelle […] correspond à la quantité de texte, en tokens, que le modèle peut prendre en compte ou « mémoriser » à un moment donné. Une fenêtre contextuelle plus grande permet à un modèle d’IA de traiter des entrées plus longues et d’intégrer une plus grande quantité d’informations dans chaque sortie ». Pour plus d’informations, voir https://www.ibm.com/fr-fr/think/topics/context-window.https://www.ibm.com/think/topics/context-window 

Références 

[1] Kasneci E, Sessler K, Küchemann S, Bannert M, Dementieva D, Fischer F, et al. ChatGPT for good? On opportunities and challenges of large language models for education. Learn. Individ. Differ. 2023;103:102274. https://doi.org/10.1016/j.lindif.2023.102274

[2] Organisation mondiale de la santé animale (OMSA). Page d’accueil. Paris (France) : OMSA ; 2025. Disponible en ligne : https://www.woah.org/fr/accueil (consulté le 14 août 2025).

[3] Organisation mondiale de la santé animale (OMSA). Processus PVS. Paris (France) : OMSA ; 2025. Disponible en ligne : https://www.woah.org/fr/ce-que-nous-proposons/ameliorer-les-services-veterinaires/processus-pvs (consulté le 14 août 2025).

[4] Massachusetts Institute of Technology (MIT) News. Explained: generative AI. Cambridge (États-Unis d’Amérique) : MIT ; 2023. Disponible en ligne : https://news.mit.edu/2023/explained-generative-ai-1109 (consulté le 14 août 2025). 

[5] OpenAI. Research. San Francisco (États-Unis d’Amérique) : OpenAI, L.L.C. ; 2025. Disponible en ligne : https://openai.com/research (consulté le 14 août 2025).

[6] Organisation mondiale de la santé animale (OMSA). Système d’information sur la Performance des Services vétérinaires (PVSIS) : rapports PVS. Paris (France) : OMSA ; 2025. Disponible en ligne : https://pvs.woah.org/documents (consulté le 14 août 2025).

[7] Organisation mondiale de la santé animale. Le Processus PVS de l’OIE à l’appui du renforcement des Services vétérinaires : l’intérêt de l’engagement et de l’investissement. Paris (France) : Organisation mondiale de la santé animale ; 2019. 44 p. Disponible en ligne : https://doc.woah.org/dyn/portal/index.xhtml?page=alo&aloId=41673 (consulté le 14 août 2025).

[8] Bastiaensen P, Abernethy D, Etter E. Assessing the extent and use of risk analysis methodologies in Africa, using data derived from the Performance of Veterinary Services (PVS) Pathway. Rev. Sci. Tech. 2017;36(1):163-74. https://doi.org/10.20506/rst.36.1.2619

[9] Organisation mondiale de la santé animale (OMSA). Evaluation of the Performance of Veterinary Services: PVS Tool, Terrestrial 2019. 7e éd. Paris (France) : OMSA ; 2023. 67 p. https://doi.org/10.20506/PVS.3428

[10] Organisation mondiale de la santé animale (OMSA). Codes et Manuels. Paris (France) : OMSA ; 2025. Disponible en ligne : https://www.woah.org/fr/ce-que-nous-faisons/normes/codes-et-manuels (consulté le 30 avril 2025).

[11] Zhou C. Understanding Jaccard similarity: a powerful tool for data analysis [Internet]. Medium ; 2023. Disponible en ligne : https://medium.com/@conniezhou678/understanding-jaccard-similarity-a-powerful-tool-for-data-analysis-42abaaafd782 (consulté le 30 avril 2025).

[12] Data604. Semantic textual similarity using BERT [Internet]. Medium ; 2023. Disponible en ligne : https://medium.com/@Mustafa77/semantic-textual-similarity-with-bert-e10355ed6afa (consulté le 30 avril 2025).

[13] Mikolov T, Chen K, Corrado G, Dean J. Efficient estimation of word representations in vector space. arXiv. 2013;1301.3781. https://doi.org/10.48550/arXiv.1301.3781

[14] Choudhary OP, Saini J, Challana A. ChatGPT for veterinary anatomy education: an overview of the prospects and drawbacks. Int. J. Morphol. 2023;41(4):1198-202. https://doi.org/10.4067/S0717-95022023000401198 

[15] Al-Ismail MS, Naseralallah LM, Hussain TA, Stewart D, Alkhiyami D, Abu Rasheed HM, et al. Learning needs assessments in continuing professional development: a scoping review. Med. Teach. 2023;45(2):203-11. https://doi.org/10.1080/0142159X.2022.2126756

 

Continue reading

biothreats_scientist verifying sample gotten from an animal

09/04/2025

5 min read

Le risque de menaces biologiques intentionnelles liées aux maladies animales – et comment y faire face

La Dre Debbie Eagles

09/03/2025

5 min read

Transformer les systèmes mondiaux d’information sur la santé animale : vers des notifications fiables et assistées par l’IA

Natalja Lambergeon

fish die-offs in Lake Ontario 2025_fish in water

08/26/2025

5 min read

« Récoltes inattendues » : Ce que les mortalités massives de poissons au printemps 2025 révèlent sur l’équilibre des écosystèmes

H.C. Kean

Découvrez d’autres thèmes

Biosécurité

Collaboration

Genre

Santé animale

Santé de la faune sauvage

Sécurité sanitaire mondiale

Vétérinaires