Resumen
El presente artículo explora la integración de grandes modelos de lenguaje (LLM) para optimizar el Proceso de Prestaciones de los Servicios Veterinarios (PVS) de la Organización Mundial de Sanidad Animal (OMSA), que permite realizar mejoras globales en los sistemas de sanidad animal. Los LLM, entrenados en amplios conjuntos de datos, son potentes herramientas de IA capaces de comprender y generar texto parecido al humano, lo que facilita el análisis de datos no estructurados de manera más eficaz. Los informes de evaluación PVS de la OMSA, que presentan evaluaciones exhaustivas de los Servicios Veterinarios nacionales, contienen grandes cantidades de textoque resultan difíciles de analizar manualmente debido a su volumen. Los LLM permiten procesar estos informes, extrayendo información práctica sobre recomendaciones, fortalezas y debilidades identificadas en 142 países. Este artículo presenta en detalle una metodología que utiliza Microsoft Azure OpenAI para procesar más de 62 000 elementos de los informes PVS, aplicando técnicas de agrupamiento y similitud semántica con el fin de clasificar conceptos clave y generar tendencias. Consciente del desafío que implica la aplicación de LLM, como problemas de precisión, coherencia lingüística y demanda de recursos, la OMSA desarrolló un gran modelo de lenguaje interno y especializado (Mistral 7B) perfeccionado con conocimientos específicos del Proceso PVS. El artículo hace hincapié en el potencial de los LLM para transformar el proceso de evaluación, mejorar la toma de decisiones basada en datos y optimizar la formación veterinaria a nivel mundial y la asignación de competencias. El futuro de esta tecnología promete un desarrollo de políticas más eficaz y respaldado por datos, así como el fortalecimiento continuo de los sistemas de sanidad animal a nivel mundial.
La inteligencia artificial (IA) ha hecho avances significativos, con aplicaciones que cubren prácticamente todos los ámbitos. Un elemento clave de este progreso son los grandes modelos de lenguaje (LLM): potentes sistemas de IA capaces de comprender y generar texto parecido al humano [1]. Estos modelos están transformando la forma en que buscamos información, creamos contenido y generamos conocimiento. Resulta fundamental comprender la manera en que se pueden aplicar los LLM para desenvolvernos en un mundo en constante evolución.
La Organización Mundial de Sanidad Animal (OMSA) es la autoridad mundial en materia de sanidad animal y está comprometida con la transparencia en la información sobre las enfermedades animales y la mejora de la sanidad animal en todo el mundo, contribuyendo así a un futuro más seguro, sano y sostenible [2]. Desde 2006, su Proceso de Prestaciones de los Servicios Veterinarios (PVS) promueve la mejora continua de los Servicios de Sanidad Animal nacionales en todo el mundo [3]. Teniendo en consideración el volumen de texto no estructurado y datos cuantitativos presentes en los informes de evaluación PVS, la IA generativa, propulsada por los LLM, ofrece a los responsables de la toma de decisiones y las políticas públicas la oportunidad de extraer información y tendencias de forma más eficaz, mejorando la evaluación y las prestaciones de los Servicios Veterinarios [4,5].
¿Qué Son los Grandes Modelos de Lenguaje (LLM)?
Los LLM son algoritmos avanzados desarrollados para predecir y generar texto, denominados «grandes» porque se entrenan con amplios conjuntos de datos —a menudo miles de millones o incluso billones de palabras— y utilizan una gran cantidad de parámetros (en términos matemáticos) para procesar la información. Dichos parámetros permiten que los modelos «aprendan» patrones en el lenguaje, como gramática, conocimiento factual, estrategias de razonamiento y matices de estilo y tono [4]. Los LLM también pueden entrenarse para abordar dominios y temas especializados.
¿Por Qué Utilizar Inteligencia Artificial Generativa y Grandes Modelos de Lenguaje para Comprender los Sistemas de Sanidad Animal?
Los informes PVS [6] proporcionan una evaluación exhaustiva de los Servicios de Sanidad Animal de un país, documentando detalladamente su desempeño y capacidad. Incluyen resultados y recomendaciones diseñados para informar y apoyar a gobiernos, inversores y socios [6-8]. Sin embargo, debido al considerable volumen de texto, resulta difícil transformarlos, analizarlos y resumirlos eficazmente (Figura 1). Por consiguiente, la mayoría de los análisis se han centrado únicamente en los niveles de progresión⁽ᵃ⁾ asignados a cada Competencia Crítica (CC)⁽ᵇ⁾ en la Herramienta PVS, que evalúa el desempeño con respecto a las normas internacionales de la OMSA [9-11].

Figura 1. Vista de un capítulo sobre Competencia Crítica de un informe de Evaluación PVS que muestra la gran cantidad de datos de texto enriquecido, aunque no estructurados, disponibles, pero que no se podían explotar anteriormente
Si bien los datos de los niveles de progresión son valiosos y utilizados frecuentemente por socios, como el Banco Mundial, la Organización Mundial de la Salud, el Fondo para Pandemias y donantes, para supervisar el desempeño, estos solo reflejan una fracción de la información contenida en los Informes PVS. Aunque las puntuaciones de los niveles de progresión pueden indicar la capacidad de los Sistemas de Sanidad Animal, resultan menos sensibles a los cambios a lo largo del tiempo, dado que se utilizan múltiples variables para calcularlos.
El equipo del Proceso PVS planteó la hipótesis de que el análisis cuantitativo de los textos podría proporcionar una medición más precisa del progreso, al centrarse en las recomendaciones formuladas y las medidas adoptadas en respuesta a las mismas. Para comprobarlo, el equipo comenzó a elaborar una base de datos global que recopila las recomendaciones, puntos fuertes y deficiencias más frecuentes de los Servicios de Sanidad Animal extraídos de las Evaluaciones PVS solicitadas por las autoridades nacionales.
Utilizar el Procesamiento de Texto para Comprender Mejor los Sistemas de Sanidad Animal
El procesamiento de 25 656 recomendaciones, utilizando Microsoft (MS) Azure OpenAI, permitió identificar 17 234 puntos fuertes y 19 930 deficiencias de cada capítulo de los 236 informes de evaluación PVS de 142 países redactados en inglés (n = 152), francés (n = 52) y español (n = 32).
En primer lugar, cada recomendación se resumió en un «concepto clave». Posteriormente, se aplicaron métodos estadísticos como la similitud de Jaccard⁽ᶜ⁾ y el modelo de similitud semántica BERT⁽ᵈ⁾ para ordenar, agrupar y clasificar conceptos similares [12,13]. Estos grupos se filtraron en conceptos globales (n = 2125), lo que permitió identificar tendencias relativas al tipo y la frecuencia de las recomendaciones realizadas en las CC, tanto en el contexto mundial como en el regional (Figura 2). Por último, todo el texto original, los conceptos clave y los conceptos globales se tradujeron a los otros dos idiomas, eliminando así las limitaciones previas en el análisis interlingüístico global y regional [14].

Figura 2. Recomendaciones más frecuentes en los informes de evaluación PVS (n = 236 informes de evaluación PVS)
Lecciones Aprendidas a Través de la Experimentación y el Uso de Grandes Modelos de Lenguaje
Si bien la aplicación inicial de un LLM al conjunto de datos PVS generó resultados de calidad publicable, fue necesario adoptar un enfoque LLM interno especializado en PVS debido a la existencia de varios desafíos. Entre ellos, las limitaciones de tamaño de las entradas (es decir, ventana de contexto⁽ᵉ⁾), la necesidad de pruebas iterativas y la reingeniería de indicadores repetida, respuestas incoherentes en distintos temas e idiomas, gran intervención manual y demanda considerable de recursos para la corrección de resultados. En un momento dado, los resultados ya no fueron predecibles en cuanto a calidad y precisión, ya que aumentaron debido al paso del tiempo y el volumen de datos. Asimismo, surgieron otros problemas, como «alucinaciones» (contenido convincente pero no preciso) y límites del token, lo que complicó aún más el procesamiento del amplio conjunto de datos PVS.
Tras evaluar cinco modelos básicos de LLM de código abierto, se llegó a la conclusión de que Mistral 7B era el de mejor rendimiento en comparación con MS Azure OpenAI, basándose en criterios de evaluación de costo-beneficio-riesgo apropiados para un uso intergubernamental. Con el desarrollo interno de un LLM basado en los conocimientos de la OMSA, es posible alcanzar un nivel de especialización que no se puede lograr con los modelos estándar disponibles actualmente. El modelo Mistral 7B dispone de un amplio entrenamiento previo en patrones lingüísticos generales, fruto del trabajo de los desarrolladores originales, a partir de una gran cantidad de libros, sitios web, artículos y otras fuentes públicas, por lo que garantiza un mejoramiento rápido, adaptando conocimientos específicos del Proceso PVS y la OMSA.
Actualmente, este perfeccionamiento se encuentra en marcha, incorporando, conocimientos contextuales sobre el mandato de la OMSA, sus normas internacionales, directrices, marcos de cooperación y datos específicos de cada país. Para ajustar el comportamiento del LLM del Proceso PVS de la OMSA, los desarrolladores le proporcionarán datos e instrucciones más específicos, lo que implica tanto un aprendizaje supervisado, en el que el modelo se entrena con ejemplos de preguntas y respuestas, como un aprendizaje por refuerzo, en el que se le recompensa cuando proporciona respuestas útiles. Las observaciones de los revisores humanos permiten ajustar aún más el modelo a los requisitos de la OMSA, mejorando la precisión y el cumplimiento de sus normas internacionales y el contexto del Proceso PVS.
El LLM del Proceso PVS de la OMSA ayudará a los expertos en PVS a redactar informes, resumir los progresos de los países a lo largo del tiempo, analizar informes anteriores, elaborar encuestas, supervisar los progresos, extraer datos de texto no estructurado y respaldar el análisis de datos.
Aplicaciones de LLM en el Desarrollo de Capacidades del Personal Veterinario a Nivel Mundial
Uno de los principales beneficios de aplicar LLM en el Proceso PVS y la formación continua es la posibilidad de aprovechar los conocimientos especializados sobre la OMSA y el Proceso PVS para contribuir en los ámbitos esenciales de trabajo de la Organización. El LLM del Proceso PVS de la OMSA ayudará a los expertos en PVS a redactar informes, resumir los progresos de los países a lo largo del tiempo, analizar informes anteriores, elaborar encuestas, supervisar los progresos, extraer datos de texto no estructurado y respaldar el análisis de datos.
Actualmente, se están elaborando nuevos enfoques para asociar las necesidades de aprendizaje de los Miembros de la OMSA con los sistemas de conocimiento de la Organización; una transformación en la que el LLM del Proceso PVS de la OMSA desempeña un papel estratégico. Gracias a esta innovación, se agiliza la conversión de datos no estructurados en inteligencia procesable y se amplían las posibilidades de utilizar la IA generativa para que la formación sea dinámica y se centre en el alumno durante todo el ciclo de aprendizaje, desde la evaluación de necesidades hasta el diseño, la impartición y la evaluación de los progresos.
La literatura reciente destaca el potencial de los LLM, cuando se utilizan en la asignación de competencias y la elaboración de programas de estudios para la educación veterinaria y sanitaria. Los análisis integrados en el LLM también han demostrado su eficacia para supervisar la participación del alumnado y orientar las prioridades de formación [14,15]. Si la OMSA integra los LLM en la metodología de evaluación de necesidades de aprendizaje y el ciclo de formación más amplio, podrá generar recomendaciones de aprendizaje flexibles en tiempo real, optimizar la asignación de competencias y optimizar la adaptación con su marco de formación basado en competencias. Una vez consolidado, un sistema interno también garantizará la fiabilidad y la calidad de la retroalimentación generada por IA, proporcionando un apoyo inmediato y pertinente para reforzar los resultados del aprendizaje.
El Camino a Seguir
A medida que avanza el programa piloto de LLM del Proceso PVS de la OMSA, la ampliación y la extensión de la formación a otras áreas de especialización dentro de la Organización aumentarán al máximo el impacto de los conocimientos basados en IA y mejorarán la eficacia en sus principales actividades.
Si bien las oportunidades que ofrece la IA generativa constituyen un claro llamado a la acción, requieren un uso responsable y crítico, con sólidas garantías de confidencialidad, validez y fiabilidad de los datos. Con base en el entorno seguro del sistema de información del Proceso PVS [6], el perfeccionamiento de la inteligencia del LLM del Proceso PVS de la OMSA con datos de alta calidad creará un ecosistema de conocimientos robusto y único, que integrará información que no se limitará a la OMSA, incluyendo el Proceso PVS, recursos de aprendizaje electrónico, publicaciones, normas internacionales, directrices y literatura científica.
El LLM del Proceso PVS de la OMSA puede contribuir a garantizar que las decisiones políticas se fundamenten plenamente en datos fiables y bases científicas solidas. Dichas políticas deben servir de guía para la toma de decisiones, y los datos deben respaldar los enfoques utilizados con resultados acreditados y documentados. Los Servicios Veterinarios dispondrán de nuevos conocimientos, por lo que tendrán herramientas más potentes para acciones e inversiones específicas, una toma de decisiones mejor informada, una mejor aplicación de las normas internacionales de la OMSA, mayores capacidades de promoción y competencias reforzadas para satisfacer las necesidades que tienen los ciudadanos de alimentos seguros, animales sanos y una mejor nutrición.
Traducido del original en inglés.
Imagen principal: ©Krot Studio
Agradecimientos
Los autores desean agradecer las contribuciones de los miembros del equipo del proyecto, cuyos esfuerzos desde su concepción han sido incondicionales. Se mencionan en orden alfabético: Mario Ignacio Algüerno, Emmanuel Appiah, Maud Carron, François Caya, Oshin Dhand, Amy Hammond, Hasan Irtaza Mirza, Aminata Niang, Paul Nicoullaud, Roycelynne Reyes, Taimour Taj Shami, Valentyna Sharandak y Sania Zeb.
(a) El nivel de progresión se refiere a la capacidad observada y atribuida a los Servicios de Sanidad Animal de un país por un experto independiente en un área específica (es decir, Competencia Crítica). Dicha capacidad se representa mediante una puntuación semicualitativa: 1 = Capacidad inexistente o escasa, 2 = Muy poca capacidad, 3 = Capacidad mínima, 4 = Suficiente capacidad, 5 = Excelente capacidad.
(b) La Competencia Crítica (CC) es un ámbito específico que se considera esencial para el buen funcionamiento de los Servicios de Sanidad Animal de un país, según las normas internacionales de la OMSA.
(c) La similitud de Jaccard es una medida que se utiliza para determinar la similitud entre dos conjuntos de datos; en este caso, datos de texto.
(d) La similitud semántica BERT es una medida que se utiliza para determinar el grado de relación entre dos oraciones con respecto a su significado. BERT (en inglés, Representación de Codificador Bidireccional de Transformadores) es un potente modelo basado en transformadores que captura relaciones contextuales entre palabras.
(e) «Una ventana de contexto… cantidad de texto, en tokens, que el modelo puede considerar o “recordar” en cualquier momento. Una ventana de contexto más grande permite que un modelo de IA procese entradas más largas e incorpore una mayor cantidad de información en cada salida». Más información disponible en: https://www.ibm.com/mx-es/think/topics/context-window.
Referencias
[1] Kasneci E, Sessler K, Küchemann S, Bannert M, Dementieva D, Fischer F, et al. ChatGPT for good? On opportunities and challenges of large language models for education. Learn. Individ. Differ. 2023;103:102274. https://doi.org/10.1016/j.lindif.2023.102274
[2] Organización Mundial de Sanidad Animal (OMSA). Página de inicio. París (Francia): OMSA; 2025. Disponible en: https://www.woah.org/es/inicio (consultado el 14 de agosto de 2025).
[3] Organización Mundial de Sanidad Animal (OMSA). Proceso PVS. París (Francia): OMSA; 2025. Disponible en: https://www.woah.org/es/que-ofrecemos/mejora-de-los-servicios-veterinarios/proceso-pvs (consultado el 14 de agosto de 2025).
[4] Massachusetts Institute of Technology (MIT) News. Explained: generative AI. Cambridge (Estados Unidos de América): MIT; 2023. Disponible en: https://news.mit.edu/2023/explained-generative-ai-1109 (consultado el 14 de agosto de 2025).
[5] OpenAI. Research. San Francisco (Estados Unidos de América): OpenAI, L.L.C.; 2025. Disponible en: https://openai.com/research (consultado el 14 de agosto de 2025).
[6] Organización Mundial de Sanidad Animal (OMSA). Sistema de Información sobre las Prestaciones de los Servicios Veterinarios (PVSIS): informes PVS. París (Francia): OMSA; 2025. Disponible en: https://pvs.woah.org/documents (consultado el 14 de agosto de 2025).
[7] Organización Mundial de Sanidad Animal. Fortalecimiento de los Servicios Veterinarios a través del Proceso PVS de la OIE: el argumento para el compromiso y la inversión. París (Francia): Organización Mundial de Sanidad Animal; 2019. 44 págs. Disponible en: https://doc.woah.org/dyn/portal/index.xhtml?page=alo&aloId=41673 (consultado el 14 de agosto de 2025).
[8] Bastiaensen P, Abernethy D, Etter E. Assessing the extent and use of risk analysis methodologies in Africa, using data derived from the Performance of Veterinary Services (PVS) Pathway. Rev. Sci. Tech. 2017;36(1):163-74. https://doi.org/10.20506/rst.36.1.2619
[9] Organización Mundial de Sanidad Animal (OMSA). Evaluation of the Performance of Veterinary Services: PVS Tool, Terrestrial 2019. 7.a ed. París (Francia): OMSA; 2023. 67 págs. https://doi.org/10.20506/PVS.3428
[10] Organización Mundial de Sanidad Animal (OMSA). Códigos y Manuales. París (Francia): OMSA; 2025. Disponible en: https://www.woah.org/es/que-hacemos/normas/codigos-y-manuales (consultado el 30 de abril de 2025).
[11] Zhou C. Understanding Jaccard similarity: a powerful tool for data analysis [Internet]. Medium; 2023. Disponible en: https://medium.com/@conniezhou678/understanding-jaccard-similarity-a-powerful-tool-for-data-analysis-42abaaafd782 (consultado el 30 de abril de 2025).
[12] Data604. Semantic textual similarity using BERT [Internet]. Medium; 2023. Disponible en: https://medium.com/@Mustafa77/semantic-textual-similarity-with-bert-e10355ed6afa (consultado el 30 de abril de 2025).
[13] Mikolov T, Chen K, Corrado G, Dean J. Efficient estimation of word representations in vector space. arXiv. 2013;1301.3781. https://doi.org/10.48550/arXiv.1301.3781
[14] Choudhary OP, Saini J, Challana A. ChatGPT for veterinary anatomy education: an overview of the prospects and drawbacks. Int. J. Morphol. 2023;41(4):1198-202. https://doi.org/10.4067/S0717-95022023000401198
[15] Al-Ismail MS, Naseralallah LM, Hussain TA, Stewart D, Alkhiyami D, Abu Rasheed HM, et al. Learning needs assessments in continuing professional development: a scoping review. Med. Teach. 2023;45(2):203-11. https://doi.org/10.1080/0142159X.2022.2126756