Libro blanco de la Inteligencia Artificial en el Sector porcino. Metodología (Parte 4)

Este artículo es el cuarto de una serie de artículos publicados por la startup IA Sapiens dedicada a explicar qué es la Inteligencia Artificial en el sector porcino. En el artículo anterior, hablamos de machine learning, deep learning y redes neuronales En este, daremos un paso adelante y hablaremos de como se hace un proyecto de Inteligencia Artificial en el sector porcino, es decir, de metodología.

 

Perfiles involucrados

Una vez hemos explicado una serie de conceptos básicos sobre la IA, es el momento de lanzar nuestro primer proyecto de Inteligencia Artificial en el sector porcino. A veces, en vez de Inteligencia artificial empleamos el concepto data&analytics. No son exactamente lo mismo, pero a los efectos de estos ejemplos los utilizaremos indistintamente. Hemos visto que era importante una buena digitalización previa: sin datos no hay paraíso! También hemos ido conociendo los diferentes tipos de perfiles que se juntan para hacer este tipo de proyectos:

  • En primer lugar, el experto funcional (en este caso tú!). Es decir, quien mejor conoce su negocio, sus procesos, sus retos y de la realidad del día a día de sus explotaciones ganaderas.
  • Los administradores de sistemas (el departamento de IT), que son quienes proporcionan las herramientas para la digitalización y para desarrollar este tipo de proyectos
  • Los ingenieros de datos, que son los que se encargan de llevar todos los datos necesarios a nuestro lago de datos (datalake), y de crear cuadros de mando mediante herramientas de inteligencia empresarial (business intelligence)
  • Los científicos de datos, que son los que van a aplicar inteligencia artificial para poder sacar el mejor partido a los datos de tu organización

Metodología CRISP – DM

Para hacer un proyecto de Inteligencia Artificial porcino, los científicos de datos te van a recomendar que para este tipo de proyectos utilices una manera de hacer las cosas, una metodología, llamada CRISP-DM (Cross Industry Standard Process for Data Mining). Se trata de una metodología muy madura (se creó hace casi 30 años!), que consiste básicamente en hacer las cosas con un poco de sentido común, e ir dando pasos a lo largo del proyecto para asegurarnos de que avanzamos con consistencia, y que no tendremos que volver hacia atrás por un mal planteamiento previo.

Veamos los diferentes pasos que componen la metodología, retomando nuestro ejemplo de creación de un modelo predictivo para las emisiones de metano y CO2.

  1. Comprensión de negocio. Todo proyecto de análisis de datos en el sector porcino comienza con un pregunta de negocio que queremos responder. ¿Qué formulación de pienso funciona mejor? ¿Cuánto influye un episodio de stress térmico en el índice de conversión de los lechones? ¿Cuándo es el mejor momento para el desvieje de una cerda? ¿Cuál es la relación entre el aislamiento de una nave, la genética de un lechón, y su contenido de magro en el matadero? Todas las preguntas son legítimas, y suele haber de dos tipos. Hay muchas pequeñas preguntas que nos hacen ganar unos pocos céntimos por kilo producido. Hay grandes preguntas que pueden hacernos ganar muchos euros por animal. Ambas estrategias son correctas y es bueno que coexistan en una organización. Tenemos que ganar milla a milla el pan de cada día, pero sin perder la frescura para hacernos preguntas valientes y arriesgadas, de las que normalmente la respuesta es NO, pero que cuando acertamos nos diferencian fuertemente de la competencia. La comprensión de negocio, que a veces también se llama análisis funcional, debe formalizarse. Esto significa que hemos de recoger el conocimiento y los objetivos en un documento que todo el mundo implicado pueda revisar. Esto ahorra muchos malentendidos, y ayuda a que cada uno entienda mejor lo que las otras personas implicadas en el proyecto hacen… porque nadie sabe de todo!
  2. Comprensión de los datos. Una vez tenemos claro lo que queremos hacer, el siguiente paso es analizar los datos que tenemos y/o necesitamos para cumplir nuestro objetivo. A veces, lamentablemente pocas, tenemos todos los datos y en el formato necesario para hacer nuestro proyecto. Normalmente, faltan datos, o es difícil conseguirlos, o para tenerlos habremos de cambiar procesos o el uso de herramientas en nuestra organización. En muchos de los proyectos mejor ejecutados de IA en el sector porcino que he visto, su éxito no se debía a una aplicación espectacular de la IA, sino a que habían encontrado una nueva e inteligente manera de recoger nuevos tipos de datos, lo que facilitaba que se pudiera aplicar IA. En otros casos, lamentablemente no habrá los datos necesarios para ejecutar el proyecto, y esto también puede ser bueno. Quiero decir que a veces es mejor no auto engañarnos y parar, que no perder mucho tiempo y dinero para acabar reconociendo que todavía no existen los datos necesarios para cumplir con los objetivos planteados. Otro paso importante en este punto es entender bien el formato en el que están los datos. Por ejemplo, si los datos provienen de una aplicación técnica porcina, es posible que los veterinarios estén codificando las enfermedades de una determinada manera, entonces es importante conocer bien cómo se está haciendo para poder interpretar los datos correctamente. O si los datos provienen de un matadero porcino, es posible que cada matadero esté codificando los decomisos de una determinada manera.
  3. Tratamiento de los datos. Una vez estamos seguros de que hemos entendido bien la materia primera con la que vamos a trabajar, ha llegado el momento de llevar los datos allí donde queremos. Lo primero es llevarlos allí donde los vamos a trabajar, tarea que recordemos realizan los ingenieros de datos. A veces los datos están cerca de ser lo que necesitamos pero necesitan que trabajemos un poco con ellos para dejarlos perfectos. Por ejemplo, es posible que tengamos una serie de medidas sobre cuántos lechones han nacido en cada parto, pero falten algunos pocos datos. En ese caso, existen diversas estrategias para completar esos campos que están en blanco sin distorsionar el estudio. A veces, tenemos los datos que tenemos en dos columnas y los querremos resumir en una sola. Al revés otras veces una sola columna se convertirá en varias, dependiendo del tipo de análisis que queramos hacer. En fin, en esta parte del proyecto los científicos de datos trabajan en una versión de los datos que esté en un formato que los modelos predictivos que se van a entrenar en la fase siguiente puedan entender y sacarle el mayor partido posible.
  4. Modelado. En esta fase es cuando se crea el modelo de inteligencia artificial porcino en sí. Los científicos de datos tienen a su disposición un arsenal de posibles modelos y opciones de configurarlos, que dependerán de los objetivos de negocio y de lo que se ha aprendido en los pasos anteriores del proceso. Cuando finalice el esta parte del proyecto, tendremos por fin una primera versión de nuestro modelo de IA. Recordemos que a esta fase se le llama también entrenamiento del modelo.
  5. Evaluación. Como hemos comentado, hay muchos tipos de modelos de IA, y cada uno de ellos tiene su manera de medir cómo de bueno es, sus métricas de evaluación. En un ejemplo anterior veíamos R2, que es un número entre 0 y 1, siendo 1 que el modelo ajusta perfectamente a todos los datos observados, y 0 que el modelo es un auténtico fracaso. En base a estas métricas, podríamos decidir que el modelo es muy bueno y que pasamos a usarlo (fase 6: despliegue). También podríamos decidir todo lo contrario, que nos hemos quedado tan lejos, que no es viable continuar con el proyecto y que no vamos por buen camino. Muchas veces, nos quedamos cerca, y el modelo es a la vez lo suficientemente bueno como para desplegarlo, y a su vez a lo largo del proyecto o fruto de la evaluación se nos han ocurrido ideas de cómo mejorarlo, puede que añadiendo nuevos datos, puede que tratando estos de manera diferente, puede que aplicando otro tipo de algoritmos de IA. En ese caso, según la metodología CRISP-DM, volveríamos de nuevo al punto 1. Entendimiento de negocio, para replantear el problema. Esto es importante! Puede que al principio del proyecto tuviéramos una pregunta  de negocio que responder, pero a lo largo del proyecto nos hayamos dado cuenta que hay otra pregunta que es más importante, o que hay preguntas nuevas que también deben ser tenidas en cuenta.
  6. Despliegue. Llegados a este punto, hemos construido con éxito un modelo predictivo en el sector porcino y comenzamos a sacarle partido. A veces, lo vamos a usar directamente a través de la interpretación que hacemos del mismo mediante el código Python o R que hemos desarrollado. Pero otras veces, querremos mover el modelo allí dónde se generan los datos. Por ejemplo, querremos integrar un modelo predictivo de desvieje de cerdas dentro de la propia aplicación de gestión de las granjas, o querremos desplegar nuestro algoritmo de conteo de cerdos mediante vision computer al lado de la webcam para que los datos se procesen allí mismo y no tengan que viajar a través de internet, o querremos desplegar en la aplicación de matadero el modelo de gestión de la oferta y demanda en función del stock de cerdos de las diferentes granjas y su tamaño (estrategias de shipping). Recordemos que a esta fase se le llama también predicción, inferencia, o scoring del modelo. Una parte importante aquí, es prever las condiciones de degradación del modelo predictivo. Es decir, el modelo ha sido entrenado en una circunstancias, y es bueno tener claro cuales son, para levantar una alerta si el modelo deja de ser de aplicación. Por ejemplo, si hemos creado un modelo para predecir el crecimiento de un cerdo de cebo y una de las variables es la temperatura y esta siempre ha estado entre 0 y 40 grados, y de repente el mundo entra en una era glaciar y la temperatura normal pasa a ser -10 grados, pues obviamente ese modelo no va a servir, y los científicos de datos tienen herramientas para detectar estos cambios en las circunstancias de operación recomendables de manera automática.

 

Este artículo es el cuarto de una serie de artículos publicados por la startup IA Sapiens dedicada a explicar qué es la Inteligencia Artificial en el sector porcino. En el siguiente artículo, comenzaremos a concretar algunos ejemplos de casos de uso de aplicación de Inteligencia Artificial en el sector porcino

También te puede interesar