La detección de Diabetes Tipo 2 (DT2) y prediabetes (PDM) representa un verdadero desafío para la medicina debido a la ausencia de síntomas patogenómicos y a la falta de conocimiento de los factores de riesgo asociados.
Si bien existen algunas propuestas de modelos de aprendizaje automático que permiten identificar a personas en riesgo, las características de esta enfermedad hacen que uno que resulte adecuado para una población, no necesariamente lo sea para otra. Este artículo propone desarrollar y evaluar modelos predictivos que permitan identificar personas con riesgo de DT2 y PDM específicos para la población argentina. Partiendo de un cuidadoso preprocesamiento de la base de datos, se generaron dos datasets particulares considerando el compromiso entre cantidad de registros y de variables disponibles. Luego de aplicar 5 diferentes modelos de clasificación, los resultados obtenidos muestran que algunos de ellos obtuvieron muy buenos rendimientos para ambos datasets. En particular, RF, DT y ANN demostraron gran poder de clasificación, con altos valores en las métricas consideradas. Considerando la vacancia de herramientas de este tipo para la población argentina, este trabajo representa el primer paso hacia modelos más sofisticados.