En inglés
Viral subtyping classification is very relevant for the appropriate diagnosis and treatment of illnesses. The most used tools are based on alignment-based methods, nevertheless, they are becoming too slow due to the increase of genomic data; for that reason, alignmentfree methods have emerged as an alternative. In this work, we analyzed four alignment-free algorithms: two methods use k-mer frequencies (Kameris and Castor-KRFE); the third method used a frequency chaos game representation of a DNA with CNNs; and the last one processes DNA sequences as a digital signal (ML-DSP). From the comparison, Kameris and Castor-KRFE outperformed the rest, followed by the method based on CNNs.
En español
La clasificación de subtipos de virus es muy importante para el diagnóstico y tratamiento de enfermedades. Las herramientas más utilizadas dependen de algoritmos basados en alineamiento, sin embargo, estos métodos, se están volviendo muy lentos con el crecimiento de información. Por esta razón, están emergiendo nuevos métodos no basados en alineamiento. En este trabajo, se han analizado cuatro algoritmos no basados en alineamiento: dos de ellos, se basan en las frecuencias de k-mer (Kameris y Castor-KRFE); el tercer método utiliza a frequency chaos game representation del ADN junto con CNNs; el ultimo método, procesa el ADN como si fuera una señal digital (ML-DSP). Kameris y Castor-KRFE obtuvieron los mejores resultados seguidos por el método basado en CNNs.