标题:Predicción de Mutaciones en Secuencias de la Proteína Transcriptasa Inversa del VIH usando Nuevos Métodos para Aprendizaje Estructural de Redes Bayesianas
摘要:En el análisis de grandes volúmenes de datos es cr ucial la relación entre las variables. Una de las formas de modelar tales relaciones es usar una red bayesiana. El costo computacional del aprendizaje de una r ed bayesiana desde datos, crece con el número de var iables en la misma y con el número de casos, por consiguiente sur ge el problema de identifi car algor itmos eficientes que aprendan desde los datos. En el tr abajo se proponen tr es nuevos métodos de aprendizaje estructural de redes bayesianas, dos de ellos se basan en las r elaciones de dependencia entre las variables usando la pr ueba Chi cuadr ado y el último hace uso de heur ística mediante el algoritmo evolutivo Optimización de Enjambr e de Par tículas (PSO, de sus siglas en inglés: Particle Swarm Optimization). Los algor itmos pr opuestos se han pr obado con var ios conjuntos de datos de la UCI Repositor y de Machine Lear ning y en el tr abajo se muestr an resultados en la predicción de mutaciones en secuencias de ADN de la proteína tr anscr iptasa inver sa del VIH (Human Immunodefi ciency Virus).
其他摘要:In the analysis of lar ge volumes of data it is impor tant to take into account the relationship among variables. One of the ways to model these r elations is given by the use of Bayesian Networks (BN). The computational cost of lear ning from data in BN, gr ows with the increase of the number of var iables and cases¿ therefore, it is impor tant to create effi cient algorithms which learn from data. Thr ee differ ent methods for str uctur al lear ning in BN are proposed in this paper. Two of them are based on the chisquare statistical test and the last one is based on a bioinspired technique: Par ticle Swar m Optimization. All the algor ithms have been tested using several datasets available on the UCI Repositor y of Machine Lear ning. The pr esent work also shows results in the pr ediction of mutations in DNA sequences of the HIVrever setranscriptase protein.
关键词:Redes Bayesianas; Clasificación; CHAID (Chi-Squar ed Automatic Inter action Detector ); PSO; (Particle Swarm optimization) y Transcriptasa Inversa. Bayesian ...