首页    期刊浏览 2024年11月29日 星期五
登录注册

文章基本信息

  • 标题:Comparación de diferentes algoritmos de clustering en la estimación de coste en el desarrollo de software
  • 本地全文:下载
  • 作者:Miguel Garre ; Juan José Cuadrado ; Miguel A. Sicilia
  • 期刊名称:REICIS. Revista Española de Innovación, Calidad e Ingeniería del Software
  • 电子版ISSN:1885-4486
  • 出版年度:2007
  • 卷号:3
  • 期号:1
  • 页码:6-22
  • 语种:Spanish
  • 出版社:Asociación de Técnicos de Informática
  • 摘要:Los modelos de estimación de coste software que obtienen una única relación matemática entre el esfuerzo y algún otro atributo característico de los proyectos software, proporcionan buenos resultados cuando la base de datos de proyectos, a partir de la que mediante métodos de regresión se obtiene la relación anteriormente mencionada, está formada por proyectos homogéneos. Sin embargo, para bases de datos de proyectos procedentes de muy diversas fuentes, tales como la base de proyectos de ISBSG formada por miles de proyectos heterogéneos, el utilizar una única relación matemática para representar a todos estos proyectos, no ofrece tan buenos resultados como si los proyectos fuesen homogéneos. En este trabajo se plantea, como mejora del proceso de estimación, segmentar la base de datos ISBSG en diferentes grupos de proyectos mediante la utilización de tres algoritmos de agrupamiento diferentes: COBWEB, EM, y k-means, de manera que para cada uno de estos grupos (formados por proyectos homogéneos entre sí) se obtenga una relación matemática diferente. La segmentación llevada a cabo por estos algoritmos mejora la estimación con respecto al modelo que utiliza la base de datos sin segmentar. Por otra parte si se comparan entre sí los resultados obtenidos al aplicar cada uno de ellos, se observa que el algoritmo que presenta un mejor comportamiento es EM debido a su naturaleza probabilista.
  • 其他摘要:The software cost estimation models that obtain an only mathematical relation between the effort and some other attribute characteristic of the software projects, provide good results when the projects data base, from which by means of regression methods the mentioned relation is obtained previously, is formed by homogenous projects. Nevertheless, for projects data bases coming from very diverse sources, such as the ISBSG projects data base formed by thousands of heterogeneous projects, using an only mathematical relation to represent all these projects, does not offer so good results as if the projects were homogenous. In this work one considers, like improvement of the estimation process, to segment the ISBSG data base in different groups from projects by means of the use of three different clustering algorithms: COBWEB, EM, and k-means, so that for each one of these clusters (formed by homogenous projects to each other) a different mathematical relation is obtained. The carried out segmentation by these algorithms improves the estimation with respect to the model that uses the data base without segmenting. On the other hand if the results obtained when applying are compared to each other, it is observed that the algorithm whom a better behaviour presents is EM due to its probabilistic nature.
  • 关键词:algoritmo EM; estimación de coste software; clustering; segmentación; ISBSG.
国家哲学社会科学文献中心版权所有