DC Field | Value | Language |
dc.contributor.author | JIMENEZ SALAZAR, HECTOR | - |
dc.coverage.spatial | <dc:creator id="info:eu-repo/dai/mx/cvu/54971">HECTOR JIMENEZ SALAZAR</dc:creator> | - |
dc.coverage.temporal | <dc:subject>info:eu-repo/classification/cti/7</dc:subject> | - |
dc.date.accessioned | 2020-06-25T16:54:52Z | - |
dc.date.available | 2020-06-25T16:54:52Z | - |
dc.date.issued | 2016 | - |
dc.identifier.citation | Research in Computing Science, vol. 124 (2016) | en_US |
dc.identifier.uri | http://ilitia.cua.uam.mx:8080/jspui/handle/123456789/505 | - |
dc.description.abstract | El agrupamiento de textos es un reto importante por la diversidad de aplicaciones que se derivan de la solución de dicha tarea. Un elemento indispensable en el agrupamiento es la selección de términos para representar lo mejor posible los textos. Aunque hay muchos métodos orientados a extraer términos de documentos para llevar a cabo categorización de textos, son pocos los que enfrentan la tarea de agrupamiento por la dificultad que se presenta al no contar con la clase de cada uno de los documentos. En este trabajo se propone un nuevo método que extrae los términos para representar los textos y, al ser agrupados, se obtiene el desempeño máximo en una cantidad notable de casos. Las pruebas se llevaron a cabo con un conjunto de varias decenas de colecciones de textos cortos (tuits), lo cual permite observar el comportamiento del método. El planteamiento que subyace al método está basado en el ascenso máximo de la similitud de los documentos y en las propiedades de unificación y diversificación de los términos expuestas por G. Zipf. | en_US |
dc.description.sponsorship | Research in Computing Science | en_US |
dc.language.iso | Español | en_US |
dc.publisher | México : Instituto Polítecnico Nacional | en_US |
dc.relation.haspart | 1870-4069 | - |
dc.rights | https://www.rcs.cic.ipn.mx/2016_124/Exploracion%20sobre%20el%20maximo%20desempeno%20en%20la%20seleccion%20no%20supervisada%20de%20terminos.pdf | - |
dc.subject | Procesamiento de textos (Computación) | en_US |
dc.subject | Minería de datos | en_US |
dc.title | Exploración sobre el máximo desempeño en la selección no supervisada de términos para agrupamiento de textos | en_US |
dc.title.alternative | Exploration on the maximum performance of
unsupervised term selection for text clustering | - |
dc.type | Artículo | en_US |
Aparece en las colecciones: | Artículos
|