Exploración sobre el máximo desempeño en la selección no supervisada de términos para agrupamiento de textos

JIMENEZ SALAZAR, HECTOR

Artículos

Producción de investigaciones y proyectos académicos

DC Field

Value

Language

dc.contributor.author

JIMENEZ SALAZAR, HECTOR

dc.coverage.spatial

<dc:creator id="info:eu-repo/dai/mx/cvu/54971">HECTOR JIMENEZ SALAZAR</dc:creator>

dc.coverage.temporal

<dc:subject>info:eu-repo/classification/cti/7</dc:subject>

dc.date.accessioned

2020-06-25T16:54:52Z

dc.date.available

2020-06-25T16:54:52Z

dc.date.issued

2016

dc.identifier.citation

Research in Computing Science, vol. 124 (2016)

en_US

dc.identifier.uri

http://ilitia.cua.uam.mx:8080/jspui/handle/123456789/505

dc.description.abstract

El agrupamiento de textos es un reto importante por la diversidad de aplicaciones que se derivan de la solución de dicha tarea. Un elemento indispensable en el agrupamiento es la selección de términos para representar lo mejor posible los textos. Aunque hay muchos métodos orientados a extraer términos de documentos para llevar a cabo categorización de textos, son pocos los que enfrentan la tarea de agrupamiento por la dificultad que se presenta al no contar con la clase de cada uno de los documentos. En este trabajo se propone un nuevo método que extrae los términos para representar los textos y, al ser agrupados, se obtiene el desempeño máximo en una cantidad notable de casos. Las pruebas se llevaron a cabo con un conjunto de varias decenas de colecciones de textos cortos (tuits), lo cual permite observar el comportamiento del método. El planteamiento que subyace al método está basado en el ascenso máximo de la similitud de los documentos y en las propiedades de unificación y diversificación de los términos expuestas por G. Zipf.

en_US

dc.description.sponsorship

Research in Computing Science

en_US

dc.language.iso

Español

en_US

dc.publisher

México : Instituto Polítecnico Nacional

en_US

dc.relation.haspart

1870-4069

dc.rights

https://www.rcs.cic.ipn.mx/2016_124/Exploracion%20sobre%20el%20maximo%20desempeno%20en%20la%20seleccion%20no%20supervisada%20de%20terminos.pdf

dc.subject

Procesamiento de textos (Computación)

en_US

dc.subject

Minería de datos

en_US

dc.title

Exploración sobre el máximo desempeño en la selección no supervisada de términos para agrupamiento de textos

en_US

dc.title.alternative

Exploration on the maximum performance of unsupervised term selection for text clustering

dc.type

Artículo

en_US

Aparece en las colecciones:

Artículos

Fichero

Descripción

Tamaño

Formato

Exploracion sobre el maximo.pdf

456.1 kB

Adobe PDF

Visualizar/Abrir

Campo de búsqueda / búsqueda general

Libros

Tesis

Artículos

Revistas

Multimedia

Iniciar Sesión

Repositorio Nacional

Novedades

Biblioteca "Dr. Miguel León Portilla"

Contacto