Algoritmos de balanceo de clases en problemas de clasificación binaria de conjuntos altamente desproporcionados
dc.contributor.advisor | Terashima Marín, Hugo | |
dc.contributor.committeemember | Valenzuela Rendón, Manuel | |
dc.contributor.committeemember | Conant Pablos, Santiago E. | |
dc.contributor.division | División de Mecatrónica y Tecnologías de Información | es_MX |
dc.contributor.institution | Campus Monterrey | es_MX |
dc.creator | López Pineda, Arturo | |
dc.date.accessioned | 2015-08-17T10:14:19Z | en |
dc.date.available | 2015-08-17T10:14:19Z | en |
dc.date.issued | 2008-12-01 | |
dc.description.abstract | El aprendizaje automático es un tema de gran interés en la inteligencia artificial y sus aplicaciones, puesto que se trata de la generalización de comportamientos a partir de ejemplos conocidos. Este tema tiene una gran cantidad de aplicaciones como diagnósticos médicos, detección de fraudes, análisis de mercados, clasificación de secuencias, entre otros. El proceso de inducción seguido en estos problemas tiene que ver con el entrenamiento de un modelo lógico que represente un conjunto de datos conocidos. Los ejemplos históricos tienen distintos tamaños, proporciones y calidad en su integridad, dependiendo del tipo de información que se esté manejando. En particular, la rama de aprendizaje automático supervisado con el problema de clasificación de datos representa una muy frecuente línea de investigación por la gran utilidad que genera. En este contexto es que surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Esto significa que alguna de las clases del conjunto de datos tiene una cantidad mucho mayor al resto. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra, específicamente cuando están altamente desproporcionados. El interés principal es la aplicación de técnicas de balanceo de clases como método de preprocesamiento de datos en el proceso de entrenamiento, para mejorar, en la medida de lo posible, los resultados de clasificación. En este trabajo se aplica la técnica de muestreo de datos mediante la aplicación de dos enfoques: sobremuestreo y submuestreo. Para lograr este objetivo se establecen el límite máximo al cual se puede incrementar la clase minoritaria y el límite mínimo al cual se puede disminuir la clase mayoritaria. Con dichos límites se utilizan ambas técnicas de muestreo para mejorar la proporción de las clases. Para llevar a cabo el proceso de balanceo se utiliza la idea de generación de elementos artificiales basado en elementos más cercanos. La investigación demuestra que es factible aplicar algoritmos de balanceo de clases en el preprocesamiento de datos en la etapa de entrenamiento de los problemas de clasificación, generando mejores resultados sin alterar las características del proceso del método de aprendizaje utilizado, especialmente cuando se trata de algoritmos de balanceo de clases que implementan elementos sintéticos a partir de elementos cercanos, como SMOTE y NSU, para cada una de las clases, pero también se mejora significativamente al implementar métodos híbridos como HSR, que funcionan a través de todas las clases. También se deja claro que cada uno de los métodos de balanceo tiene diferentes grados de efectividad y su implementación se limita al tiempo de ejecución, complejidad de programación y características particulares de la información con la cual se trabaja. Finalmente, también se establece la efectividad de estos algoritmos a través de diversos clasificadores con diferentes enfoques y que son los principales métodos de clasificación implementados: árboles de decisión, clasificadores bayesiano y redes neuronales. | es_MX |
dc.description.degree | Maestro en Ciencias en Sistemas Inteligentes | es_MX |
dc.format.medium | Texto | |
dc.identificator | Campo||7||33||3304||120302 | |
dc.identifier.uri | http://hdl.handle.net/11285/569103 | en |
dc.language | spa | |
dc.publisher | Instituto Tecnológico y de Estudios Superiores de Monterrey | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0 | * |
dc.subject.classification | Area::INGENIERÍA Y TECNOLOGÍA::CIENCIAS TECNOLÓGICAS::TECNOLOGÍA DE LOS ORDENADORES::LENGUAJES ALGORÍTMICOS | es_MX |
dc.subject.keyword | Algoritmos de balanceo de clases | es_MX |
dc.subject.keyword | Problemas de clasificación binaria | es_MX |
dc.title | Algoritmos de balanceo de clases en problemas de clasificación binaria de conjuntos altamente desproporcionados | es_MX |
dc.type | Tesis de maestría | |
refterms.dateFOA | 2018-03-06T11:11:14Z |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- LopezPineda_TesisMaestria.pdf
- Size:
- 5.71 MB
- Format:
- Adobe Portable Document Format
- Description:
- Tesis de Maestría
Loading...

- Name:
- LopezPineda_ActadeGrado.pdf
- Size:
- 99.33 KB
- Format:
- Adobe Portable Document Format
- Description:
- Acta de grado