Algoritmos de balanceo de clases en problemas de clasificación binaria de conjuntos altamente desproporcionados

dc.contributor.advisorTerashima Marín, Hugo
dc.contributor.committeememberValenzuela Rendón, Manuel
dc.contributor.committeememberConant Pablos, Santiago E.
dc.contributor.divisionDivisión de Mecatrónica y Tecnologías de Informaciónes_MX
dc.contributor.institutionCampus Monterreyes_MX
dc.creatorLópez Pineda, Arturo
dc.date.accessioned2015-08-17T10:14:19Zen
dc.date.available2015-08-17T10:14:19Zen
dc.date.issued2008-12-01
dc.description.abstractEl aprendizaje automático es un tema de gran interés en la inteligencia artificial y sus aplicaciones, puesto que se trata de la generalización de comportamientos a partir de ejemplos conocidos. Este tema tiene una gran cantidad de aplicaciones como diagnósticos médicos, detección de fraudes, análisis de mercados, clasificación de secuencias, entre otros. El proceso de inducción seguido en estos problemas tiene que ver con el entrenamiento de un modelo lógico que represente un conjunto de datos conocidos. Los ejemplos históricos tienen distintos tamaños, proporciones y calidad en su integridad, dependiendo del tipo de información que se esté manejando. En particular, la rama de aprendizaje automático supervisado con el problema de clasificación de datos representa una muy frecuente línea de investigación por la gran utilidad que genera. En este contexto es que surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Esto significa que alguna de las clases del conjunto de datos tiene una cantidad mucho mayor al resto. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra, específicamente cuando están altamente desproporcionados. El interés principal es la aplicación de técnicas de balanceo de clases como método de preprocesamiento de datos en el proceso de entrenamiento, para mejorar, en la medida de lo posible, los resultados de clasificación. En este trabajo se aplica la técnica de muestreo de datos mediante la aplicación de dos enfoques: sobremuestreo y submuestreo. Para lograr este objetivo se establecen el límite máximo al cual se puede incrementar la clase minoritaria y el límite mínimo al cual se puede disminuir la clase mayoritaria. Con dichos límites se utilizan ambas técnicas de muestreo para mejorar la proporción de las clases. Para llevar a cabo el proceso de balanceo se utiliza la idea de generación de elementos artificiales basado en elementos más cercanos. La investigación demuestra que es factible aplicar algoritmos de balanceo de clases en el preprocesamiento de datos en la etapa de entrenamiento de los problemas de clasificación, generando mejores resultados sin alterar las características del proceso del método de aprendizaje utilizado, especialmente cuando se trata de algoritmos de balanceo de clases que implementan elementos sintéticos a partir de elementos cercanos, como SMOTE y NSU, para cada una de las clases, pero también se mejora significativamente al implementar métodos híbridos como HSR, que funcionan a través de todas las clases. También se deja claro que cada uno de los métodos de balanceo tiene diferentes grados de efectividad y su implementación se limita al tiempo de ejecución, complejidad de programación y características particulares de la información con la cual se trabaja. Finalmente, también se establece la efectividad de estos algoritmos a través de diversos clasificadores con diferentes enfoques y que son los principales métodos de clasificación implementados: árboles de decisión, clasificadores bayesiano y redes neuronales.es_MX
dc.description.degreeMaestro en Ciencias en Sistemas Inteligenteses_MX
dc.format.mediumTexto
dc.identificatorCampo||7||33||3304||120302
dc.identifier.urihttp://hdl.handle.net/11285/569103en
dc.languagespa
dc.publisherInstituto Tecnológico y de Estudios Superiores de Monterrey
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0*
dc.subject.classificationArea::INGENIERÍA Y TECNOLOGÍA::CIENCIAS TECNOLÓGICAS::TECNOLOGÍA DE LOS ORDENADORES::LENGUAJES ALGORÍTMICOSes_MX
dc.subject.keywordAlgoritmos de balanceo de claseses_MX
dc.subject.keywordProblemas de clasificación binariaes_MX
dc.titleAlgoritmos de balanceo de clases en problemas de clasificación binaria de conjuntos altamente desproporcionadoses_MX
dc.typeTesis de maestría
refterms.dateFOA2018-03-06T11:11:14Z

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
DocsTec_7028_1.pdf
Size:
126.9 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
LopezPineda_TesisMaestria.pdf
Size:
5.71 MB
Format:
Adobe Portable Document Format
Description:
Tesis de Maestría
Loading...
Thumbnail Image
Name:
LopezPineda_ActadeGrado.pdf
Size:
99.33 KB
Format:
Adobe Portable Document Format
Description:
Acta de grado
logo

El usuario tiene la obligación de utilizar los servicios y contenidos proporcionados por la Universidad, en particular, los impresos y recursos electrónicos, de conformidad con la legislación vigente y los principios de buena fe y en general usos aceptados, sin contravenir con su realización el orden público, especialmente, en el caso en que, para el adecuado desempeño de su actividad, necesita reproducir, distribuir, comunicar y/o poner a disposición, fragmentos de obras impresas o susceptibles de estar en formato analógico o digital, ya sea en soporte papel o electrónico. Ley 23/2006, de 7 de julio, por la que se modifica el texto revisado de la Ley de Propiedad Intelectual, aprobado

DSpace software copyright © 2002-2025

Licencia