Determinación de pares funcionales de proteínas basado en el método de perfiles filogenéticos utilizando conjuntos difusos

dc.contributor.advisorVallejo Clemente, Edgar E
dc.contributor.advisorMorett Sánchez, Juan Enrique
dc.contributor.authorFernández López, Juan Carlos
dc.contributor.committeememberQuintana López, Maricela
dc.contributor.committeememberRamos Quintana, Fernando
dc.contributor.departmentITESM-Campus Estado de Méxicoen
dc.creatorFERNANDEZ LOPEZ, JUAN CARLOS; 180080
dc.date.accessioned2015-08-17T10:01:45Zen
dc.date.available2015-08-17T10:01:45Zen
dc.date.issued2006-08-01
dc.description.abstractEn los últimos años la obtención de genomas completamente secuenciados ha permitido el desarrollo de algoritmos computacionales que permiten estudiar los genes contenidos en éstos genomas, lo cual, a su vez posibilita una descripción de su organización y localización y por ende, la posibilidad de identificar la función que realizan las proteínas que son codificadas por estos. La última generación de métodos para la identificación de funciones de muchas proteínas no caracterizadas son los llamados métodos basados en el contexto genómico. En este grupo se destaca el método de perfiles filogenéticos (MPF), el cual describe el patrón de ausencia o presencia de una proteína particular a través de un conjunto de organismos con genomas completos. La principal ventaja de este método es que en un mismo análisis permite la participación, tanto de genomas de arqueas, procariotas y eucariotas. No obstante, como la mayoría de los métodos para la inferencia funcional, éste tiene algunas limitantes, por ejemplo, se restringe severamente el número de relaciones funcionales que pueden establecerse, debido a que solamente infiere enlaces funcionales de perfiles que son idénticos o muy similares, pero sin establecer el grado de relación que hay entre éstos y sus demás vecinos. Por otro lado, no logra relacionar genes que no están en la misma vía metabólica y cuyos perfiles filogenéticos pueden no tener una similitud suficiente, pero que coadyuvan a una función común. Este trabajo se propone incrementar el nivel de expresividad del método de perfiles filogenéticos utilizando el algoritmo de agrupamiento C-medias difuso conocido como Fuzzy C-means en idioma inglés o FCM. El uso del algoritmo C-medias difuso agrupa perfiles filogenéticos con diferentes grados de pertenencia para inferir relaciones funcionales entre proteínas de perfiles no idénticos, pero que posiblemente participan en una función común. El algoritmo, además, podría dar lugar a la inclusión de expresiones lingüísticas, referentes al parecido de perfiles filogenéticos o para describir el grado de relación funcional entre proteínas, tales como: muy alta, alta, media-alta, media, media-baja, baja y muy baja similitud del perfil filogenético en función al valor de pertenencia (membresía) dado. La validación de los agrupamientos difusos de perfiles filogenéticos se llevó a cabo usando los operones de la bacteria de Escherichia coli (E. coli). Los genes de estos operones fueron comparados con nuestro agrupamiento difuso para interrelacionar funciones. El desempeño aceptable de los resultados sugirió la posibilidad de implementar un sistema automático para inferir relaciones funcionales de perfiles filogenéticos de genes/proteínas hipotéticos o nuevos, mediante el entrenamiento de una red neuronal de base radial (RBR), la cual simuló de forma muy aceptable el agrupamiento de perfiles filogenéticos obtenido con FCM. Los resultados de este trabajo amplían la suposición de que los perfiles filogenéticos de las proteínas que funcionan juntas en una vía bioquímica o estructura compleja son similares y están dispuestos en un modelo correlacionado. Nosotros, por nuestra parte, mostramos que este modelo correlacionado conserva un patrón que puede ir haciéndose difuso o borrándose hacia el resto de los grupos y a su vez, seguir conservando algún grado en la relación funcional de los genes involucrados, lo cual brinda información adicional sobre posibles enlaces funcionales lejanos, pero existentes y por otro lado, extender el conocimiento sobre proteínas en general.
dc.identificator1
dc.identificator12
dc.identificator1203
dc.identificator120320
dc.identifier.urihttp://hdl.handle.net/11285/568527en
dc.languagespa
dc.publisherInstituto Tecnológico y de Estudios Superiores de Monterrey
dc.relationInvestigadoreses_MX
dc.relationEstudianteses_MX
dc.relation.isFormatOfversión publicadaes_MX
dc.relation.isreferencedbyREPOSITORIO NACIONAL CONACYT
dc.rightsopenAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0*
dc.subject.classification7 INGENIERÍA Y TECNOLOGÍAes_MX
dc.subject.classificationArea::CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA::MATEMÁTICAS::CIENCIA DE LOS ORDENADORES::SISTEMAS DE CONTROL MÉDICOes_MX
dc.titleDeterminación de pares funcionales de proteínas basado en el método de perfiles filogenéticos utilizando conjuntos difusos
dc.typeTesis de maestría
refterms.dateFOA2018-03-18T13:30:41Z
refterms.dateFOA2018-03-18T13:30:41Z

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
DocsTec_6265.pdf
Size:
2.86 MB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
DocsTec_6265_1.pdf
Size:
79.52 KB
Format:
Adobe Portable Document Format
logo

El usuario tiene la obligación de utilizar los servicios y contenidos proporcionados por la Universidad, en particular, los impresos y recursos electrónicos, de conformidad con la legislación vigente y los principios de buena fe y en general usos aceptados, sin contravenir con su realización el orden público, especialmente, en el caso en que, para el adecuado desempeño de su actividad, necesita reproducir, distribuir, comunicar y/o poner a disposición, fragmentos de obras impresas o susceptibles de estar en formato analógico o digital, ya sea en soporte papel o electrónico. Ley 23/2006, de 7 de julio, por la que se modifica el texto revisado de la Ley de Propiedad Intelectual, aprobado

DSpace software copyright © 2002-2025

Licencia