Tesis de maestría

Recuperación de Información Multilenguaje para Bibliotecas Digitales -Edición Única

Loading...
Thumbnail Image

Citation

View formats

Share

Bibliographic managers

Abstract

El presente documento se enfoca en las bibliotecas digitales; de manera más específica, en el servicio de búsqueda y recuperacion de información ya que se le considera uno de los servicios clave en el desarrollo de éstas. El objetivo general del presente trabajo consiste en la implementación de la búsqueda multilenguaje en una biblioteca digital aplicando técnicas de recuperación de información. Se usaría la biblioteca digital PDLib perteneciente al ITESM, de esta manera, el diseno de este sistema se basa en la arquitectura y componentes de dicha aplicación. A lo largo de este documento, se explicara el concepto de recuperación de informacion multilenguaje (Cross Lingual Information Retrieval - CLIR), su importancia en la era actual, se definirán las metodologías y técnicas de aplicación, su importancia en relación con las bibliotecas digitales, las distintas iniciativas o grupos existentes, así como las clasificaciones y estandares relacionados con el tema. Se presentaría la estrategia utilizada para implementar la recuperación de información multilenguaje bajo un entorno de biblioteca digital, utilizando un modelo de traducción de máquina y expansión de queries; aprovechando herramientas ya existentes e implementadas en PDLib como lo son el protocolo RELTEX (Relational Text Protocol), con la cual, mediante el uso de la herramienta de recuperación de información Lucene (IR tool), se puede soportar el uso de campos diníamicos. Así mismo, se realiza una descripción detallada de aquellos cambios y configuraciones necesarios para el procedimiento de expansión de queries, mediante el API de Google para traducciones; la cual resultó ser una herramienta útil para la implementación de este tipo de sistemas. Por último, se describen las pruebas comparativas realizadas con la versión actual de la biblioteca digital PDLib con el nuevo modelo presentado en esta tesis en un prototipo funcional para presentar resultados que avalen la eficiencia de dichos puntos. Estas pruebas se realizan bajo condiciones idénticas para mostrar las ventajas de tener implementado este tipo de recuperación de documentos digitales. A pesar de contar con un limitado número de recursos y las restricciones con respecto al tiempo de respuesta, se puede deducir la eficiencia de contar con este servicio.

Collections

Loading...

Document viewer

Select a file to preview:
Reload

Since the file exceeds 25 MB, to view the file it must be downloaded.

logo

El usuario tiene la obligación de utilizar los servicios y contenidos proporcionados por la Universidad, en particular, los impresos y recursos electrónicos, de conformidad con la legislación vigente y los principios de buena fe y en general usos aceptados, sin contravenir con su realización el orden público, especialmente, en el caso en que, para el adecuado desempeño de su actividad, necesita reproducir, distribuir, comunicar y/o poner a disposición, fragmentos de obras impresas o susceptibles de estar en formato analógico o digital, ya sea en soporte papel o electrónico. Ley 23/2006, de 7 de julio, por la que se modifica el texto revisado de la Ley de Propiedad Intelectual, aprobado

Licencia