Responsable: | (-) |
Otros: | (-) |
Créditos | Dept. | Tipo | Requisitos |
---|---|---|---|
7.5 (6.0 ECTS) | CS |
|
PRED
- Prerequisito para la EI , ETIG PS - Prerequisito para la ETIS |
Responsable: | (-) |
Otros: | (-) |
Entender el problema de la recuperación de información. Entender los diferentes componentes de un sistema de recuperación de la información, los factores y técnicas que pueden optimizar el proceso y saberlos usar y adaptar. Conocer algunas aplicaciones de estos sistemas, como mínimo en la bioinformática y la Web.
Horas estimadas de:
T | P | L | Alt | L Ext. | Est | O. Ext. |
Teoria | Problemas | Laboratorio | Otras actividades | Laboratorio externo | Estudio | Otras horas fuera del horario fijado |
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
4,0 | 4,0 | 2,0 | 0 | 2,0 | 10,0 | 0 | 22,0 | |||
Definición formal y conceptos básicos: Modelos abstractos de documentos y lenguajes de interrogación. Modelo booleano. Modelo vectorial. Latent semantic indexing.
|
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 2,0 | 0 | 0 | 0 | 4,0 | 0 | 8,0 | |||
Ficheros invertidos. Compresión de índices. Ejemplo: Implementación eficiente de la regla del coseno con medida tf-idf. Ejemplo: Lucene.
|
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
2,0 | 2,0 | 2,0 | 0 | 4,0 | 4,0 | 0 | 14,0 | |||
Recall y precisión. Otras medidas de rendimiento. Colecciones de referencia. "Relevance feedback" y "query expansion".
|
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
8,0 | 6,0 | 0 | 0 | 0 | 8,0 | 0 | 22,0 | |||
Ranking y relevancia para modelos Web. Algoritmo PageRank. Arquitectura de buscadores en la web. Web Crawling. Análisis de redes sociales basado en enlaces.
|
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
8,0 | 8,0 | 3,0 | 0 | 2,0 | 16,0 | 0 | 37,0 | |||
Búsqueda de patrones. Algoritmos para la búsqueda exacta y aproximada.Tries. Modelos de Markov ocultos. Ficheros invertidos, árbol de sufijos. Algoritmos de construcción, utilización y análisis.
|
|
T | P | L | Alt | L Ext. | Est | O. Ext. | Total | ||
---|---|---|---|---|---|---|---|---|---|---|
6,0 | 6,0 | 3,0 | 0 | 2,0 | 15,0 | 0 | 32,0 | |||
Patrones en cadenas de ADN. Similaridad de secuencias. Secuenciación de ADN. Bases de datos para ADN.
|
Total por tipo | T | P | L | Alt | L Ext. | Est | O. Ext. | Total |
32,0 | 29,0 | 12,0 | 0 | 11,0 | 59,0 | 0 | 143,0 | |
Horas adicionales dedicadas a la evaluación | 5,0 | |||||||
Total horas de trabajo para el estudiante | 148,0 |
En las clases de laboratorio se implementarán variaciones de los algoritmos vistos en teoría y problemas, o bien se aplicarán las técnicas en situaciones relativamente reales de búsqueda de información.
Algunas sesiones de laboratorio pueden exigir un tiempo de preparación previa. En algunas sesiones se pedirá la redacción de un informe corto o bien la entrega del código desarrollado, que contarán para la evaluación de la asignatura.
Actualmente se está usando el paquete Lucene.
Habrá una primera prueba parcial a mitad de curso, y a final de curso los estudiantes podrán escoger entre hacer un segundo parcial o bien un examen final de toda la asignatura.
La nota de laboratorio se calculará en base a los informes o a los programas entregados después de las sesiones de laboratorio.
La nota de la asignatura se calculará como:
Estudiantes que elijan hacer el 2o parcial:
0.2 * nota laboratorio
+ 0.4 * prueba parcial 1
+ 0.4 * prueba parcial 2
Estudiantes que elijan hacer el examen final:
0.2 * nota laboratorio
+ max (0.2 * prueba parcial 1 + 0.6 * examen final, 0.8 * examen final)
Capacidad para hacer programas medios, preferentemente con orientación a objetos.
Capacidad para diseñar y analizar estructures de datos sencillas.
Conocer la distinción entre memoria principal y memoria secundaria y su impacto en la eficiencia de los programas.