Desarrollo de motores de búsqueda utilizando herramientas open source. Jose Manuel Ortega Candel
/p>
DESARROLLO DE MOTORES DE BÚSQUEDA
UTILIZANDO HERRAMIENTAS OPEN SOURCE
Análisis y desarrollo con Apache Lucene, Solr y ElasticSearch
José Manuel Ortega Candel
DESARROLLO DE MOTORES DE BÚSQUEDA
UTILIZANDO HERRAMIENTAS OPEN SOURCE
Análisis y desarrollo con Apache Lucene, Solr y ElasticSearch
José Manuel Ortega Candel
Desarrollo de motores de búsqueda utilizando herramientas open source
© 2021 José Manuel Ortega Candel
Primera edición, 2021
© 2021 MARCOMBO, S. L.
Diseño de cubierta: ENEDENÚ DISEÑO GRÁFICO
Maquetación: D. Márquez
Corrección: Nuria Barroso y Anna Alberola
Directora de producción: M.a Rosa Castillo Producción del ePub: booqlab
«Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta obra solo puede ser realizada con la autorización de sus titulares, salvo excepción prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra».
ISBN: 978-84-267-3336-8
Este libro va dedicado a aquellos que me han seguido, me siguen y me seguirán, no importa cuál sea el camino escogido, en algún lugar nos encontraremos.
ÍNDICE
INTRODUCCIÓN A LOS MOTORES DE BÚSQUEDA
1.1 Definición de motores de búsqueda
1.2 ¿Por qué necesito un motor de búsqueda?
1.2.1 Extracción de texto en documentos
1.3 Funcionamiento de un motor de búsqueda
1.3.1 Buscadores de directorios
1.3.3 Spiders (arañas o crawlers)
1.4.1 Rendimiento en la indexación de documentos
1.5 Recuperación de la información
1.5.1 Extracción de información
1.5.2 Sistema de búsqueda/respuesta
1.6 Motores de búsqueda e indexadores
1.6.5 Otros motores de búsqueda
1.7 Herramientas de procesamiento de lenguaje natural (PLN)
2.1 Introducción a Apache Lucene
2.2 Módulos y funcionalidades de Apache Lucene
2.3 Arquitectura de Apache Lucene
2.3.1 Proceso de tokenización y búsqueda en Apache Lucene
2.4 Trabajar con Apache Lucene
2.4.1 Configuración del entorno
2.4.3 Crear y escribir documentos en un índice
2.5 Realizar búsquedas en Apache Lucene
2.5.1 Obtención de un IndexSearcher