Abstract

Ten search engines, Altavista, Excite, Hotbot, Infoseek, Lycos. Magellan, OpenText, WebCrawler, WWWWorm, Yahoo, were evaluated, by means of a questionnaire with 20 items (adding up to a total of 200 questions). The 20 first results for each question were analysed in terms of relevance, and values of precision and recall were computed for the resulting 4000 references. The results are also analyzed in terms of the type of question (boolean or natural language) and topic (specialized vs. general interest). The results showed that Excite, Infoseek and AltaVista performed generally better. The conclusion of this methodological trial was that the method used allows the evaluation of the performance of Information Retrieval Systems in the Web. As for the results, web search engines are not very precise but extremely exhaustive.

Highlights

  • Ten search engines, Altavista, Excite, Hotbot, Infoseek, Lycos, Magellan, OpenText, WebCrawler

  • Ma Dolores Olvera Lobo meros 20 ítemes recuperados en respuesta a cada una de las preguntas

  • Los rasgos principales del mismo son: a) incorporar usuarios reales que plantean preguntas reales; b) analizar la relevancia de los veinte primeros resultados expresada en una escala de cuatro grados; e) usar las medidas de exhaustividad y precisión para evaluar la RI

Read more

Summary

Introducción

El trabajo que se presenta, continuación de otro publicado en esta misma revista, se basa en una tesis doctoral defendida en la Universidad de Granada en marzo de 1999 (1). Por ello los resultados de este estudio no serían útiles hoy día para ayudar a un usuario a elegir el buscador web a utilizar; sin embargo, esa tampoco fue en ningún momento su finalidad, ya que la investigación realizada se centró en el diseño del método de evaluación. Una vez realizado el análisis se encontró que los más estudiados eran, en este orden, Lycos, Altavista, Infoseek, Excite, OpenText, WebCrawler, Hotbot, Yahoo, Magellan y WWWWorm por lo que éstos son los que aquí se han considerado. Había buscadores «puros» (es decir, sin índice temático de páginas web en esas fechas, como Altavista y Hotbot), otros «híbridos» (corno Infoseek y Lycos, que incluían, además de una base de datos compilada por un robot o araña, un directorio) y algunos que incorporan servicios de evaluación de páginas web, como Excite y Magellan. Este estudio se centra en el funcionamiento de sus motores de búsqueda

Aplicación del método propuesto
DetermiDaclón de las necesidades de Información de los usuarios
Elaboración del enunciado de búsqueda mediante la sintaxis correspondiente
Reallzadón de las consultas en los sistemas
Valoración de la relevancia por asesores externos
Análisis de los resultados: exhaustividad-precisión
Conclusiones
Líneas de investigación futuras
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.