Tema: Introducción a Internet
Subtema: Herramientas de búsqueda web
Autor: Omar Villota Hurtado
© 2004
Objetivo del Tema: Alfabetizar de manera digital a iniciados en Periodismo sobre la diferencia sustancial entre comunicación interpersonal y comunicación producida a través de los nuevos medios de comunicación.
Objetivo del Subtema: Estudiar los diferentes tipos de herramientas de búsqueda web, dadas las características del hospedaje documental de las bases de datos debido a la heterogeneidad de las publicaciones.
Generalidad
Internet es una red de computadores enlazados mediante el protocolo de comunicación PTC/IP, cuya finalidad es almacenar categorías documentales y ofrecer diferentes servicios en línea para favorecer actividades colaborativas basadas en la interacción con la comunidad y el entorno.
Los diversos tipos de herramientas de búsqueda web, le permiten al usuario encontrar
- variadas publicaciones,
- millones de tipos de documentos, sean artículos científicos, páginas personales, páginas comerciales, etc.,
- múltiples tipos de datos como páginas web, elementos multimedia y formatos de archivos,
- decenas de lenguajes de programación estándar para dar estructura interna a las páginas web, la mayoría codificada en lenguaje HTML, una especificación aprobada por el W3C, dada la sintaxis del Technical Architecture Group (TAG: principios para la construcción de documentos y para el consenso sobre la arquitectura Web),
- miles de millones de identidades del mundo entero, como autores de contenidos y otros miles más de fechas de publicación de datos o referencias bibliográficas.
La siguiente lista de herramientas de búsqueda facilita la recuperación de información según el usuario determinado. 1. Directorios Suelen ser fáciles de usar especialmente para usuarios no experimentados pues, con sólo elegir la categoría principal que más se ajuste al propósito de búsqueda y descender por aquellos nodos o subcategorías, se llega a los documentos hipertextuales que bajarán de Internet los recursos correspondientes. Permiten ojear de manera global el contenido ya que las muestras indicadas en cada uno de los nodos, referencia cuántas comparaciones y subcategorías contienen las bifurcaciones posibles desde el nodo actual. Esa cifra ayuda al usuario a concebir el volumen del contenido del índice. Las búsquedas por los nodos o subcategorías pueden ser a su vez filtradas de manera más específica al ascender o descender por la estructura del directorio. Los términos hallados están incorporados al contexto de la categoría en la que se efectúe la búsqueda, lo cual disminuye el "caos". Los recursos disponibles han pasado por un proceso de selección de calidad, generalmente efectuado por documentalistas. Los resúmenes temáticos mostrados sobre las subcategorías suelen estar elaborados intelectualmente, por lo que realmente describen su contenido. Cubren una pequeña fracción de los recursos existentes en la web, ya que estas búsquedas muestran lo hospedado en ese directorio particular. No existen criterios homogéneos para seleccionar, clasificar y describir la documentación. La indexación documental sin recursos automáticos deja de ser útil para el seguimiento a los cambios en los contenidos, direcciones web, aparición o desaparición de archivos, etc. Yahoo!, Open Directory Project, C4. 2. Buscadores Permiten búsquedas exhaustivas dado que el proceso de recogida de recursos y de indexación es automático. Este sistema incluye la información agregada en los Directorios, lo que acarrea mostrar millones de páginas web. Utilizan también mecanismos automáticos para seguir los cambios en los contenidos, en las direcciones web, en la aparición o desaparición de archivos. Algunos buscadores incluso guardan una copia en memoria caché de los documentos tal como estaban en el momento en que fueron explorados. Existen buscadores especializados para todos los campos del conocimiento. Facilitan usar sinónimos y traducciones de idiomas sobre las palabras claves y los mismos documentos para ampliar el campo de búsqueda. Su uso es bastante más complejo que la búsqueda por los Directorios ya que requiere un mayor esfuerzo por parte del usuario al configurar la herramienta "Búsquedas Avanzadas" debido a que éstas se internan en las categorías anteriores. Cada buscador tiene su propia sintaxis para expresar la consulta bajo operadores booleanos, de adyacencia, de existencia, de exactitud, y que es preciso conocer y diferenciar. Se requiere formular consultas determinadas para obtener resultados igualmente precisos, ya sea a través de términos, operadores lógicos y delimitando adecuadamente la búsqueda por fechas, por etiquetas HTML, por tipo de fuente, por área geográfica, por idioma, etc. Los recursos indexados por los robots no han pasado generalmente por ningún proceso de selección de calidad por lo que los resultados puede mostrar inconsistencias. 3. Multibuscadores Permiten ejecutar selecciones más extensivas a través de amplias configuraciones de "Búsquedas Avanzadas". El usuario al acceder al website del Metabuscador ejecuta la búsqueda sin recordar los nombres ni direcciones de los Buscadores, pues este robot se encarga de hacerlo. El usuario debe aprender a usar la interfaz para realizar sus búsquedas pues cada Multibuscador trae su propia configuración. El usuario debe teclear los términos de su consulta una vez, empleando la lógica booleana, palabras claves, thesaurus, frases exactas, etc. o utilizar las herramientas de búsqueda adicionales del Multibuscador para que al final liste los documentos solicitados. La sintaxis con que los autores codifican sus documentos hipertextuales no es la más adecuada, la mayoría de las veces, y por tanto, al formular la consulta, puede que los Multibuscadores muestren millones de resultados. Se aconseja, entonces, realizar varias búsquedas empleando distintas técnicas. 4. Colecciones de herramientas de búsqueda El usuario puede emplear gran cantidad de servicios de búsqueda sin tener que recordar los sitios de hospedaje. El usuario no tiene que cargar la página de presentación de cada una de las herramientas de búsqueda en el directorio Favoritos del browser, lo que supone ahorro de tiempo teniendo en cuenta que los servicios de búsqueda presentan una interfaz bastante cargada de publicidad. Las colecciones ofrecen escasa ayuda en cuanto a una sintaxis apropiada para cada uno de los formularios. Cada sitio web tiene a veces su motor de búsqueda autónomo que efectúa la selección del documento por categorías de título, autor y fecha. Pero la sintaxis con que se indexaron los documentos no se le muestra al usuario. En caso contrario, el sitio invoca desde un hipervínculo interno a una de las anteriores herramientas de búsqueda para que ingrese a su base de datos y proceda. Cualquier website con motores de búsqueda: El Tiempo, Iniciativa de Comunicación, Amazon. 5. Bibliotecas digitales y virtuales La metodología de diseño contiene estándares archivísticos para fortalecer y desarrollar los servicios de información básicos, especializados y de extensión. Generalmente son iniciativas de universidades o corporaciones culturales que intentan promover proyectos o se interesan por el conocimiento, el estudio y la difusión de la cultura. Divulgan publicaciones de organizaciones especializadas, documentos con mayor demanda, e-books cuyas existencias impresas se encuentran agotadas, investigaciones, estudios, etc. Hay bancos documentales que ayudan a encontrar boletines, glosarios, periódicos, contactos, legislación, formación de usuarios, etc. Como ayuda de tareas son sitios convenientes en resolver cuestiones temáticas, encontrar respuesta a muchas preguntas académicas. No obstante, se deben respetar los derecho de autor y de copia sobre los documentos encontrados. Contiene información útil para bibliotecas, bibliotecarios y demás personas interesadas en conocer programas, centros e instituciones que promueven la lectura y la investigación. Algunas colecciones no ofrecen acceso libre a los documentos o al texto completo, por lo que el usuario debe inscribirse al servicio o darse de alta en una red digital de Bibliotecas. Los archivos se presentan usualmente en formato .pdf, lo que requiere del software lector gratis Acrobat Reader de Adobe, que se puede obtener de forma gratuita en el sitio oficial de Adobe. Bibliotecas colombianas con imaginación, Biblioteca digital para personas con Discapacidad Visual y Auditiva, Ventajas:
Inconvenientes:
Ejemplos:
Ventajas:
Inconvenientes:
Ejemplos:
Ventajas:
Inconvenientes:
Ejemplos:
Metacrawler, Search, Hotbot.Ventajas:
Inconvenientes:
Ejemplos:
Ventajas:
Inconvenientes:
Ejemplos:

0 comentarios:
Publicar un comentario en la entrada