Búsqueda de datos en Internet mediante motores de búsqueda. ¿Cómo se busca información en Internet? Búsqueda de idiomas Yandex

Enviar su buen trabajo en la base de conocimientos es sencillo. Utilice el siguiente formulario

Buen trabajo al sitio">

Los estudiantes, estudiantes de posgrado y jóvenes científicos que utilicen la base de conocimientos en sus estudios y trabajos le estarán muy agradecidos.

Documentos similares

    Herramientas para buscar información en Internet. Requisitos básicos y métodos de recuperación de información. Estructura y características servicios de búsqueda. Motores de búsqueda globales WWW (World Wide Web). Planificación de la búsqueda y recogida de información en Internet.

    resumen, añadido el 02/11/2010

    Características de los métodos de búsqueda de información en Internet, en concreto mediante enlaces de hipertexto, motores de búsqueda y medios especiales. Análisis de nuevos recursos de Internet. Historia del surgimiento y descripción de los motores de búsqueda occidentales y de idioma ruso.

    resumen, añadido el 12/05/2010

    Descripción y clasificación de los sistemas modernos de recuperación de información. Documentos de hipertexto. Reseña y valoraciones de los principales motores de búsqueda del mundo. Desarrollo de un sistema de recuperación de información que demuestra el mecanismo de búsqueda de información en Internet.

    tesis, agregada el 16/06/2015

    Análisis de las capacidades de los buscadores Yandex y Google, su comparación en términos de utilidad. La historia de la creación de los motores de búsqueda, características de su interfaz, herramientas y algoritmos de búsqueda. Formación de una pregunta y criterios para responderla.

    resumen, añadido el 07/05/2011

    Consideración de los buscadores de Internet como un complejo de software y hardware con una interfaz web que brinda la posibilidad de buscar información. Tipos de motores de búsqueda: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing y Rambler.

    resumen, añadido el 10/05/2013

    La estructura y principios de la construcción de Internet, la búsqueda y el almacenamiento de información en ella. Historia de la aparición y clasificación de los sistemas de recuperación de información. El principio de funcionamiento y las características de los motores de búsqueda Google, Yandex, Rambler, Yahoo. Búsqueda por URL.

    trabajo del curso, añadido el 29/03/2013

    Esencia y principio de funcionamiento. red global Internet. Busca información por parámetros en Google. Sistemas especializados de recuperación de información: “KtoTam”, “Tagoo”, “Truveo”, “Kinopoisk”, “Ulov-Umov”. Uso adecuado de los buscadores.

    presentación, agregado 16/02/2015

    Almacenamiento de datos en Internet. Documentos de hipertexto, tipos de archivos. Archivos gráficos, sus tipos y características. Motores de búsqueda y reglas para la búsqueda de información. Revisión de los buscadores de Internet. Todo sobre los motores de búsqueda Yandex, Google, Rambler.

    trabajo del curso, añadido el 26/03/2011

Buscando información en Internet

Buscando información en Internet

Para buscar información son comúnmente utilizados tres maneras(Ver Figura 1). Primero de los cuales - buscar por dirección. Se utiliza cuando el usuario conoce la dirección de un recurso de información que contiene la información que necesita. Al organizar una búsqueda de información por dirección (la forma de la dirección - IP, dominio o URL - en este caso no importa), el usuario simplemente necesita ingresar la dirección del recurso en el campo correspondiente del navegador - un programa diseñado para proporcionar acceso a los recursos de la red.

Arroz. 1. Métodos de búsqueda de información en bases de datos de hipertexto.

Segundo- buscar mediante navegación por hipervínculos. Al utilizar este tipo de caso de búsqueda, el usuario primero debe acceder al servidor asociado a la base de datos correspondiente. Luego puede encontrar el documento mediante hipervínculos. Obviamente, este método es conveniente cuando el usuario desconoce la dirección del recurso. Los portales web están destinados a utilizarse como punto de partida para la búsqueda al implementar este método: servidores que brindan acceso directo a un determinado conjunto de servidores, incluidos los instalados en ellos. recursos informativos, así como aplicaciones Web que implementen servicios Web que se correspondan con la finalidad del portal. Los servidores accesibles a través del portal pueden pertenecer a un sistema específico (por ejemplo, corporativo) o varios sistemas y ser especialmente seleccionados en función del tipo, temática u otras características de los documentos y datos contenidos en sus sitios web. Normalmente, los portales combinan una variedad de funciones para retener al cliente el mayor tiempo posible. El servicio dominante del portal es el servicio mesa de ayuda: búsqueda, categorías, índices financieros, información meteorológica, etc. Si los sitios web en la mayoría de los casos son colecciones de páginas web estáticas, entonces los portales son colecciones software e información pre-desestructurada que estas herramientas convierten en datos estructurados a petición de usuarios específicos.

Tercero El método de búsqueda implica el uso de servidores de búsqueda de Internet. Los servidores de búsqueda son computadoras host dedicadas que albergan bases de datos de recursos de Internet. Interfaz de usuario dicho servidor tiene un campo para ingresar palabras clave que describen el tema de interés para el usuario (ver Fig. 2).

Figura 2. Vista de la ventana del servidor de búsqueda Yandex

El servidor percibe estas palabras como una solicitud de información, según la cual busca recursos y presenta al usuario una lista de los documentos encontrados. Obviamente, al implementar este método, son posibles errores tanto del tipo 1 (no alcanzar el objetivo) como del tipo 2 (ruido de información). Cabe mencionar que existen dos grupos de servidores de búsqueda: buscadores y catálogos de materias. Su diferencia se debe al método de creación y posterior reposición de la base de datos de recursos de Internet, que Este servidor realiza búsqueda de información. Así, los motores de búsqueda incluyen programa especial- robot de búsqueda. Monitorea constantemente la red, recopila información de páginas web, los indexa y registra su imagen de búsqueda en su base de datos. En los catálogos temáticos, editores especializados crean “manualmente” una base de datos de documentos de Internet. Dado que Internet no existe una administración unificada, sus recursos de información cambian constantemente. Pueden aparecer y desaparecer otros nuevos. documentos existentes. La frecuencia de actualización de la información en documentos para diferentes sitios es diferente: para algunos es varias veces por hora, para otros es una vez al día, día, mes, etc. Por lo tanto, es muy importante comprender que cuando se utilizan sistemas de recuperación de información para buscar información en Internet, la búsqueda no se realiza en el espacio real de los documentos de Internet, sino en algún modelo, cuyo contenido puede diferir significativamente del real. Contenido de Internet en el momento de la búsqueda. Según la cobertura de los recursos indexados, los motores de búsqueda se pueden dividir en dos grupos: internacionales y en ruso. Los primeros indexan todos los documentos publicados en Internet de forma consecutiva. Estos últimos indexan recursos ubicados en zonas de dominio con predominio del idioma ruso. La lista de los sistemas más populares se muestra en la tabla. 1.

Mesa 1. Motores de búsqueda más populares

Internacional Habla ruso
Google Yandex (44,4% de Runet)
Yahoo! Rambler (10,6% de Runet)
Bing Mail.ru (7,3% de Runet)
MSN Nigma (0,5% de Runet)
AltaVista Gogo.ru (0,3% de Runet)
Preguntar Aport (0,2% de Runet)

Nota: Runet es la parte de Internet en idioma ruso y comprende dominios con los nombres ru y rf.

Cabe mencionar que existe una categoría especial de servidores de búsqueda: los metabuscadores. Su diferencia fundamental con los motores de búsqueda y catálogos de materias es que no tienen su propia base de datos de índice y, por lo tanto, al recibir una solicitud de un usuario, la redirigen a varios servidores de búsqueda a la vez (Ver Fig. 3).

Arroz. 3. Esquema de funcionamiento del sistema de metabuscador

La capacidad de utilizar simultáneamente varios motores de búsqueda para una consulta es una ventaja obvia de los metabuscadores. Actualmente, el sistema Metabot.ru, cuya interfaz se muestra en la Fig. 1, ha encontrado un uso generalizado. 4. Este sistema le permite utilizar servidores de búsqueda tanto internacionales como rusos para buscar recursos.

1. Especificación de la dirección de la página . Esto es lo más de manera rápida búsqueda, pero sólo se puede utilizar si se conoce la dirección exacta del documento.

PARA BUSCAR LA INFORMACIÓN NECESARIA EN LA RED, SE UTILIZA LA DIRECCIÓN Localizador Uniforme de Recursos (URL), que contiene el nombre del protocolo mediante el cual se necesita acceder a la información requerida, dirección del servidor y nombre de archivo en este servidor, por ejemplo:

http www.kazan.ru

(estructura jerárquica - de derecha a izquierda http - protocolo de hipertexto, www - el nodo está ubicado en el espacio web).

Partes de una dirección:

Ru - Rusia (puede ser de tres letras)

Kazán - recurso de Kazán,

Www: recurso de Internet, sitio web (página web), el sitio contiene hipervínculos que le permiten navegar por el flujo de información como una muñeca rusa. El programa de navegación le permite no perderse (Página de inicio).

Http es el protocolo de transferencia de hipertexto.

En términos de protocolos, Internet utiliza varios tipos de protocolos que han surgido con el tiempo y el desarrollo. tecnologia computacional. Estos incluyen el protocolo telnet de texto, protocolo de archivo ftp, protocolo de teleconferencia usenet, protocolo de base de datos wais, protocolo gopher, etc.

2. Contactar con un servidor de búsqueda (motor de búsqueda). El uso más común de los motores de búsqueda. manera conveniente buscando información.

Actualmente, los siguientes servidores de búsqueda son populares en la parte de Internet de habla rusa:

Ejemplo de motores de búsqueda:

www.rambler.ru

www.goo-gle.ru

El motor de búsqueda encuentra la dirección del sitio mediante palabras clave, incluso frases.

Hay otros motores de búsqueda. Por ejemplo, se implementa un sistema de búsqueda eficaz en el servidor. servicio Postal correo.ru.

Idioma de consulta del motor de búsqueda

Un grupo de palabras clave formado de acuerdo con ciertas reglas, utilizando un lenguaje de consulta, se denomina solicitud a un servidor de búsqueda. Los lenguajes de consulta para diferentes servidores de búsqueda son muy similares. Puede obtener más información al respecto visitando la sección "Ayuda" del servidor de búsqueda deseado. Consideremos las reglas para realizar consultas utilizando el motor de búsqueda Yandex como ejemplo.

Sintaxis del operador ¿Qué significa operador? Solicitud de ejemplo
espacio o & AND lógico (dentro de una oración) fisioterapia
&& AND lógico (dentro del documento) recetas && (queso procesado)
I O lógico foto | fotografía | burlarse | imagen fotográfica
+ Presencia obligatoria de la palabra en el documento encontrado. +ser o +no ser
() Agrupar palabras (tecnología\producción) (queso\requesón)
~ Operador binario AND NOT (dentro de una oración) bancos ~ ley
~~ o ___ Operador binario AND NOT (dentro del documento) guía de París ~~ (agencia | tour)
/(nm) Distancia en palabras (menos (-) - atrás, más (+) - adelante) proveedores /2 café música /(-2 4) vacantes educación - /+1 estudiantes
“ ” buscar una frase "caperucita roja" Equivalente a: caperucita roja /+1
&&/(n·m) Distancia en oraciones (menos (-) - atrás, más (+) - adelante) banco && /1 impuestos

Para obtener los mejores resultados de búsqueda, debe recordar algunas reglas simples:


No busques información usando una sola palabra clave.

Es mejor no introducir palabras clave en mayúsculas, ya que esto puede provocar que no se encuentren las mismas palabras escritas en minúsculas.

Si no obtiene ningún resultado de su búsqueda, revise sus palabras clave para detectar errores ortográficos.

Los motores de búsqueda modernos ofrecen la posibilidad de conectar un analizador semántico a una consulta generada. Con él, puede ingresar una palabra y seleccionar documentos en los que se encuentran derivados de esta palabra en varios casos, tiempos, etc.

La forma más accesible y cómoda de buscar información en la World Wide Web es utilizar motores de búsqueda. En este caso, la búsqueda de información se puede realizar mediante catálogos, así como mediante un conjunto de palabras clave que caractericen el documento de texto que se busca.

Veamos el uso de servidores de búsqueda con más detalle. El servidor de búsqueda contiene una gran cantidad de enlaces a una amplia variedad de documentos, y todos estos enlaces están sistematizados en directorios temáticos. Por ejemplo: deportes, cine, coches, juegos, ciencia, etc. Además, estos enlaces son instalados por el servidor de forma independiente, de forma automática al visualizar periódicamente todas las páginas web que aparecen en la World Wide Web.

Además, los servidores de búsqueda brindan al usuario la posibilidad de buscar información mediante palabras clave. Después de ingresar palabras clave, el servidor de búsqueda comienza a ver documentos en otros servidores web y a mostrar enlaces a aquellos documentos en los que aparecen las palabras especificadas. Normalmente, los resultados de la búsqueda se ordenan en orden descendente de una clasificación de documento especial, que muestra en qué medida un documento determinado cumple con las condiciones de búsqueda o con qué frecuencia se solicita en Internet.

Algunas direcciones importantes:

www.kros.ru - Red educativa regional de Kazán,

www.edu.ru - sitio web del Ministerio de Educación de Rusia,

www.fio.ru - Federación de Educación en Internet.

3. Navegación mediante hipervínculos. Este es el método menos conveniente, ya que se puede utilizar para buscar documentos que sólo tienen un significado cercano al documento actual. Si documento actual está dedicado, por ejemplo, a la música, entonces, utilizando los hipervínculos de este documento, es poco probable que pueda acceder a un sitio dedicado a los deportes

El problema de la búsqueda y los medios de su organización.

Grandes volúmenes de información disponibles en Internet, en continuo aumento, incl. operacional, hace que el problema de encontrar la información necesaria sea muy relevante y complejo. La velocidad de búsqueda de la información necesaria determina en gran medida la profesionalidad del internauta. Vale decir que para automatizar esta tarea se necesitan diversos, tanto extranjeros como sistemas domésticos búsqueda, que son tipos especiales de páginas web. Al mismo tiempo, a pesar de la disponibilidad de numerosas herramientas de automatización de búsqueda, esta tarea sigue siendo bastante laboriosa y requiere que el usuario tenga cierta experiencia, intuición y conocimiento de la terminología utilizada en su área temática.

Una estimación publicada en Nature el 8 de julio de 1999 situaba el número de páginas web indexadas públicamente en 800 millones. Un año después, el autor del estudio (Steve Lawrence del Instituto de Investigación NEC) creía que ese número casi se había duplicado hasta los 1.500 millones. los mejores motores de búsqueda no indexan más de una página de cada seis. Vale decir, para extraer información útil de Internet, necesita saber dónde y cómo buscar.

La herramienta de búsqueda de Internet Explorer facilita el acceso a las herramientas de búsqueda sin tener que conocer las direcciones de los motores de búsqueda. En este caso, es mejor contactar directamente con los motores de búsqueda cargando la página correspondiente.

Según el método de organización de la búsqueda y las capacidades proporcionadas, todas las herramientas de búsqueda se pueden dividir en los siguientes grupos:

catálogos y bases de datos especializadas;

los motores de búsqueda;

Metabuscadores.

Catálogos y bases de datos

Los catálogos de la WWW son similares a los catálogos sistemáticos de las bibliotecas. La búsqueda en directorios consiste en un movimiento secuencial a través de una lista jerárquica de enlaces llamados encabezados o categorías. La primera página del catálogo contiene enlaces a temas importantes, como Cultura y Arte; Medicina y salud; Sociedad y Política; Negocios y Economía; Entretenimiento, etc. Al hacer clic con el mouse en un enlace (categoría) determinado, se abre una página que contiene enlaces que detallan el tema (categoría) seleccionado. Al bajar por las categorías detalladas, puede encontrar una página con la información necesaria. En cada página que se abre al desplazarse por el catálogo de una forma u otra, se indica la secuencia de subcategorías visualizadas, por ejemplo, Business World: Finance: Analytics, etc.

Todos los catálogos son creados y actualizados manualmente por especialistas, de forma similar a cómo los bibliógrafos compilan y mantienen los catálogos de las bibliotecas. Es pertinente señalar que la descripción del documento la realizan ya sea los compiladores del catálogo o el autor. Gracias a ello, el contenido de las páginas incluidas en el catálogo es el más adecuado a la categoría en la que están clasificadas. Pero, dada la velocidad de reposición y cambio de información en Internet, el método "manual" de mantener catálogos no permite reflejar adecuadamente el estado real de los recursos de Internet sobre este tema.

Los motores de búsqueda

(motores de búsqueda, servidores de búsqueda, robots de búsqueda)

Hay docenas de sitios web grandes y miles de sitios web pequeños y especializados diseñados para búsquedas en Internet. Las herramientas de búsqueda del grupo ϶ᴛᴏ permitirán al usuario, de acuerdo con ciertas reglas, formular los requisitos para la información que necesita (utilizando un lenguaje de consulta para crear una consulta. Después de esto, el motor de búsqueda busca automáticamente los documentos en los sitios). controla (indexa) y selecciona aquellos que "en la opinión" servidor de búsqueda, ϲᴏᴏᴛʙᴇᴛϲᴛʙrequisitos formulados por el usuario (relevantes para la solicitud) Los nodos de búsqueda pueden utilizar sus propios índices de Internet, actualizados constantemente mediante programas especiales llamados arañas. examina la Web, comprobando cada enlace de una determinada página, luego los enlaces a las páginas a las que se dirige, etc., e informa a su propietario de información sobre todas las páginas para su posterior indexación.

Como resultado de la búsqueda se crean una o varias páginas que contienen enlaces a documentos relevantes para la solicitud (páginas web). Vale decir que para cada enlace se indica la fecha de creación del documento, su volumen, el grado de relevancia. a la solicitud, y normalmente también se indican fragmentos de texto que caracterizan el contenido del documento. Al hacer clic en dicho enlace podrá cargar la página que le interesa. En el caso de una gran cantidad de documentos encontrados, puede aclarar la solicitud y repetir la búsqueda con ella, pero solo entre las páginas seleccionadas (dicha búsqueda se llama de manera diferente en diferentes máquinas, pero generalmente ϶ᴛᴏ - buscar en los encontrados) En varios motores de búsqueda, puede utilizar un método determinado para cambiar el enlace a la página cuyo contenido se adapta mejor a sus necesidades y repetir la búsqueda, solicitando buscar otras similares.

La ventaja de la búsqueda automatizada es esencialmente que permite visualizar grandes volúmenes de información disponible en Internet. este momento. Al mismo tiempo, la complejidad de una descripción precisa de la solicitud que refleje adecuadamente sus necesidades de información, así como la complejidad aún mayor de la tarea de determinar automáticamente el grado de páginas vistas para su solicitud, lleva al hecho de que el número El número de páginas seleccionadas “en la primera visita” es tradicionalmente muy pequeño o excesivamente grande. En general, una búsqueda mediante un motor de búsqueda es un proceso iterativo (de múltiples pasadas), como resultado del cual la forma de la solicitud se perfecciona gradualmente.

Metabuscadores

Como se señaló anteriormente, cualquier motor de búsqueda escanea un determinado conjunto de servidores y selecciona documentos según sus propios criterios. Como resultado, buscar con diferentes sistemas utilizando las mismas palabras clave arroja resultados diferentes. Esto llevó a la idea de crear los llamados sistemas de metabúsqueda (o multibúsqueda), que no buscan nada por sí mismos, sino que recurren a varios motores de búsqueda en busca de ayuda a la vez. Tenga en cuenta que cada uno de los metabuscadores tiene su propio lenguaje de consulta. El sistema traduce una consulta formulada en su idioma a los idiomas de consulta utilizados por cada buscador. A continuación, los resultados de búsqueda de todos los sistemas se combinan y se presentan de forma clara. Naturalmente, la búsqueda mediante metabuscadores lleva más tiempo en comparación con los motores de búsqueda convencionales.

Revisión de los motores de búsqueda más populares.

En Internet existe una gran cantidad de buscadores y cada usuario se centra en aquel al que está acostumbrado o al que sus compañeros le aconsejan utilizar. Utilicemos una breve descripción de los motores de búsqueda más populares, que se encuentra en uno de los sitios.

1. Google (www.google.com) El motor de búsqueda más grande y rápido. Se han indexado más de 1.300 millones de páginas (de las cuales un poco más de 700 millones están completamente indexadas, del resto sólo se conoce la dirección y el texto del enlace. La búsqueda se realiza normalmente utilizando recursos en ruso (por supuesto, sin formas de palabras). , es posible seleccionar el idioma de la interfaz. Puede incluir/excluir resultados de sitios y/o dominios específicos. A diferencia de la mayoría de los motores de búsqueda, Google evalúa la popularidad de un recurso por la cantidad de enlaces que conducen a él desde otras páginas. Hay una búsqueda orientada a temas (Apple Macintosh, BSD UNIX, Linux, búsquedas del gobierno de EE. UU. y universidades) en los recursos de las principales instituciones científicas y educativas.

2. Yandex (www.yandex.ru) Lo mejor de los motores de búsqueda nacionales. Indexa principalmente recursos en idioma ruso, mientras que sus capacidades no son inferiores a las de los sistemas extranjeros. La búsqueda se puede realizar de forma exacta o en cualquier forma de palabra, con limitación de fecha, indicando el sitio o su subdirectorio. Puede realizar búsquedas basadas en el llamado índice de citas, buscar imágenes, guiones, subprogramas; establecer el idioma del documento. Los enlaces necesarios se encuentran tradicionalmente en los diez primeros resultados. Tiene una versión "ligera" (con un mínimo de elementos de diseño) en http://www.ya.ru.

3. AltaVista (www.altavista.com) Proporciona una gran ampliación de los criterios de búsqueda: en la búsqueda avanzada hay una opción de período de tiempo, que incluye la fecha de creación o modificación del recurso, soporte para 25 idiomas; existe la posibilidad de devolver un resultado por sitio (restringe la búsqueda sin sacrificar la calidad). La búsqueda avanzada tiene un conjunto estándar de funciones. Hasta hace poco, AV era un portal grande, pero por razones financieras (y otras) redujo significativamente la cantidad de servicios.

4. Yahoo! (www.yahoo.com) Es importante señalar que es uno de los primeros motores de búsqueda en Internet. Además conjunto estándar funciones, le permite seleccionar recursos por fecha (4 años, 1, 3, 6 meses, semana, 1, 3 días) Admite la capacidad de especificar el signo "*" en lugar de cualquier secuencia de caracteres en las palabras clave. En Yahoo! Se ha elaborado un gran catálogo estructurado de categorías, primero se realiza la búsqueda en ellas, luego en su propio archivo y luego mediante. sistemas de google. La búsqueda por categorías da buenos resultados: no hay muchas y son muy buenas.

5. Lycos (www.lycos.com) Recientemente, uno de los sistemas más populares. Al mismo tiempo, no proporciona ninguna capacidad especial: "Y" "O", búsqueda de frases, presencia/ausencia obligatoria de una palabra; en funciones avanzadas: búsqueda por título, URL, nombre de host y/o nombre de dominio; 25 idiomas, incluido el ruso; en una palabra, todo el conjunto "generalmente aceptado". Puede especificar el tipo de contenido del recurso: automático, libros, ftp, descargas, noticias, etc. Obviamente, la popularidad de Lycos es consecuencia de la escala de este gran proyecto.

6. Rambler (www.rambler.ru) Hasta hace poco, el motor de búsqueda ruso más famoso. La búsqueda avanzada no permite buscar frases y la búsqueda regular hasta febrero de 2010 rara vez arrojaba resultados aceptables. Desde febrero, el sistema utiliza un mecanismo de búsqueda mejorado, el diseño ha cambiado, pero en términos de calidad, Rambler aún no es igual a Yandex y Aport (según el autor que analiza los motores de búsqueda, el sitio contiene un catálogo de calificaciones). recursos Rambler Top 100, una de las reconocidas fuentes de información estadística sobre proyectos de Internet.

7. Aport (www.aport.ru) Otro buen servidor de búsqueda ruso. La búsqueda se realiza por texto (sólo en todas las formas de palabras) y por URL, utilizando operadores logicos y el operador “…” (sin embargo, las palabras vacías en la frase aún se ignoran), por fecha y en campos individuales (título, descripción, etc.), metacaracteres * y! La presentación de los resultados de búsqueda es la mejor diseñada en comparación con otros motores de búsqueda rusos. El diseño de la página principal, claramente sobrecargada de información, genera algunas dudas. Hay una versión un poco más "fácil" en http://aport.ru.

Cómo elegir un motor de búsqueda

Al buscar en Internet, dos componentes son importantes: integridad (no se perdió nada) y precisión (no se encontró nada superfluo). Por lo general, todo se llama en una palabra: relevancia, es decir, la respuesta a la pregunta.

1. Cobertura y profundidad

Por cobertura nos referimos al volumen de la base de datos del motor de búsqueda, que se mide mediante tres indicadores: el volumen total de información indexada, el número de servidores únicos y el número de documentos únicos. Por profundidad nos referimos a si existe un límite en el número de páginas o en la profundidad de anidamiento de directorios en un servidor.

Cómo comprobarlo: algunas máquinas escriben estadísticas de robots en un sitio web. Pero puede comprobarlo usted mismo: debe configurar varias consultas de búsqueda que consten de una palabra (para excluir la influencia del lenguaje de consulta, incluidas las diferentes interpretaciones del espacio) y, al mismo tiempo, observar las estadísticas de los resultados obtenidos por la máquina: generalmente al principio de la lista se indica cuántos documentos se encontraron. Además del hecho de que las palabras deben ser de diferentes áreas, también es bueno tomar palabras de diferente peso: raras, "medias" y "pesadas" (frecuencia) y comparar la cantidad encontrada. Las palabras pesadas, en particular, prueban el texto completo (indexación de todas las palabras de un documento) de un motor de búsqueda.

Es más difícil comprobar la profundidad del rastreo del robot; para ello, es necesario tomar algunos sitios, por ejemplo, con una estructura de archivo ramificada, y comprobar si los documentos están indexados, a los que solo se puede acceder, por ejemplo, con 6 clics. en los enlaces.

2. Velocidad de rastreo y relevancia de los enlaces.

La velocidad de rastreo de la Web muestra qué tan rápido se indexa un recurso recién agregado y qué tan rápido se actualiza la información en la base de datos. No olvide que un indicador importante de la calidad de un motor de búsqueda (su robot) será no sólo la captura de nuevos territorios, sino también el seguimiento del estado de los ya cubiertos. Los servidores desaparecen y permanecerán, las páginas que contienen se actualizan. Los enlaces que un motor de búsqueda produce en la lista de lo que encontró deben, en primer lugar, existir y, en segundo lugar, su contenido debe corresponder a la solicitud.

Cómo comprobarlo: Se puede obtener información objetiva analizando los registros del servidor: un robot de motor de búsqueda generalmente se presenta por el nombre de su máquina (o similar), para que pueda ver con qué frecuencia visita el servidor, cuántas páginas visita, etc. . Desafortunadamente, normalmente sólo el registro de su sitio está disponible para su estudio, por lo que el método experimental permanece.

Para determinar la velocidad de rastreo, debe crear una página de texto en algún lugar, agregarla a los motores de búsqueda y ver qué tan rápido comienza a aparecer. O cambiar una página existente. Vale decir que para determinar la relevancia de los enlaces, consulte los documentos al menos en la primera página de la lista encontrada para varias consultas. Mensaje Extraviado indica que el documento ya no existe.

3. Calidad de la búsqueda (indicador subjetivo)

Vale la pena decir que cada motor de búsqueda tiene un algoritmo para ordenar los resultados de la búsqueda. Cuanto más cerca del principio de la lista esté el documento que necesita, mejor será su relevancia.

Cómo comprobarlo: Sólo mediante experimento. Se recomienda realizar consultas de diferentes longitudes para comparar. También puede utilizar el lenguaje de consulta, mientras que aquellos que se resisten a leer la descripción pueden utilizar la página de consulta ampliada ("búsqueda avanzada" en Aport y Yandex, "consulta detallada" en Rambler - opciones de traducción al ruso "búsqueda avanzada")

Además de la relevancia, existen características importantes del usuario.

4. Velocidad de búsqueda

Si un motor de búsqueda responde con lentitud, trabajar con él no resulta eficaz. Vale la pena agregar que la velocidad visible para el usuario depende no solo del propio motor de búsqueda, sino también de los canales de Internet.

Cómo comprobarlo: mediante experimento: debe buscar consultas de diferentes longitudes, diferentes<тяжести>palabras y en diferente tiempo días (la carga del servidor es significativamente desigual a lo largo del día, el pico es alrededor de las tres o cuatro de la tarde)

5. Capacidades de búsqueda (trabajar con lenguaje de documento, lenguaje de consulta)

Otro punto de comparación es qué y cómo entra exactamente el motor de búsqueda en el índice. Vale la pena decir que un motor de búsqueda de texto completo indexa todas las palabras del texto visibles para el usuario. La presencia de morfología permite encontrar las palabras buscadas en todas las declinaciones o conjugaciones. Además de esto, en lenguaje HTML hay etiquetas que también pueden ser procesadas por un motor de búsqueda (títulos, enlaces, pies de foto, etc.)

Casi todas las máquinas tienen un lenguaje de consulta en forma de operadores lógicos estándar (Y, O, NO). Algunas personas saben cómo buscar frases o palabras a una distancia determinada; esto suele ser importante para obtener un resultado razonable. Una opción adicional será buscar en áreas de documentos: títulos, enlaces, palabras clave (META KEYWORDS), etc. Característica adicional lenguaje de consulta: una consulta en lenguaje natural que no requiere conocimiento de los operadores.

Cómo comprobarlo: normalmente esta información se publica en el servidor del motor de búsqueda (en Ayuda). Tenga en cuenta que, no obstante, se recomienda comprobarlo. solicitudes reales, porque a veces lo que se desea se presenta como realidad.

6. Servicios adicionales

Estas son características adicionales que el motor de búsqueda ofrece a los usuarios. Esto incluye todo tipo de opciones de búsqueda (páginas especializadas, búsqueda de documentos similares, limitación del área de búsqueda), una lista de servidores encontrados, búsqueda por fecha y servidor, una cómoda interfaz de motor de búsqueda y la posibilidad de personalizarla.

Cómo comprobarlo: Es posible que la información esté parcialmente publicada en el servidor del motor de búsqueda, pero es mejor intentar trabajar con estas funciones usted mismo.

Está claro que este análisis llevará algún tiempo. Además, los motores de búsqueda, como todo Internet, no se quedan quietos. Al mismo tiempo, dado que la búsqueda de información es uno de los componentes importantes de la tecnología informática, se le debe prestar suficiente atención, al menos nada menos que a la capacidad de trabajar en una red local.

Se realizó una encuesta en Yandex.ru: por qué se necesita Internet y qué falta (http://www.yandex.ru/polling/9.html) Los datos de la encuesta se distribuyeron en orden descendente de la siguiente manera: Internet se utiliza como libro de referencia (23,76%), herramienta de investigación (15,45%), entretenimiento (14,15%) y sólo en cuarto lugar como fuente de noticias (12,32%). Parecía optimista que el 10% de los usuarios siempre , y el 73% a menudo se puede encontrar Información necesaria. Y en Internet falta: información, buena búsqueda y orden (incluyendo: orden, estructura, estructura, estructura, estructura, así como sistema, sistematización, sistematización, sistematización y sistematización)

RESPONDE A LAS PREGUNTAS:

Nombre qué métodos para organizar las búsquedas existen en Internet.

¿Cómo se busca la información en catálogos y bases de datos?

¿Cómo se ingresa la información en catálogos y bases de datos?

¿Qué son los motores de búsqueda en Internet?

¿Cómo se forma una base de datos de información en los motores de búsqueda?

¿Dónde comienza la búsqueda de información en los buscadores?

¿Qué es una solicitud?

¿Cómo se busca la información en los motores de búsqueda?

¿Qué quiere decir con relevancia para una consulta?

¿Qué se puede hacer en caso de que se encuentre una gran cantidad de documentos durante la búsqueda adicional?

¿Qué son los metabuscadores?

¿Cuál es la diferencia fundamental entre los metabuscadores y los motores de búsqueda habituales?

¿Cuáles de los siguientes sistemas serán metabuscadores?

¿Cuáles son los motores de búsqueda nacionales más populares?

¿Cuáles son los motores de búsqueda extranjeros más populares?

¿Qué dos componentes son importantes a la hora de buscar información en Internet?

¿Qué características determinan la eficacia de los buscadores a la hora de buscar información en Internet?

Condiciones de uso:
Derechos intelectuales sobre el material - Redes informáticas de información - Borisov N.A., Lukin A.A. pertenecen a su autor. Este manual/libro se publica únicamente con fines informativos sin participación en la circulación comercial. Toda la información (incluido el “Tema 3. Búsqueda de información en INTERNET”) se recopila de fuentes abiertas o los usuarios la agregan de forma gratuita.
Para uso completo información publicada La administración del sitio web del proyecto recomienda encarecidamente comprar el libro / manual Información sobre redes informáticas - Borisov N.A., Lukin A.A. en cualquier tienda online.

Bloque de etiquetas: Redes informáticas de información - Borisov N.A., Lukin A.A., 2015. Tema 3. Búsqueda de información en INTERNET.

(C) Sitio web del repositorio legal 2011-2016

Tema de la lección: Búsqueda de información en Internet

Libro de texto: L. L. Bosova, A. Ya. Bosova “Informática 9” Tipo de lección: lección sobre el descubrimiento y la adquisición de nuevos conocimientos, habilidades y habilidades

El propósito de la lección: presentar a los estudiantes los conceptos básicos de “motor de búsqueda”, “directorio de enlaces”, “motor de búsqueda” y mostrar uso práctico lenguaje de consulta, enseñar cómo buscar información en Internet.

Objetivos de la lección:

  • Educativo: - presentar a los estudiantes conceptos básicos, enseñarles a crear consultas para buscar en Internet.
  • De desarrollo: continuar el desarrollo de la atención y el pensamiento; formación de habilidades educativas y culturales generales en el trabajo con información, autocontrol e interés por el tema.
  • Educativo: seguir educando cultura de la información, habilidades de trabajo educativo y actitud responsable ante la materia.

Equipo, soporte de recursos para la lección.

Herramientas TIC utilizadas en la lección:

    • computadora personal del profesor, proyector multimedia, pantalla;
    • Computadoras personales estudiantes con acceso a internet

Electrónico recursos educativos

    • presentación
      Presentación para la lección.
      PPTX / 2,59MB

Recursos adicionales:

Folleto con trabajo práctico “Búsqueda en Internet”
Trabajo practico
DOCX / 16,89 KB
y reflexión de la lecciónReflexión
DOCX / 15,5 KB

1. Etapa organizativa

El maestro da la bienvenida a los estudiantes, verifica su preparación para la lección y promueve la formación de un trasfondo emocional positivo. Los estudiantes saludan al maestro y toman sus trabajos.

2. Actualización de conocimientos básicos

El profesor comprueba el dominio del material estudiado en lecciones anteriores.

Para ello utiliza un crucigrama con conceptos básicos. Red de computadoras (diapositiva 2). Las siguientes tareas para establecer correspondencia entre los logotipos de navegadores populares y sus nombres. (diapositiva 3), y los nombres de los protocolos y su finalidad, respectivamente. (diapositiva 4).

3. Etapa de adquisición de nuevos conocimientos

Explicación del nuevo material. (diapositiva 5 - 20)

Sistema de búsqueda es un complejo de hardware y software que está diseñado para realizar una función de búsqueda en Internet y responder a una solicitud de usuario, que generalmente se especifica en forma de alguna frase de texto (o más precisamente consulta de busqueda), emitiendo una lista de referencias de fuentes de información según su relevancia.

Los estudiantes nombran los motores de búsqueda que conocen.

Principales características de los motores de búsqueda.

    • Lo completo. La integridad es una de las características de búsqueda más importantes; representa la relación entre el número de documentos de información encontrados tras su solicitud y su número total en Internet relacionados con; Esta petición. Cuanto más completa sea la búsqueda, mayor será la probabilidad de que el usuario encuentre exactamente el documento que necesita, por supuesto, si es que existe.
    • Exactitud. La precisión determina el grado en que las páginas encontradas en Internet coinciden con la solicitud del usuario. Cuanto más precisa sea la búsqueda, más rápido el usuario encontrará la información que necesita, menos “basura” variada se encontrará entre los resultados y menos documentos encontrados no corresponderán al significado de la solicitud.
    • Relevancia. La relevancia caracteriza el tiempo que transcurre desde el momento en que se publica la información en Internet hasta que se ingresa en la base de datos indexada del motor de búsqueda. Por ejemplo, al día siguiente aparece información sobre la salida. nuevo iPad, muchos usuarios recurrieron a la búsqueda con tipos de consultas relevantes. En la mayoría de casos la información sobre esta noticia ya está disponible en el buscador, aunque ha pasado muy poco tiempo desde su aparición. Esto se debe a la presencia de grandes motores de búsqueda " base rápida”, que se actualiza varias veces al día.
    • Velocidad de búsqueda. Una función como la velocidad de búsqueda está estrechamente relacionada con la llamada "resistencia de carga". Una gran cantidad de personas acceden a la búsqueda cada segundo; dicha carga de trabajo requiere una reducción significativa en el tiempo para procesar una solicitud. Aquí los intereses tanto del motor de búsqueda como del usuario coinciden completamente: el visitante quiere obtener resultados lo más rápido posible y el motor de búsqueda debe procesar su solicitud lo más rápido posible para no ralentizar el procesamiento de solicitudes posteriores.
    • Visibilidad. La presentación visual de los resultados es el elemento más importante para la comodidad de la búsqueda. Para muchas consultas, el motor de búsqueda encuentra miles y, en algunos casos, millones. diferentes documentos. Debido a una redacción poco clara frases clave Para la búsqueda o su inexactitud, incluso los primeros resultados de la consulta no siempre contienen solo la información necesaria. Esto significa que una persona a menudo tiene que realizar su propia búsqueda entre los resultados proporcionados. Varios componentes de las páginas de resultados de búsqueda le ayudan a navegar por los resultados de búsqueda.

Directorio de enlaces- Esta es una lista de enlaces a sitios desglosados ​​por tema con sus breves descripciones.

Grupos de enlaces según la amplitud del tema.

    • son comunes
    • especializado (temático)

Grupos de directorios de enlaces:

    • directorios cerrados— La adición de sitios a este directorio sólo puede ser realizada por una persona responsable.
    • catálogos blancos— NO requiera un vínculo de retroceso y PONGA un vínculo directo.
    • catálogos grises- SOLICITAR un enlace de retroceso y PONER un enlace directo.
    • catálogos negros- REQUIEREN un vínculo de retroceso y NO proporcionan un vínculo directo.
    • directorios de sitios con enlaces directos— al registrar un sitio en este directorio, el webmaster recibe un enlace directo (sin redirección) a su sitio.
    • directorios de sitios con enlaces— registrar un sitio en este directorio no proporciona un enlace al sitio registrado. Los enlaces en dichos directorios se proporcionan mediante redirección.

Buscador- Este sistema automático, que almacena información sobre las páginas web que conoce y, previa solicitud, proporciona las direcciones de aquellas donde se encuentran las palabras clave ingresadas.

Palabras clave Es un conjunto de palabras y expresiones que reflejan la información requerida.

La tarea más básica de todo motor de búsqueda es ofrecer a las personas exactamente el tipo de información que necesitan.

Es por eso que los desarrolladores de motores de búsqueda especializados crean principios y algoritmos para su trabajo que permitirían a los usuarios encontrar la información que les interesa. Esto significa que el sistema debe “pensar” de la misma manera que piensa una persona cuando busca Información necesaria en Internet.

Para obtener las respuestas correctas a estas preguntas, los desarrolladores de búsqueda mejoran constantemente los principios de clasificación y sus algoritmos, les agregan nuevas características y funciones e intentan por cualquier medio hacer trabajo más rápido sistemas.

Primero programa de computadora Para buscar en Internet había un programa llamado Archie (en inglés archie - archivo sin la letra "v"). Fue creado en 1990 por Alan Emtage, Bill Heelan y J. Peter Deutsch, estudiantes de informática de la Universidad McGill de Montreal. El programa descargó listas de todos los archivos de todos los servidores FTP anónimos disponibles y creó una base de datos que podía buscarse por nombres de archivos. Sin embargo, el programa de Archie no indexó el contenido de estos archivos, ya que la cantidad de datos era tan pequeña que todo se podía encontrar fácilmente a mano.

El primer rastreador web escrito en Perl fue World Wide Web Wanderer, un robot desarrollado por Matthew Gray en el MIT en junio de 1993. Este robot creó el índice de búsqueda Wandex. El objetivo del robot Wanderer era medir el tamaño World Wide Web y busque todas las páginas web que contengan las palabras de la consulta.

El motor de búsqueda WebCrawler, lanzado en 1994, es el primer sistema de indexación de recursos de texto completo que utiliza un robot (“basado en rastreadores”).

El sistema permitía a los usuarios buscar cualquier palabra ubicada en cualquier página web; desde entonces, esto se ha convertido en el estándar para la mayoría de los motores de búsqueda.

El motor de búsqueda WebCrawler fue el primer motor de búsqueda que se utilizó ampliamente.

En 1996 se implementó una búsqueda teniendo en cuenta la morfología rusa en el motor de búsqueda Altavista y se lanzaron los motores de búsqueda rusos originales Rambler y Aport. El 23 de septiembre de 1997 se abrió el motor de búsqueda Yandex. El 22 de mayo de 2014, Rostelecom lanzó el motor de búsqueda nacional Sputnik. Inaugurado el 22 de abril de 2015 nuevo servicio Satélite. Niños especialmente para niños con mayor seguridad.

Tipos de motores de búsqueda:

    • Sistemas que utilizan robots de búsqueda. Constan de tres partes: un rastreador (“bot”, “robot” o “spider”), un índice y un software de motor de búsqueda. Se necesita un rastreador para rastrear la web y crear listas de páginas web. Un índice es un gran archivo de copias de páginas web. Objetivo software— evaluar los resultados de la búsqueda. Debido a que el robot de búsqueda en este mecanismo explora constantemente la red, la información es más relevante. La mayoría de los motores de búsqueda modernos son de este tipo.
    • Sistemas impulsados ​​por humanos (directorios de recursos): estos motores de búsqueda recuperan listas de páginas web. El directorio contiene la dirección, título y Breve descripción sitio. El directorio de recursos solo busca resultados de las descripciones de páginas que le envían los webmasters. La ventaja de los catálogos es que todos los recursos se verifican manualmente, por lo tanto, la calidad del contenido será mejor en comparación con los resultados obtenidos automáticamente por el primer tipo de sistema. Pero también hay un inconveniente: la actualización de los datos del catálogo se realiza manualmente y puede retrasarse significativamente con respecto a la situación real.
    • Sistemas híbridos. Los motores de búsqueda como Yahoo, Google y MSN combinan las funciones de sistemas que utilizan robots de búsqueda y sistemas operados por humanos.
    • Metasistemas. Los metabuscadores combinan y clasifican los resultados de varios motores de búsqueda a la vez. Estos motores de búsqueda eran útiles cuando cada motor de búsqueda tenía un índice único y los motores de búsqueda eran menos "inteligentes". Dado que la búsqueda ha mejorado tanto ahora, su necesidad ha disminuido.

Muchos motores de búsqueda, como Google y Bing, utilizan algoritmos para adivinar de forma selectiva qué información le gustaría ver a un usuario en función de su actividad de navegación anterior. Como resultado, los sitios web sólo muestran información que sea consistente con los intereses pasados ​​del usuario. Este efecto se llama "burbuja de filtro". Todo esto lleva a que los usuarios reciban mucha menos información que contradiga su punto de vista y queden intelectualmente aislados en su propia "burbuja de información".

El profesor realiza una encuesta para descubrir cuál es el motor de búsqueda más popular de la clase y les presenta a los estudiantes la clasificación de los motores de búsqueda en Rusia.

Lenguaje de consulta

Prohibición de enumerar todas las formas de palabras.

Presencia obligatoria de palabras en los documentos encontrados.

Excluir una palabra de los resultados de búsqueda.

& - aparición obligatoria de palabras en una oración.

~ - el requisito de la presencia de la primera palabra en una oración sin la presencia de la segunda.

| - busque cualquiera de estas palabras.

"" - busca frases estables.

$título: busca información por nombres de títulos.

$anchor: busca información por nombres de enlaces.

4. Pausa dinámica

(diapositiva 21-23) Los estudiantes reciben un descanso dinámico, que consta de tres grupos de ejercicios de gimnasia para los ojos, que alivian la tensión y la fatiga según el método de E. S. Avetisov.

5. La etapa de consolidación del material estudiado seguida de autoevaluación.

(diapositiva 24-25) El profesor realiza trabajos prácticos con los alumnos sobre búsquedas en Internet.

Trabajo practico.

Ejercicio 1.

Características de la búsqueda por grupo de palabras.

Complete la tabla utilizando el motor de búsqueda Yandex.

Estructura de solicitud

Número de páginas encontradas

¡Rápido! ¡tranvía!

Expreso + tranvía

Tren Ligero

"Tren Ligero"

Batalla de Stalingrado

Stalingrado y la batalla

$título (río Volga)

$ancla (río Volga)

Tarea 2.

encontrar información sobre datos interesantes Volgogrado en Internet

1. ¿Qué tiene de especial Coventry Street en Volgogrado?

2. ¿Dónde está ubicado el monumento más alto del mundo? a una persona real? Por favor indicar sus dimensiones y foto.

3. ¿Qué tamaño tiene la casa más larga de Europa? Indique su dirección y foto.

4. Cuando Volgogrado pasa a llamarse “ciudad héroe de Stalingrado” (fechas exactas)

5. ¿Cuál es la longitud de la calle más larga de Rusia, que no tiene estatus de calle oficial? ¿Qué nombre tiene?

Después de completar el trabajo, se verifican los resultados del trabajo y los estudiantes se califican a sí mismos por la lección.

El profesor supervisa el progreso del trabajo de los estudiantes y ayuda a los estudiantes que no pueden completar la tarea por sí solos.

Los estudiantes, bajo la dirección de un profesor, comprueban sus resultados. trabajo practico, analizar las respuestas recibidas y determinar la valoración de los resultados del trabajo.

Ejemplos de respuestas al trabajo práctico (diapositivas 26-31)

Evaluación de trabajos prácticos.

5 - las respuestas a la tarea 1 se dieron correctamente, la tarea 2 se completó en su totalidad con explicaciones y fotografías.

4 - en la tarea 1 hubo inexactitudes en 1-2 respuestas, una o dos de las preguntas de la tarea 2 recibieron una respuesta incompleta.

3 - en la tarea 1 hubo inexactitudes en 3-4 respuestas, tres preguntas de la tarea 2 recibieron respuestas incompletas o no hubo respuestas a 2 preguntas

6. Resumir la lección, reflexionar sobre la lección, establecer tareas.

El profesor asigna tareas y las comenta si es necesario.

Tarea

aprender material de conferencia

Libro de texto de L. L. Bosov, A. Ya. Bosov “Informática 9”

Libro de trabajo de L. L. Bosov, A. Ya. Bosov “Informática 9”

El maestro y los estudiantes resumen la lección, califican y agradecen la lección e invitan a los estudiantes a completar una hoja de reflexión sobre la lección.

Responda selectivamente 2-3 de las siguientes preguntas:

    • hoy me entere
    • me las arreglé
    • estoy teniendo dificultades
    • he completado tareas
    • he aprendido
    • Ahora puedo

Recursos utilizados:

L. L. Bosova, A. Ya. Bosova “Informática 9”

YO G. Semakin, Los Ángeles. Zalogova, S.V. Rusakov, L.V. Shestakova “Informática y TIC 9”