Căutarea datelor pe Internet folosind motoarele de căutare. Cum cauti informatii pe internet? Căutare limbă Yandex

Este ușor să trimiți munca ta bună la baza de cunoștințe. Utilizați formularul de mai jos

Loc de muncă bun la site">

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Documente similare

    Instrumente pentru căutarea informațiilor pe Internet. Cerințe de bază și metode de regăsire a informațiilor. Structură și caracteristici servicii de căutare. Motoarele de căutare globale WWW (World Wide Web). Planificarea căutării și colectării de informații pe Internet.

    rezumat, adăugat 11.02.2010

    Caracteristicile metodelor de căutare a informațiilor pe Internet, și anume utilizarea link-urilor hipertext, motoare de căutare și mijloace speciale. Analiza noilor resurse Internet. Istoria apariției și descrierea motoarelor de căutare în limba occidentală și rusă.

    rezumat, adăugat 05.12.2010

    Descrierea și clasificarea sistemelor moderne de regăsire a informațiilor. Documente hipertext. Recenzie și evaluări ale principalelor motoare de căutare din lume. Dezvoltarea unui sistem de regăsire a informațiilor care demonstrează mecanismul de căutare a informațiilor pe Internet.

    teză, adăugată 16.06.2015

    Analiza capacităților motoarelor de căutare Yandex și Google, compararea lor în ceea ce privește utilitatea. Istoricul creării motoarelor de căutare, caracteristicile interfeței acestora, instrumentele și algoritmii de căutare. Formarea unei întrebări și a criteriilor de răspuns.

    rezumat, adăugat la 05.07.2011

    Considerarea motoarelor de căutare pe Internet ca un complex software și hardware cu o interfață web care oferă posibilitatea de a căuta informații. Tipuri de motoare de căutare: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing și Rambler.

    rezumat, adăugat 05.10.2013

    Structura și principiile construirii Internetului, căutării și stocării informațiilor în acesta. Istoricul apariției și clasificării sistemelor de regăsire a informațiilor. Principiul de funcționare și caracteristicile motoarelor de căutare Google, Yandex, Rambler, Yahoo. Căutați după adrese URL.

    lucrare curs, adaugat 29.03.2013

    Esența și principiul de funcționare retea globala Internet. Căutați informații după parametri în Google. Sisteme specializate de regăsire a informațiilor: „KtoTam”, „Tagoo”, „Truveo”, „Kinopoisk”, „Ulov-Umov”. Utilizarea adecvată a motoarelor de căutare.

    prezentare, adaugat 16.02.2015

    Stocarea datelor pe Internet. Documente hipertext, tipuri de fișiere. Fișiere grafice, tipurile și caracteristicile acestora. Motoare de căutare și reguli pentru căutarea informațiilor. Revizuirea motoarelor de căutare pe Internet. Totul despre motoarele de căutare Yandex, Google, Rambler.

    lucrare curs, adaugat 26.03.2011

Căutarea de informații pe internet

Căutarea de informații pe internet

Pentru a căuta informații sunt utilizate în mod obișnuit trei moduri(Vezi Fig.1). Primul din care - căutare după adresă. Este folosit atunci când utilizatorul cunoaște adresa unei resurse informaționale care conține informațiile de care are nevoie. Atunci când organizează o căutare de informații după adresă (forma adresei - IP, domeniu sau URL - în acest caz nu contează), utilizatorul trebuie pur și simplu să introducă adresa resursei în câmpul corespunzător al browserului - un program conceput pentru oferă acces la resursele rețelei.

Orez. 1. Metode de căutare a informațiilor în baze de date hipertext

Doilea- căutare folosind navigarea prin hyperlink. Când folosește acest tip de caz de căutare, utilizatorul trebuie să obțină mai întâi acces la serverul asociat cu baza de date corespunzătoare. Puteți găsi apoi documentul folosind hyperlink-uri. Evident, această metodă este convenabilă atunci când adresa resursei este necunoscută utilizatorului. Portalurile web sunt destinate a fi folosite ca punct de plecare pentru căutare la implementarea acestei metode - servere care oferă acces direct la un anumit set de servere, inclusiv la cele instalate pe acestea. resurse informaționale, precum și aplicații Web care implementează servicii Web care corespund scopului portalului. Serverele accesibile prin portal pot aparține unui anumit sistem (de exemplu, corporativ) sau diverse sistemeși să fie special selectați în funcție de tipul, tematica sau alte caracteristici ale documentelor și datelor conținute pe site-urile lor web. De obicei, portalurile combină o varietate de funcții pentru a păstra clientul cât mai mult posibil. Serviciul dominant al portalului este serviciul birou de ajutor: căutare, categorii, indici financiari, informații meteo etc. Dacă site-urile Web în cele mai multe cazuri sunt colecții de pagini Web statice, atunci portalurile sunt colecții softwareși informații pre-nestructurate pe care aceste instrumente le transformă în date structurate la cererea anumitor utilizatori.

Treilea Metoda de căutare implică utilizarea serverelor de căutare pe Internet. Serverele de căutare sunt computere gazdă dedicate care găzduiesc baze de date cu resurse de Internet. Interfata utilizator un astfel de server are un câmp pentru introducerea cuvintelor cheie care descriu subiectul de interes pentru utilizator (vezi Fig. 2).

Fig.2. Vedere a ferestrei serverului de căutare Yandex

Serverul percepe aceste cuvinte ca pe o solicitare de informații, în conformitate cu care caută resurse și prezintă utilizatorului o listă cu documentele găsite. Evident, la implementarea acestei metode sunt posibile erori atât de tip 1 (lipsirea țintei), cât și de tip 2 (zgomot informațional). De menționat că există două grupe de servere de căutare: motoarele de căutare și cataloagele de subiecte. Diferența lor se datorează metodei de creare și, ulterior, completarea bazei de date a resurselor de Internet, care acest server efectuează căutarea informațiilor. Astfel, motoarele de căutare includ program special- robot de căutare. Monitorizează în mod constant rețeaua, colectează informații de la Pagini web, le indexează și înregistrează imaginea lor de căutare în baza sa de date. În cataloagele de subiecte, o bază de date de documente de pe Internet este creată „manual” de către editori specializați. Deoarece nu există o administrație unificată pe Internet, resursele sale de informații sunt în continuă schimbare. Pot să apară și să dispară altele noi. documentele existente. Frecvența de actualizare a informațiilor în documente pentru diferite site-uri este diferită: pentru unii este de câteva ori pe oră, pentru unii este o dată pe zi, zi, lună etc. Prin urmare, este foarte important să înțelegeți că atunci când utilizați sisteme de regăsire a informațiilor pentru a găsi informații pe Internet, căutarea nu se efectuează pe spațiul real al documentelor de pe Internet, ci într-un anumit model, al cărui conținut poate diferi semnificativ de cel real. Conținut de internet în momentul căutării. Pe baza acoperirii resurselor indexate, motoarele de căutare pot fi împărțite în două grupuri: internaționale și în limba rusă. Primele indexează toate documentele publicate pe Internet la rând. Acestea din urmă indexează resursele situate în zonele de domeniu cu predominanța limbii ruse. Lista celor mai populare sisteme este dată în tabel. 1.

Masă 1. Cele mai populare motoare de căutare

Internaţional vorbitor de rusă
Google Yandex (44,4% din Runet)
Yahoo! Rambler (10,6% din Runet)
Bing Mail.ru (7,3% din Runet)
MSN Nigma (0,5% din Runet)
AltaVista Gogo.ru (0,3% din Runet)
Întreabă Aport (0,2% din Runet)

Notă: Runet este partea în limba rusă a Internetului, care cuprinde domenii cu numele ru si RF.

Este necesar de menționat că există o categorie specială de servere de căutare - metamotoare de căutare. Diferența lor fundamentală față de motoarele de căutare și cataloagele de subiecte este că nu au propria lor bază de date de index și, prin urmare, la primirea unei cereri de utilizator, o redirecționează către mai multe servere de căutare simultan (vezi Fig. 3).

Orez. 3. Schema de funcționare a sistemului de metacăutare

Abilitatea de a utiliza simultan mai multe motoare de căutare pentru o singură interogare este un avantaj evident al metamotoarelor de căutare. În prezent, sistemul Metabot.ru, a cărui interfață este prezentată în Fig. 1, a găsit o utilizare pe scară largă. 4. Acest sistem vă permite să utilizați atât servere de căutare internaționale, cât și în limba rusă pentru a căuta resurse.

1. Specificarea adresei paginii . Acesta este cel mai mult cale rapidă căutare, dar poate fi folosit numai dacă se cunoaște adresa exactă a documentului.

PENTRU CĂUTAREA INFORMAȚIILOR NECESARE ÎN REȚEA, SE UTILizează ADRESA Uniform Resource Locator (URL), care conține numele protocolului prin care trebuie să accesați informațiile necesare, adresa serverului și numele fișierului pe acest server, de exemplu:

http www.kazan.ru

(structură ierarhică - de la dreapta la stânga http - protocol hipertext, www - nodul este situat în spațiul Web).

Părți ale unei adrese:

Ru - Rusia (poate avea trei litere)

Kazan - resursa Kazanului,

Www - resursă de internet, site web (pagină web), site-ul conține hyperlink-uri care vă permit să navigați în fluxul de informații ca o păpușă de cuibărit. Programul de browser vă permite să nu vă pierdeți (Home Page).

Http este protocolul de transfer hipertext.

În ceea ce privește protocoalele, Internetul folosește mai multe tipuri de protocoale care au apărut de-a lungul timpului și dezvoltării. tehnologie informatică. Acestea includ protocolul text telnet, protocol de fișier ftp, protocol de teleconferință usenet, protocol de bază de date wais, protocol gopher etc.

2. Contactarea unui server de căutare (motor de căutare). Utilizarea motoarelor de căutare este cea mai mare mod convenabil căutarea de informații.

În prezent, următoarele servere de căutare sunt populare în partea de limbă rusă a internetului:

Exemplu de motoare de căutare:

www.rambler.ru

www.goo-gle.ru

Motorul de căutare găsește adresa site-ului folosind cuvinte cheie, chiar și expresii.

Există și alte motoare de căutare. De exemplu, pe server este implementat un sistem de căutare eficient serviciul postal mail.ru.

Limbajul de interogare a motorului de căutare

Un grup de cuvinte cheie format după anumite reguli - folosind un limbaj de interogare - se numește cerere către un server de căutare. Limbile de interogare pentru diferite servere de căutare sunt foarte asemănătoare. Puteți afla mai multe despre acest lucru vizitând secțiunea „Ajutor” a serverului de căutare dorit. Să ne uităm la regulile de formare a interogărilor folosind motorul de căutare Yandex ca exemplu.

Sintaxa operatorului Ce înseamnă operator? Exemplu de cerere
spatiu sau & ȘI logic (într-o propoziție) kinetoterapie
&& ȘI logic (în cadrul documentului) retete && (branza procesata)
eu SAU logic fotografie | fotografie | sni-mock | imagine fotografică
+ Prezența obligatorie a cuvântului în documentul găsit +a fi sau +a nu fi
() Gruparea cuvintelor (tehnologie\producție) (brânză\brânză de vaci)
~ Operatorul binar ȘI NU (într-o propoziție) banci ~ law
~~ sau ___ Operatorul binar AND NOT (în cadrul documentului) ghid la Paris ~~ (agenție | tur)
/(n m) Distanța în cuvinte (minus (-) - înapoi, plus (+) - înainte) furnizori /2 muzică cafea /(-2 4) locuri de muncă vacante - /+1 studenți
“ ” Căutați o frază „scufița roșie” Echivalent cu: scufiță roșie /+1
&&/(n m) Distanța în propoziții (minus (-) - înapoi, plus (+) - înainte) bancă && /1 taxe

Pentru a obține cele mai bune rezultate de căutare, trebuie să rețineți câteva reguli simple:


Nu căutați informații folosind un singur cuvânt cheie.

Cel mai bine este să nu introduceți cuvinte cheie cu majuscule, deoarece acest lucru poate duce la negăsirea acelorași cuvinte scrise cu litere mici.

Dacă nu obțineți niciun rezultat din căutarea dvs., verificați cuvintele cheie pentru erori de ortografie.

Motoarele de căutare moderne oferă posibilitatea de a conecta un analizor semantic la o interogare generată. Cu ajutorul acestuia, puteți, prin introducerea unui cuvânt, să selectați documente în care se găsesc derivate ale acestui cuvânt în diverse cazuri, timpuri etc.

Cel mai accesibil și convenabil mod de a căuta informații pe World Wide Web este utilizarea motoarelor de căutare. În acest caz, căutarea informațiilor poate fi efectuată folosind cataloage, precum și folosind un set de cuvinte cheie care caracterizează documentul text căutat.

Să ne uităm la utilizarea serverelor de căutare mai detaliat. Serverul de căutare conține un număr mare de link-uri către o mare varietate de documente, iar toate aceste link-uri sunt sistematizate în cataloage tematice. De exemplu: sport, cinema, mașini, jocuri, știință etc. Mai mult, aceste link-uri sunt instalate de server în mod independent, automat prin vizualizarea regulată a tuturor paginilor Web care apar pe World Wide Web.

În plus, serverele de căutare oferă utilizatorului posibilitatea de a căuta informații folosind cuvinte cheie. După introducerea cuvintelor cheie, serverul de căutare începe să vizualizeze documentele de pe alte servere Web și să afișeze link-uri către acele documente în care apar cuvintele specificate. De obicei, rezultatele căutării sunt sortate în ordinea descrescătoare a unei evaluări speciale a documentului, care arată cât de complet un document îndeplinește condițiile de căutare sau cât de des este solicitat pe Internet.

Câteva adrese importante:

www.kros.ru - Rețeaua educațională regională Kazan,

www.edu.ru - site-ul web al Ministerului Educației din Rusia,

www.fio.ru - Federația Educației pe Internet.

3. Navigare prin hyperlinkuri. Aceasta este metoda cea mai puțin convenabilă, deoarece poate fi folosită pentru a căuta documente care sunt doar apropiate ca semnificație de documentul curent. Dacă documentul curent este dedicat, de exemplu, muzicii, apoi folosind hyperlinkurile din acest document, este puțin probabil să puteți ajunge la un site dedicat sportului

Problema căutării și mijloacele organizării acesteia

Volume uriașe și în continuă creștere de informații disponibile pe Internet, inclusiv. operațional, face ca problema găsirii informațiilor necesare să fie foarte relevantă și complexă. Viteza de căutare a informațiilor necesare determină în mare măsură profesionalismul utilizatorului de internet. Merită spus că, pentru automatizarea acestei sarcini, au fost dezvoltate diverse, atât străine, cât și sistemele casnice căutare, care sunt tipuri speciale de pagini Web. În același timp, în ciuda disponibilității numeroaselor instrumente de automatizare a căutării, această sarcină rămâne destul de laborioasă, necesitând utilizatorului să aibă o anumită experiență, intuiție și cunoaștere a terminologiei utilizate în domeniul său de studiu.

O estimare publicată în Nature pe 8 iulie 1999, a estimat numărul de pagini web indexate public la 800 de milioane Un an mai târziu, autorul studiului (Steve Lawrence de la Institutul de Cercetare NEC) a considerat că acest număr aproape s-a dublat la 1,5 miliarde cele mai bune motoare de căutare nu indexează mai mult de o pagină din șase. Merită spus, pentru a extrage informatii utile de pe Internet, trebuie să știți unde și cum să căutați.

Instrumentul de căutare din Internet Explorer facilitează accesul la instrumentele de căutare fără a fi nevoie să cunoașteți adresele motoarelor de căutare. În acest caz, este mai bine să contactați direct motoarele de căutare prin încărcarea paginii relevante.

Pe baza metodei de organizare a căutării și a capacităților oferite, toate instrumentele de căutare pot fi împărțite în următoarele grupuri:

cataloage si baze de date specializate;

motoare de căutare;

metamotoare de căutare.

Cataloage și baze de date

Cataloagele de pe WWW sunt similare cataloagelor sistematice ale bibliotecii. Căutarea în director constă în deplasarea secvenţială printr-o listă ierarhică de legături numite titluri sau categorii. Prima pagină a catalogului conține link-uri către subiecte majore, cum ar fi Cultura și Arta; Medicina si sanatate; Societate și politică; Afaceri și economie; Divertisment, etc. Făcând clic cu mouse-ul pe un anumit link (categorie) se deschide o pagină care conține link-uri care detaliază subiectul selectat (categorie). Pe fiecare pagină care se deschide la trecerea prin catalog într-un fel sau altul, este indicată succesiunea subcategoriilor vizualizate, de exemplu, Business World: Finance: Analytics etc.

Toate cataloagele sunt create și ținute la zi manual de specialiști, similar modului în care bibliografii compilează și întrețin cataloagele bibliotecii. Este oportun să rețineți că descrierea documentului se face fie de către compilatorii catalogului, fie de către autor. Datorită acestui fapt, conținutul paginilor incluse în catalog este cel mai adecvat categoriei în care sunt clasificate. Dar, având în vedere viteza de reaprovizionare și schimbare a informațiilor pe Internet, metoda „manuală” de întreținere a cataloagelor nu ne permite să reflectăm în mod adecvat starea reală a resurselor de pe Internet pe această temă.

Motoarele de căutare

(motoare de căutare, servere de căutare, roboți de căutare)

Există zeci de site-uri web mari și mii de site-uri web mici și specializate concepute pentru căutări pe Internet. Instrumentele de căutare ale grupului ϶ᴛᴏth vor permite utilizatorului, conform anumitor reguli, să formuleze cerințele pentru informațiile de care are nevoie (folosind un limbaj de interogare pentru a crea o interogare după aceasta, motorul de căutare caută automat documentele de pe site-uri). controlează (indexează) și selectează pe acelea dintre ele care „în opinia » serverul de căutare, ϲᴏᴏᴛʙᴇᴛϲᴛʙcerințele formulate de utilizator (relevante pentru cerere) Nodurile de căutare pot folosi propriile indici de Internet, actualizați constant prin programe speciale numite spider examinează Web-ul, verificând fiecare link de pe o anumită pagină, apoi pe paginile adresate link-uri etc., și își informează proprietarul informații despre toate paginile pentru indexarea ulterioară.

În urma căutării, se creează una sau mai multe pagini care conțin link-uri către documente relevante pentru cerere (pagini web) Merită spus că pentru fiecare link, data creării documentului, volumul acestuia, gradul de relevanță. la cerere, iar fragmentele de text care caracterizează conținutul documentului sunt de obicei indicate. Făcând clic pe un astfel de link, vă permite să încărcați pagina care vă interesează. În cazul unui număr foarte mare de documente găsite, puteți clarifica cererea și repeta căutarea cu ea, dar numai între paginile selectate (o astfel de căutare este numită diferit în diferite mașini, dar de obicei ϶ᴛᴏ - căutare în găsit) Într-un număr de motoare de căutare puteți folosi o anumită metodă, schimbați linkul către pagina al cărei conținut se potrivește cel mai bine nevoilor dvs. și repetați căutarea, cerând să căutați altele similare.

Avantajul căutării automate este, în esență, că oferă vizualizarea unor volume foarte mari de informații disponibile pe Internet. în acest moment. În același timp, complexitatea unei descrieri exacte a cererii care reflectă în mod adecvat nevoile dumneavoastră de informații, precum și complexitatea și mai mare a sarcinii de a determina automat gradul de pagini vizualizate pentru solicitarea dumneavoastră, duce la faptul că numărul dintre paginile selectate „la prima vizită” este în mod tradițional fie foarte mic, fie excesiv de mare . În general, o căutare folosind un motor de căutare este un proces iterativ (multi-pass), în urma căruia forma cererii este rafinată treptat.

Metamotoare de căutare

După cum sa menționat mai sus, orice motor de căutare scanează un anumit set de servere și selectează documente în funcție de propriile criterii. Ca rezultat, căutarea cu sisteme diferite folosind aceleași cuvinte cheie dă rezultate diferite. Acest lucru a condus la ideea de a crea așa-numitele sisteme de metacăutare (sau multicăutare), care nu caută nimic ele însele, ci apelează la mai multe motoare de căutare pentru ajutor deodată. Rețineți că fiecare dintre metamotoarele de căutare are propriul său limbaj de interogare. Sistemul traduce o interogare formulată în limba sa în limbile de interogare utilizate de fiecare motor de căutare. În continuare, rezultatele căutării din toate sistemele sunt combinate și prezentate într-o formă clară. Desigur, căutarea folosind metamotoarele de căutare durează mai mult în comparație cu motoarele de căutare convenționale.

Revizuirea celor mai populare motoare de căutare

Există un număr mare de motoare de căutare pe Internet, iar fiecare utilizator se concentrează pe cel cu care este obișnuit sau pe care l-au sfătuit colegii săi. Să folosim o scurtă descriere a celor mai populare motoare de căutare, care este dată pe unul dintre site-uri.

1. Google (www.google.com) Cel mai rapid și cel mai mare motor de căutare. Au fost indexate peste 1,3 miliarde de pagini (din care puțin mai mult de 700 de milioane sunt complet indexate, despre restul se știe doar adresa și textul linkului) Căutează în mod normal folosind resurse în limba rusă (desigur, fără forme de cuvinte). , este posibil să selectați limba interfeței. Puteți include/exclude rezultate de pe anumite site-uri și/sau domenii. Spre deosebire de majoritatea motoarelor de căutare, Google evaluează popularitatea unei resurse în funcție de numărul de link-uri care duc la aceasta din alte pagini. Există o căutare orientată pe subiect - Apple Macintosh, BSD UNIX, Linux, căutări guvernamentale din SUA și universități - căutare în resursele instituțiilor științifice și educaționale de top.

2. Yandex (www.yandex.ru) Cele mai bune motoare de căutare interne. Indexează în principal resursele în limba rusă, în timp ce capabilitățile sale nu sunt inferioare sistemelor străine. Căutarea poate fi efectuată exact sau sub orice formă de cuvânt, cu o limită de dată, indicând site-ul sau subdirectorul acestuia. Puteți căuta pe baza așa-numitului index de citare, puteți căuta imagini, scripturi, applet-uri; setați limba documentului. Legăturile necesare se găsesc în mod tradițional în primele zece rezultate. Are o versiune „ușoară” (cu un minim de elemente de design) la http://www.ya.ru.

3. AltaVista (www.altavista.com) Oferă o extindere mare a criteriilor de căutare: în Căutare avansată există o alegere a perioadei de timp, care include data creării sau modificării resursei, suport pentru 25 de limbi; există posibilitatea de a returna un rezultat pe site (restrânge căutarea fără a sacrifica calitatea) Căutarea puternică are un set standard de capabilități. Până de curând, AV era un portal mare, dar din motive financiare (și de altă natură) a redus semnificativ numărul de servicii.

4. Yahoo! (www.yahoo.com) Este important de reținut că unul dintre primele motoare de căutare de pe Internet. Pe lângă asta set standard funcții, vă permite să selectați resursele după dată (4 ani, 1, 3, 6 luni, săptămână, 1, 3 zile) Acceptă capacitatea de a specifica semnul „*” în locul oricărei secvențe de caractere din cuvintele cheie. Pe Yahoo! a fost alcătuit un catalog structurat mare de categorii Mai întâi, căutarea este efectuată în ele, apoi în arhiva proprie, apoi folosind sistemele Google. Cautarea pe categorii da rezultate bune - nu sunt multe si sunt foarte bune.

5. Lycos (www.lycos.com) Recent - unul dintre cele mai populare sisteme. În același timp, nu oferă capacități speciale - „ȘI” „SAU”, căutarea de fraze, prezența/absența obligatorie a unui cuvânt; în funcții avansate - căutare în titlu, URL, nume de gazdă și/sau nume de domeniu; 25 de limbi, inclusiv rusă - într-un cuvânt, întregul set „general acceptat”. Puteți specifica tipul de conținut al resursei - auto, cărți, ftp, descărcare, știri etc. Evident, popularitatea Lycos este o consecință a amplorii acestui mare proiect.

6. Rambler (www.rambler.ru) Până de curând, cel mai faimos motor de căutare rusesc. Căutarea avansată nu vă permite să căutați expresii, iar căutarea obișnuită până în februarie 2010 a produs rareori rezultate acceptabile. Din februarie, sistemul a folosit un mecanism de căutare îmbunătățit, designul s-a schimbat, dar în ceea ce privește calitatea Rambler încă nu se compară cu Yandex și Aport (conform autorului care analizează motoarele de căutare Site-ul conține un catalog de resurse). Rambler Top 100, una dintre sursele recunoscute de informații statistice despre proiectele pe Internet.

7. Aport (www.aport.ru) Un alt server de căutare rusesc bun. Căutarea se realizează prin text (numai în toate formele de cuvinte) și prin URL, folosind operatori logiciși operatorul „…” (cu toate acestea, cuvintele oprite din frază sunt încă ignorate), după dată și în câmpurile individuale (titlu, descriere etc.), meta caracterele * și sunt acceptate! Prezentarea rezultatelor căutării este cea mai bine concepută în comparație cu alte motoare de căutare rusești. Designul paginii principale, care este în mod clar supraîncărcat cu informații, ridică unele îndoieli. Există o versiune puțin „mai ușoară” la http://aport.ru.

Cum să alegi un motor de căutare

Când căutați pe internet, două componente sunt importante - completitudinea (nu se pierde nimic) și acuratețea (nu se găsește nimic de prisos, de obicei, totul este numit într-un singur cuvânt - relevanță, adică răspunsul la întrebare).

1. Acoperire și adâncime

Prin acoperire înțelegem volumul bazei de date a motorului de căutare, care este măsurat prin trei indicatori - volumul total de informații indexate, numărul de servere unice și numărul de documente unice. Prin profunzime înțelegem dacă există o limită a numărului de pagini sau adâncimea de imbricare a directoarelor pe un singur server.

Cum se verifică: Unele mașini scriu statistici despre roboți pe un site web. Dar îl puteți verifica singur - trebuie să setați mai multe interogări de căutare constând dintr-un singur cuvânt (pentru a exclude influența limbajului de interogare, inclusiv diferite interpretări ale spațiului) și, în același timp, să priviți statisticile rezultatelor produse de aparatul - de obicei la începutul listei indică câte documente au fost găsite. Pe lângă faptul că cuvintele ar trebui să fie din zone diferite, este bine să luați și cuvinte de diferite greutăți - rare, „medie” și „grele” (frecvență) și să comparați cantitatea găsită. Cuvintele grele, în special, testează textul integral (indexarea tuturor cuvintelor dintr-un document) al unui motor de căutare.

Este mai dificil să verificați adâncimea crawlingului robotului - pentru aceasta trebuie să luați unele site-uri, de exemplu, cu o structură de arhivă ramificată și să verificați dacă documentele sunt indexate, care pot fi atinse, de exemplu, doar în 6 clicuri. pe link-uri.

2. Viteza de accesare cu crawlere și relevanța legăturilor

Viteza de accesare cu crawlere pe Web arată cât de repede este indexată o resursă nou adăugată și cât de repede sunt actualizate informațiile din baza de date. Nu uitați că un indicator important al calității unui motor de căutare (robotul său) va fi nu numai capturarea de noi teritorii, ci și monitorizarea stării celor deja acoperite. Serverele dispar și vor rămâne, paginile de pe ele sunt actualizate. Legăturile pe care un motor de căutare le produce în lista a ceea ce a găsit trebuie, în primul rând, să existe, iar, în al doilea rând, conținutul lor trebuie să corespundă cererii.

Cum se verifică: Informațiile obiective pot fi obținute analizând jurnalele serverului - un robot motor de căutare este de obicei introdus după numele mașinii sale (sau ceva similar), astfel încât să puteți vedea cât de des vizitează serverul, câte pagini vede, etc. Din păcate, de obicei doar jurnalul site-ului său este disponibil pentru studiu, așa că rămâne metoda experimentală.

Pentru a determina viteza de accesare cu crawlere, trebuie să creați o pagină de text undeva, să o adăugați la motoarele de căutare și să vedeți cât de repede începe să apară. Sau modificați o pagină existentă. Merită spus că pentru a determina relevanța link-urilor, verificați documentele cel puțin pe prima pagină a listei găsite pentru mai multe interogări. Mesaj Nu a fost găsit indică faptul că documentul nu mai există.

3. Calitatea căutării (indicator subiectiv)

Merită spus că fiecare motor de căutare are un algoritm de sortare a rezultatelor căutării. Cu cât documentul de care aveți nevoie este mai aproape de partea de sus a listei, cu atât relevanța funcționează mai bine.

Cum se verifică: numai prin experiment. Este recomandat să faceți interogări de lungimi diferite pentru comparație. Puteți folosi, de asemenea, limbajul de interogare, în timp ce cei care nu doresc să citească descrierea pot folosi pagina de interogare extinsă („căutare avansată” în Aport și Yandex, „interogare detaliată” în Rambler - opțiuni de traducere în rusă „căutare avansată”)

Pe lângă relevanță, există și caracteristici importante ale utilizatorului.

4. Viteza de căutare

Dacă un motor de căutare răspunde lent, lucrul cu acesta este ineficient. Merită adăugat că viteza vizibilă pentru utilizator depinde nu numai de motorul de căutare în sine, ci și de canalele de internet.

Cum să verificați: prin experiment - trebuie să căutați interogări de lungimi diferite, diferite<тяжести>cuvinte si in timpuri diferite zile (încărcarea serverului este semnificativ inegală pe tot parcursul zilei, vârful este în jurul orei trei până la patru după-amiaza)

5. Capabilitati de cautare (lucrare cu limba documentului, limbajul de interogare)

Un alt punct de comparație este ce anume și cum intră motorul de căutare în index. Merită spus că un motor de căutare full-text indexează toate cuvintele textului vizibile pentru utilizator. Prezența morfologiei face posibilă găsirea cuvintelor căutate în toate declinațiile sau conjugările. Pe lângă aceasta, în limbaj HTML există etichete care pot fi procesate și de un motor de căutare (titluri, linkuri, subtitrări de imagini etc.)

Aproape toate mașinile au un limbaj de interogare sub forma operatorilor logici standard (ȘI, SAU, NU). Unii oameni știu cum să caute expresii sau cuvinte la o anumită distanță - acest lucru este adesea important pentru obținerea unui rezultat rezonabil. O opțiune suplimentară va fi căutarea în zonele documentului - titluri, link-uri, cuvinte cheie (META KEYWORDS), etc. Caracteristica suplimentară limbaj de interogare - o interogare în limbaj natural care nu necesită cunoașterea operatorilor.

Cum se verifică: De obicei, aceste informații sunt publicate pe serverul motorului de căutare (în Ajutor). Rețineți că, totuși, este recomandat să verificați cereri reale, pentru că uneori ceea ce se dorește este prezentat ca realitate.

6. Facilități suplimentare

Acestea sunt caracteristici suplimentare pe care motorul de căutare le oferă utilizatorilor. Aceasta include tot felul de opțiuni de căutare (pagini specializate, căutare pentru documente similare, limitarea zonei de căutare) și o listă de servere găsite și căutare după dată și server, precum și o interfață convenabilă pentru motor de căutare și posibilitatea de a o personaliza.

Cum se verifică: informațiile pot fi publicate parțial pe serverul motorului de căutare, dar cel mai bine este să încercați să lucrați singur cu aceste funcții.

Este clar că această analiză va dura ceva timp. În plus, motoarele de căutare, ca întregul Internet, nu stau pe loc. În același timp, având în vedere că căutarea de informații este una dintre componentele importante ale tehnologiei informatice, ar trebui să i se acorde suficientă atenție - cel puțin nu mai puțin decât capacitatea de a lucra într-o rețea locală.

A fost efectuat un sondaj pe Yandex.ru: de ce este nevoie de internet și ce lipsește în el (http://www.yandex.ru/polling/9.html) Datele sondajului au fost distribuite în ordine descrescătoare după cum urmează: Internetul este folosit ca o carte de referință (23,76%), un instrument de cercetare (15,45%), divertisment (14,15%) și doar pe locul patru - o sursă de știri (12,32%) Părea optimist că 10% utilizatori întotdeauna , iar 73% pot fi adesea găsite informatiile necesare. Și internetului lipsește: informații, căutare bună și ordine (inclusiv: ordine, structură, structură, structură, structură, precum și sistem, sistematizare, sistematicitate, sistematicitate și sistematizare)

RĂSPUNDE LA ÎNTREBĂRILE:

Numiți ce metode de organizare a căutărilor există pe Internet?

Cum se caută informațiile în cataloage și baze de date?

Cum sunt introduse informațiile în cataloage și baze de date?

Ce sunt motoarele de căutare pe Internet?

Cum se formează o bază de date de informații în motoarele de căutare?

De unde începe căutarea informațiilor în motoarele de căutare?

Ce este o cerere?

Cum se caută informațiile în motoarele de căutare?

Ce înțelegeți prin relevanță pentru o interogare?

Ce se poate face în cazul unui număr foarte mare de documente găsite în timpul căutărilor ulterioare?

Ce sunt metamotoarele de căutare?

Care este diferența fundamentală dintre motoarele de metacăutare și motoarele de căutare obișnuite?

Care dintre următoarele sisteme vor fi metamotoare de căutare:

Care sunt cele mai populare motoare de căutare interne?

Care sunt cele mai populare motoare de căutare străine?

Ce două componente sunt importante atunci când căutați informații pe Internet?

Ce caracteristici determină eficiența motoarelor de căutare atunci când caută informații pe Internet?

Acordul utilizatorului:
Drepturi intelectuale asupra materialului - Rețele informatice informaționale - Borisov N.A., Lukin A.A. aparțin autorului său. Acest manual/carte este postat exclusiv în scop informativ, fără implicare în circulația comercială. Toate informațiile (inclusiv „Subiectul 3. Căutarea informațiilor pe INTERNET”) sunt colectate din surse deschise sau adăugate de utilizatori în mod gratuit.
Pentru utilizare deplină informații postate Administrația site-ului web al proiectului recomandă insistent achiziționarea cărții/manualului Informații Rețele de calculatoare - Borisov N.A., Lukin A.A. în orice magazin online.

Bloc de etichete: Rețele de calculatoare informaționale - Borisov N.A., Lukin A.A., 2015. Subiectul 3. Căutarea informațiilor pe INTERNET.

(C) Site-ul web al depozitului juridic 2011-2016

Subiectul lecției: Căutarea informațiilor pe Internet

Manual: L. L. Bosova, A. Ya Bosova „Informatică 9” Tip de lecție: lecție de descoperire și dobândire de noi cunoștințe, abilități și abilități.

Obiectivul lecției: introduceți elevii în conceptele de bază de „motor de căutare”, „director de linkuri”, „motor de căutare” și spectacol aplicare practică limbajul de interogare, învață cum să găsești informații pe Internet.

Obiectivele lecției:

  • Educațional: - introduceți elevii în concepte de bază, învățați cum să creați interogări pentru căutarea pe Internet.
  • Dezvoltare: continuarea dezvoltării atenției și gândirii; formarea abilităților educaționale generale și culturale generale în lucrul cu informații, autocontrol și interes pentru subiect.
  • Educațional: continuă să educi cultura informaţiei, aptitudini de muncă educațională și atitudine responsabilă față de subiect.

Echipament, resurse suport pentru lecție

Instrumente TIC utilizate în lecție:

    • computer personal al profesorului, proiector multimedia, ecran;
    • calculatoare personale studenți cu acces la internet

Electronic resurse educaționale

    • prezentare
      Prezentare pentru lecție
      PPTX / 2,59 MB

Resurse suplimentare:

Fișă cu lucrare practică „Căutarea pe Internet”
Lucrări practice
DOCX / 16,89 KB
și reflecția lecției
DOCX / 15,5 KB

1. Etapa organizatorică

Profesorul îi întâmpină pe elevi, îi verifică pregătirea pentru lecție și promovează formarea unui fundal emoțional pozitiv. Elevii îl salută pe profesor și își iau locurile de muncă

2. Actualizarea cunoștințelor de bază

Profesorul verifică stăpânirea materialului studiat în lecțiile anterioare.

Pentru a face acest lucru, el folosește un puzzle de cuvinte încrucișate cu concepte de bază retele de calculatoare (diapozitivul 2). Următoarele sarcini pentru a stabili corespondența între siglele browserelor populare și numele acestora (diapozitivul 3), precum și denumirile protocoalelor și, respectiv, scopul acestora (diapozitivul 4).

3. Etapa dobândirii de noi cunoștințe

Explicația noului material (diapozitivul 5 - 20)

Motor de căutare este un complex hardware și software care este conceput pentru a efectua funcția de căutare pe Internet și răspunde la o solicitare a utilizatorului, care este de obicei specificată sub forma unei fraze text (sau mai precis interogare de căutare), emiterea unei liste de referință la sursele de informații pe baza relevanței.

Elevii numesc motoarele de căutare pe care le cunosc.

Principalele caracteristici ale motoarelor de căutare

    • Completitudine. Completitudinea este una dintre cele mai importante caracteristici de căutare ea reprezintă raportul dintre numărul de documente de informații găsite la cerere și numărul total de documente de pe Internet aferente această cerere. Cu cât căutarea în sine este mai completă, cu atât este mai mare probabilitatea ca utilizatorul să găsească exact documentul de care are nevoie, desigur, dacă acesta există.
    • Precizie. Acuratețea determină gradul în care paginile găsite pe Internet se potrivesc cu solicitarea utilizatorului. Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede informațiile de care are nevoie, cu atât mai puține „gunoaie” vor fi găsite printre rezultate, cu atât mai puține documente găsite nu vor corespunde sensului cererii.
    • Relevanţă. Relevanța caracterizează timpul care trece din momentul în care informațiile sunt publicate pe Internet până când sunt introduse în baza de date index a motorului de căutare. De exemplu, a doua zi apar informații despre ieșire iPad nou, mulți utilizatori au apelat la căutarea cu tipuri relevante de interogări. În majoritatea cazurilor, informațiile despre această știre sunt deja disponibile în căutare, deși a trecut foarte puțin timp de la apariția ei. Acest lucru se datorează prezenței motoarelor de căutare mari " bază rapidă”, care este actualizat de mai multe ori pe zi.
    • Viteza de căutare. O astfel de funcție precum viteza de căutare este strâns legată de așa-numita „rezistență la sarcină”. Un număr mare de persoane accesează căutarea în fiecare secundă, o astfel de sarcină de lucru necesită o reducere semnificativă a timpului de procesare a unei cereri. Aici interesele atât ale motorului de căutare, cât și ale utilizatorului coincid complet: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să-și proceseze cererea cât mai repede, pentru a nu încetini procesarea solicitărilor ulterioare.
    • Vizibilitate. Prezentarea vizuală a rezultatelor este cel mai important element al confortului căutării. Pentru multe interogări, motorul de căutare găsește mii și, în unele cazuri, milioane diferite documente. Din cauza redactării neclare fraze cheie pentru căutare sau inexactitatea acesteia, chiar și primele rezultate ale interogării nu au întotdeauna doar informațiile necesare. Aceasta înseamnă că o persoană trebuie adesea să efectueze propria căutare printre rezultatele furnizate. Diverse componente ale paginilor cu rezultate ale motorului de căutare vă ajută să navigați în rezultatele căutării.

Directorul de linkuri- Aceasta este o listă de link-uri către site-uri defalcate pe subiecte cu scurtele lor descrieri.

Grupuri de link-uri în funcție de amploarea subiectului

    • general
    • specializat (tematic)

Link grupuri de directoare:

    • directoare închise— adăugarea site-urilor la acest director poate fi efectuată doar de o singură persoană responsabilă.
    • cataloage albe— NU necesitați un backlink și PUNEȚI un link direct.
    • cataloage gri- NECESIȚI un link înapoi și PUNEȚI un link direct.
    • cataloage negre— Ei NECESIT un backlink și NU oferă un link direct.
    • directoare de site-uri cu link-uri directe— la înregistrarea unui site în acest director, webmasterul primește un link direct (fără redirecționare) către site-ul său.
    • directoare de site-uri cu link-uri— înregistrarea unui site în acest director nu oferă un link către site-ul înregistrat. Link-urile în astfel de directoare sunt furnizate prin redirecționare.

Motor de căutare- Asta sistem automat, care stochează informații despre paginile web cunoscute de acesta și, la cerere, furnizează adresele celor unde se găsesc cuvintele cheie introduse.

Cuvinte cheie este un set de cuvinte și expresii care reflectă informațiile solicitate.

Cea mai de bază sarcină a fiecărui motor de căutare este de a furniza oamenilor exact tipul de informații de care au nevoie.

De aceea, dezvoltatorii specialiști de motoare de căutare creează principii și algoritmi pentru munca lor, care ar permite utilizatorilor să găsească informațiile de care sunt interesați. Aceasta înseamnă că sistemul trebuie să „gândească” în același mod în care gândește o persoană când caută informatiile necesare pe internet.

Pentru a obține răspunsurile corecte la astfel de întrebări, dezvoltatorii de căutare îmbunătățesc constant principiile de clasare și algoritmii săi, adăugându-le noi caracteristici și funcții și încercând prin orice mijloace să facă lucru mai rapid sisteme.

Primul program de calculator pentru căutarea pe Internet a existat un program numit Archie (în engleză archie - arhivă fără litera „v”). A fost creat în 1990 de către Alan Emtage, Bill Heelan și J. Peter Deutsch, studenți la informatică la Universitatea McGill din Montreal. Programul a descărcat liste cu toate fișierele de pe toate serverele FTP anonime disponibile și a construit o bază de date care putea fi căutată după numele fișierelor. Cu toate acestea, programul lui Archie nu a indexat conținutul acestor fișiere, deoarece cantitatea de date era atât de mică încât totul putea fi găsit cu ușurință manual.

Primul crawler web scris în Perl a fost World Wide Web Wanderer, un bot dezvoltat de Matthew Gray la MIT în iunie 1993. Acest robot a creat indexul de căutare Wandex. Scopul robotului Wanderer a fost să măsoare dimensiunea world wide webși găsiți toate paginile web care conțin cuvintele din interogare.

Motorul de căutare WebCrawler, lansat în 1994, este primul sistem de indexare a resurselor full-text care utilizează un robot („basat pe craweler”).

Sistemul a permis utilizatorilor să caute orice cuvinte aflate pe orice pagină web - acesta a devenit de atunci standardul pentru majoritatea motoarelor de căutare.

Motorul de căutare WebCrawler a fost primul motor de căutare care a devenit utilizat pe scară largă.

În 1996, a fost implementată o căutare ținând cont de morfologia rusă pe motorul de căutare Altavista și au fost lansate motoarele de căutare originale rusești Rambler și Aport. La 23 septembrie 1997, motorul de căutare Yandex a fost deschis. Pe 22 mai 2014, Rostelecom a lansat motorul național de căutare Sputnik. Deschis pe 22 aprilie 2015 serviciu nou Satelit. Copii în special pentru copii cu siguranță sporită.

Tipuri de motoare de căutare:

    • Sisteme care utilizează roboți de căutare. Acestea constau din trei părți: un crawler („bot”, „robot” sau „păianjen”), un index și un software pentru motorul de căutare. Este necesar un crawler pentru a accesa cu crawlere web și pentru a crea liste de pagini web. Un index este o arhivă mare de copii ale paginilor web. Ţintă software— evaluarea rezultatelor căutării. Datorită faptului că robotul de căutare în acest mecanism explorează în mod constant rețeaua, informațiile sunt mai relevante. Cele mai multe motoare de căutare moderne sunt de acest tip.
    • Sisteme alimentate de oameni (directoare de resurse): Aceste motoare de căutare preiau liste de pagini web. Directorul conține adresa, titlul și scurtă descriere site-ul. Directorul de resurse caută doar rezultate din descrierile paginilor trimise acestuia de webmasteri. Avantajul cataloagelor este că toate resursele sunt verificate manual, prin urmare, calitatea conținutului va fi mai bună în comparație cu rezultatele obținute automat de primul tip de sistem. Dar există și un dezavantaj - actualizarea datelor de catalog se face manual și poate rămâne semnificativ în urma situației reale.
    • Sisteme hibride. Motoarele de căutare precum Yahoo, Google, MSN combină funcțiile sistemelor folosind roboți de căutare și sisteme operate de oameni.
    • Meta-sisteme. Metamotoarele de căutare combină și clasifică rezultatele mai multor motoare de căutare simultan. Aceste motoare de căutare erau utile atunci când fiecare motor de căutare avea un index unic, iar motoarele de căutare erau mai puțin „inteligente”. Deoarece căutarea s-a îmbunătățit atât de mult acum, nevoia de ele a scăzut.

Multe motoare de căutare, cum ar fi Google și Bing, folosesc algoritmi pentru a ghici selectiv ce informații ar dori să vadă un utilizator pe baza activității sale de navigare anterioare. Ca urmare, site-urile web afișează doar informații care sunt în concordanță cu interesele trecute ale utilizatorului. Acest efect se numește „bulă de filtru”. Toate acestea duc la faptul că utilizatorii primesc mult mai puține informații care contrazic punctul lor de vedere și devin izolați intelectual în propria „bulă informațională”.

Profesorul efectuează un sondaj pentru a afla cel mai popular motor de căutare din clasă și prezintă elevilor clasamentul motoarelor de căutare din Rusia.

Limbajul de interogare

Interzicerea enumerarii tuturor formelor de cuvinte.

Prezența obligatorie a cuvintelor în documentele găsite.

Excluderea unui cuvânt din rezultatele căutării.

& - apariția obligatorie a cuvintelor într-o propoziție.

~ - cerința prezenței primului cuvânt într-o propoziție fără prezența celui de-al doilea.

| - căutați oricare dintre aceste cuvinte.

"" - căutați fraze stabile.

$title - căutați informații după numele titlurilor.

$anchor - caută informații după numele linkurilor.

4. Pauză dinamică

(diapozitivul 21-23) Elevilor li se acordă o pauză dinamică, care constă din trei grupe de exerciții de gimnastică pentru ochi, ameliorând tensiunea și oboseala conform metodei lui E. S. Avetisov.

5. Etapa de consolidare a materialului studiat urmată de autotestare.

(diapozitivul 24-25) Profesorul efectuează lucrări practice cu elevii privind căutarea pe Internet.

Lucrări practice.

Sarcina 1.

Caracteristici ale căutării după grup de cuvinte.

Completați tabelul utilizând motorul de căutare Yandex.

Structura cererii

Numărul de pagini găsite

Rapid! tramvai!

Express + tramvai

Cale Ușoară

"Cale Ușoară"

Bătălia de la Stalingrad

Stalingrad și bătălie

$title (Râul Volga)

$ancoră (râul Volga)

Sarcina 2.

Găsiți informații despre fapte interesante Volgograd pe internet

1. Ce este unic la strada Coventry din Volgograd?

2. Unde se află cel mai înalt monument din lume? la o persoană reală? Vă rugăm să indicați dimensiunile și fotografia acestuia.

3. Ce dimensiune are cea mai lungă casă din Europa? Indicați adresa și fotografia lui

4. Când Volgograd este redenumit „orașul erou Stalingrad” (date exacte)

5. Care este lungimea celei mai lungi străzi din Rusia, care nu are statut oficial de stradă? Ce nume are?

După finalizarea lucrării, rezultatele lucrării sunt verificate, iar elevii își acordă o notă pentru lecție.

Profesorul monitorizează progresul muncii elevilor și îi ajută pe elevii care nu pot îndeplini singuri sarcina.

Elevii, sub îndrumarea unui profesor, își verifică rezultatele munca practica, analizați răspunsurile primite și determinați evaluarea rezultatelor lucrării.

Exemple de răspunsuri la lucrări practice (diapozitivele 26-31)

Evaluarea lucrărilor practice

5 - răspunsurile la sarcina 1 au fost date corect, sarcina 2 a fost completată integral cu explicații și fotografii.

4 - în sarcina 1 au existat inexactități în 1-2 răspunsuri, una sau două dintre întrebările din sarcina 2 au primit un răspuns incomplet.

3 - în sarcina 1 au existat inexactități în 3-4 răspunsuri, trei întrebări din sarcina 2 au primit răspunsuri incomplete sau nu au existat răspunsuri la 2 întrebări

6. Rezumarea lecției, reflectarea asupra lecției, stabilirea temelor

Profesorul atribuie teme și le comentează dacă este necesar.

Teme pentru acasă

Învață materialul de curs

Manual de L. L. Bosov, A. Ya Bosov „Informatica 9”.

Caiet de lucru de L. L. Bosov, A. Ya Bosov „Informatica 9”.

Profesorul și elevii rezumă lecția, acordă note și mulțumesc pentru lecție și îi invită pe elevi să completeze o fișă de reflecție a lecției.

Răspundeți selectiv la 2-3 dintre următoarele întrebări:

    • azi am aflat
    • Am facut
    • Am dificultăți
    • Am îndeplinit sarcini
    • Am învățat
    • acum pot

Resurse folosite:

L. L. Bosova, A. Ya Bosova „Informatica 9”

I.G. Semakin, L.A. Zalogova, S.V. Rusakov, L.V. Shestakova „Informatică și TIC 9”