Cos’è un motore di ricerca
5 febbraio 2007Quando Francesco di html.it ha chiesto tra amici e colleghi “cos’è un motore di ricerca?”, il 90% ha risposto: “boh!” Paradossalmente l’uomo dovrebbe essere in grado di rispondere a questa domanda perché da 200.000 anni non ha mai smesso di cercare. L’uomo è da sempre alla ricerca di un amore, di un amico, di soldi. Inoltre, siamo continuamente alla ricerca della felicità!
Una domanda stupida? Penso proprio di no.
Dopo un piccolo test tra persone vicine e visto il risultato qualitativo e non quantitativo del post “400 motori di ricerca”, la domanda “cos’è un motore di ricerca?” diventa una necessità. Perché? Sicuramente è molto più facile definire una macchina o una casa piuttosto che un motore ricerca, nonostante lo usiamo tutti i giorni.
Tra gli “utenti base” è normale che possano esserci dei dubbi, ma… noi, addetti ai lavori e operatori di mercato, riusciamo a rispondere a questa domanda?
Due premesse:
.- Fare copia incolla da wikipedia non è consentito.
.- Federico, hai solo un’opportunità per rispondere! :)
Allora… cos’è un motore di ricerca?
Via!
Post correlati:
Tags: Motori di ricerca
Categorie: Search Marketing
Nessun commento a “Cos’è un motore di ricerca”
Eh eh… :)
allora… senza andare a vedere su wikipedia e cercando di essere il più riassuntivo possibile… un motore di ricerca (almeno quelli web oriented, affini al nostro argomento) è un software che permette all’utente la ricerca, tra i miliardi di documenti (pagine web, swf, pdf, documenti word ecc ecc) pubblicati su internet e previamente catalogati dal motore stesso, dei documenti contenenti la keyword o (possibilmente) l’argomento correlato alla keyword (o keyphrase) digitata.
Si suddivide in tre aree, sezioni (o come si voglia chiamarle):
1- Surfing (ehi, è un termine appena inventato per rendere l’idea, non dateci troppo peso): appositi software (spiders/robots) viaggiano per la rete seguendo (solitamente) i link, alla ricerca delle pagine da catalogare o delle modifiche alle pagine/documenti già catalogati
2- Immagazzinamento: i documenti trovati dagli spider vengono stoccati in vari “magazzini” (i datacenters di google, per esempio) in ordine di importanza (e qui non possiamo metterci a spiegare le motivazioni di questa importanza, in linea di massima diciamo che l’ordine viene dato in base alla credibilità, unicità e importanza delle argomentazioni presenti in un documento, relativamente a se stesso e ai documenti in connessione con esso tramite i links)
3- Interfaccia: ciò che l’utente vede e utilizza, un semplice campo di input nel quale egli digita la sua keyword, keyphrase, query. La richiesta fatta viene confrontata con le pagine cachate (immagazzinate) dal motore e con i dati che il motore ha di esse; il risultato di questa operazione viene visualizzato secondo l’ordine precedentemente spiegato nella “serp”, una lista contenente titolo, descrizione e link dei vari documenti.
Quindi la fase di ricerca dell’utente e la fase di ricerca del motore stesso sono due processi nettamente distinti (questo è un concetto che ha stupito molto le poche persone a cui l’ho spiegato, pensavano che ad ogni query Google andasse in gio per i siti a cercare, :) ), questo ha come risultato positivo una esponenziale velocizzazione dei tempi di risposta e come risultato negativo un lasso di tempo variabile tra il la creazione della pagina in rete e il suo immagazzinamento nei motori di ricerca, con le relative conseguenze (per tot tempo la pagina c’è ma no si trova, oppue, la pagina non c’è più ma si trova ancora ecc ecc.). Ovviamente il fattore tempo di risposta è molto più importante di questo.
Allora prof, come sono andato?
Beh, direi che hai usato molto bene la tua cartuccia!!
grazie :)
bhe così su due piedi (e all’una di notte…) un motore di ricerca è un software che immagazina, esamina ed organizza informazioni rendendole disponibile agli utenti in modo efficiente ed evidenziando le relazioni esistenti fra le risorse e i criteri di ricerca… o almeno è quello che dovrebbe fare
Il ruolo dei motori di ricerca è divenuto fondamentale con l’esponenziale crescita degli utilizzatori di Internet e delle informazioni presenti, in quanto offrono uno strumento essenziale per la ricerca di dati e informazioni nel web.
Tramite essi, infatti, è possibile reperire informazioni o risorse all’interno del Web. Costituiscono un classico esempio di applicazione Information Retrieval (IR) (letteralmente: recupero d’informazioni), la disciplina che studia la ricerca di informazioni, documenti, metadati, file, all’interno di banche dati o documenti stessi, di qualsiasi tipologia od estensione.
E’ sufficiente digitare una frase che riguarda l’argomento di interesse, cliccare sul pulsante “Cerca” e il Motore riporta dopo pochi secondi migliaia di risultati costituiti, da un Titolo ed una Descrizione sintetica di quanto è trattato da ognuno dei siti individuati.
Il meccanismo che sta alla base del funzionamento di un motore di ricerca si può suddividere principalmente in 3 fasi:
1.Web crawling: una componente del sistema si occupa di visitare tutte le pagine fornite da un URL server, e tutte le pagine ad esse collegati in modo automatico, al fine di avere un maxi archivio con una copia di tutte (o quasi) le pagine del Web.
2.Indexing: a causa della grandissima mole di dati che il Web contiene si esegue una organizzazione delle informazioni raccolte dal crawler. Questa fase consiste nel analizzare le risorse, siano esse html, pdf, etc. , e codificarle in una lista di parole (hits). A questo punto viene eseguito un inverted index, ovvero si associano tutte le parole del vocabolario di una lingua tutti i riferimenti alle pagine che contengono quel termine.
3.Query: questa rappresenta la fase conclusiva del funzionamento, ovvero la ricerca di risorse vere e proprie dopo aver organizzato in modo corretto l’archivio. Un utente mediante l’inserimento di una o più keyword esegue una query, e riceve come risultato un elenco di url correlate, il titolo della pagina stessa. , la descrizione sommaria del contenuto ed un valore di rilevanza della risorsa.
Se i risultati delle ricerca mostrano un grande numero di documenti per l’utente è sconveniente analizzare ciascun documento al fine di reperire quello migliore.
Per questo si necessita di stilare un ordine di priorità all’interno dell’elenco delle pagine, il cosiddetto ranking.
è un software che consente il reperimento di informazioni sul web, attraverso la ricerca di tag e parole chivae attraverso cui sono archiviate le pagine web, dando come risultato una serie di link alle pagine stesse. la lista dei siti di riferimento è ordinata in base alla pertinenza con l’argomento scelto….è interessante per la memetica…..scusa l’intrusione cercavo il video del seminario Anso poi non lo hai più messo, ciao Monia
Se volete affrontare in modo molto più tecnico e teorico, molto interesante la bibliografia, l’argomento dell’indicizzazione dei documenti vi segnalo il progetto open source lucene di Apache (una garanzia).












Un motore di ricerca è un applicazione web che ti permette di trovare in base ad un criterio di ricerca il sito e/o i siti che contengono quello da te digitato.
Bel post Johnnie :)