Motores de Búsqueda

Un buscador o “motor de búsqueda” es un sitio de Internet que da el servicio de buscar una lista de sitios donde hay información sobre un tema en particular.
Funcionan en base a palabras de búsqueda que proporciona el usuario investigador. Por ejemplo, si el usuario pone como palabras de búsqueda: renacimiento pintura, obtendrá una lista de sitios que hablen de la época del renacimiento, en especial en las obras de pintura del renacimiento.
En Internet existen docenas, quizás cientos de sitios buscadores, muchos de ellos muy poco conocidos y usados. El principal buscador de Internet es el sitio de búsqueda Google, pues más del 60% de las millones de búsquedas diarias que se hacen en el mundo, usan Google, por la calidad y relevancia de la lista de sitios que entrega al usuario.

Estructura de un buscador

El buscador es un website que permite que los usuarios ubiquen los sitios web con la información relevante que les interesa encontrar.
Puesto que Internet tiene millones de sitios web, el buscador necesita una forma eficiente de búsqueda, que de un resultado aceptable en el tiempo de acceso.

Los elementos estructurales de un sistema de buscador son:
elementos buscador  motor de busqueda
Elementos de un buscador

1…El espacio de almacenamiento: un buscador requiere grandes cantidades de espacio en disco para almacenar datos (dominio, url, ip, etc) de decenas de millones de sitios web. Por ejemplo, Google tiene  varios edificios en diferentes partes del mundo, con varias plantas de servidores de almacenamiento de datos.
El buscador no almacena los contenidos del sitio, sino su URL (dominio), su descripción, su título. Pero al almacenar estos datos también construye y almacena una estructura de datos de como llegar a  la información de sus servidores en forma rápida, en un archivo con una estructura especial llamado índice.

2…El archivo índice: es un archivo con una estructura especial que, por medio de algoritmos especiales, permite ubicar en forma rápida la información de un sitio en el almacenamiento masivo.

3…El robot o spider buscador de websites: el buscador tiene un programa llamado “robot” o “spider” que se encuentra en Internet buscando sitios web que aún no se encuentren en sus discos de almacenamiento. 
Si encuentra un sitio aún no almacenado lo guarda en el disco y coloca los datos de búsqueda en el índice. A esto se le llama "indexar" el sitio.
El programa robot tiene la función de ubicar los sitios aún no indexados para que el sistema buscador almacene los datos necesarios para la búsqueda de los sitios web en el índice y en el almacenamiento principal.

Historia de los buscadores de Internet


Antes de la web, hubo dos buscadores: "Archie", que buscaba temáticamente en sitios FTP y "Verónica" que busca en los sitios Gopher. Eran búsquedas casi artesanales que no llevaban a lo que en verdad se deseaba.

archie buscador sitios ftp
Archie, buscador en sitios FTP
Internet Veronica buscador gopher
Verónica, buscador en sitios Gopher
Wandex, un buscador creado en  1993 por Mattew Gray fue el primer buscador en el sentido de motor búsqueda de sitios web. En el mismo año 1993 salió el buscador Aliweb. En 1994 nace el buscador WebCrawler, relativamente exitoso y Lycos, buscador creado en la Universidad Carnegie Mellon.
buscador lycos
Lycos, con el logo del sabueso de búsqueda,
creado en la Universidad Cernegie Mellon
Estos eran buscadores  por  palabras clave, pero  con el  defecto de que  no buscaban los sitios más relevantes sino los sitios que  en sus contenidos  o títulos   tuvieran las  palabras clave.  Así, sitios de mucha  relevancia  en la información buscada podían quedar muy bajos en la lista de resultados o no aparecer.

Quizás eso contribuyó al éxito del primer buscador temático, lanzado en Marzo de 1995, Yahoo!. 
Yahoo! fue creado por David Filo y Jerry Yang, dos jóvenes universitarios que tuvieron la idea de crear el primer buscador temático.


David Filo y Jerry Yang  fundadores de Yahoo!
David Filo y Jerry Yang, fiundadores de Yahoo!
Al entrar al buscador Yahoo!, el usuario se encontraba con una lista de categorías como: Noticias, Entretenimiento, Deportes, Ciencia, Computadoras, etc, de modo que el usuario selecciona el tema de su interés.
Luego aparece una lista de subcategorías para la categoría seleccionada y así hasta llegar a la lista de enlaces a los sitios de interés que ellos colocaban manualmente.
Michael Moritz, de Sequola Capital fue el inversionista de riesgo que invirtió dos millones de dólares en el emprendimiento.
Los buscadores eran algo nuevo en Internet y no habían resuelto el problema de cual era su modelo de negocio, o en otras palabras, ¿cómo se ganaba dinero con un buscador?
La respuesta fue la publicidad, pues el buscador cumplía con el ser un lugar al que acudía mucha gente y si se ponían avisos publicitarios en esa página, los verían muchas personas.


modelo de negocios yahoo!  venta de publicidad
Ventas de Publicidad en las páginas de Yahoo!
Así lo hicieron los primeros buscadores, aunque sus páginas se volvieron como las páginas de un catálogo de productos comerciales.
El buscador Excite, creado por Joe Krantz, en 1997 fue uno de los primeros buscadores de palabras claves que introdujeron algunos conceptos de búsquedas por relevancia, con algún éxito.

Nace Google

Larry Page y Sergey Brin eran dos jóvenes estudiantes de la Universidad de Stanford, de 24 y 23 años, respectivamente, en el momento de conocerse.


fundadores de Google  BackRub su predecesor
Larry Page y Sergey Brin, cofundadores de Google
Se hicieron amigos y como tesis de grado, dirigida por el profesor Héctor García Molina, se plantearon la creación de un buscador que entregue sitios de calidad a las personas que realicen una consulta. Este buscador lo llamaron BackRub y debía de funcionar en computadores personales de gama baja, que tenían disponibles a la fecha.
Una popular anécdota de estos días dice que armaron la caja para los discos que iban a colocar en el servidor con fichas de Lego. Cada disco era de 10 Gb de capacidad y la caja usaba 4 discos, es decir 40 Gb en total, eran otros tiempos.
 
discos servidor en cajas de fichas Lego
La sala de Stanford donde se creó BackRub. Se ve sobre un PC las fichas Lego
BackRub, con su capacidad de entregar listas de resultados de relevancia, logró prestigio en el campus de la U. de Stanford.


La famosa caja de piezas lego para los discos duros
La legendaria caja de piezas Lego para los discos duros

En 1998 Sergey Brin y  Larry Page salen de Standorf y deciden fundar una empresa para crear y comercializar los servicios de un buscador más poderoso que BackRub.  A este nuevo buscador lo llamaron Google.

Google logró poco a poco búsquedas de mayor calidad en su lista de resultados al ir mejorando el algoritmo de búsquedas. Uno de los puntos fuertes del algoritmo fue que si un sitio tiene más enlaces entrantes, es mejor percibido por los usuarios, pues si es más visitado es porque tiene información de mayor calidad que otro sitio con pocos enlaces entrantes.

Larry Page había iniciado el algoritmo y con la ayuda de Sergey, un excelente matemático, fueron afinando el algoritmo.


google algoritmo de relevancia
Análisis de relevancia de un sitio, ideas básicas
pues el algoritmo es secreto
Una de las variables críticas del algoritmo es la cantidad de enlaces que llegan a cada página del sitio, desde otros sitios de la web. Mientras más enlaces lleguen al sitio, mayor es el peso del sitio web para el cálculo de la relevancia del sitio.
Naturalmente que para ser precisos, no todos los enlaces entrantes tienen el mismo peso. Un enlace entrante desde el sitio pajarito.com tiene menos valor que un enlace entrante desde www.bbc.com, es decir se debe considerar la relevancia de los sitios que envían el enlace de entrada.
En fin, el algoritmo Page Rank es secreto y es modificado cada cierto tiempo para que quienes intenten  analizar el Page Rank, no puedan descifrar el algoritmo.

Google se diversifica

Google es una empresa innovadora y dinámica, que invierte mucho dinero en comprar empresas con tecnologías avanzadas para así brindar nuevos y mejores servicios a sus usuarios.
Algunas de las compras de Google son:

·  El 20 de Septiembre del 2001 Google compra la tecnología de archivos Usenet, al comprar la empresa Deja.com.  El precio de la compra no ha sido revelado. Usenet era un almacenamiento de artículos que solo se podían accesar por medio de un programa de la empresa Deja.com que daba este servicio. Hay artículos desde 1995 y cubre alrededor de 20 años, por lo cual es una fuente importante de información histórica. Se estima que almacena 700 millones de artículos, donde hay “joyas” históricas como el artículo de Tim Berners-Lee de cómo creó la Word Wide Web, las discusiones del problema Y2K, etc. Una rica fuente de artículos científicos-históricos.
·   En Febrero del 2003, Google compra la empresa Pyra Labs, un generador de blogs, que transforma en su servicio gratuito Blogger, con el cual se ha escrito el presente blog.
empresas compradas por google por año
Número de empresas compradas por Google cada año
El 30 de Septiembre del 2003 compra el motor de búsqueda avanzado Kaltix.  como sabemos, el algoritmo del Page Rank de Google entrega una lista de resultados por criterios de relevancia de la información. Kaltix pretendía ir más allá y entregar una lista de resultados diferente para cada usuario, usando inteligencia artificial para determinar, en base al perfil del usuario, cual eran los criterios de relevancia personales del usuario.
En Julio,13, 2004 compra la empresa Picasa, que permite editar, gestionar y editar imágenes digitales en línea.
Picasa  gestor de imágenes en línea
El popular logotipo de Picasa
El 23 de  Julio del 2004, Google compra el buscador Baidu en cinco millones de  dólares.
En  Diciembre  del  2004,  Google compra la empresa Where2 y la convierte en su servicio Google Maps.
En Marzo  del  2005, Google compra Urchin Software Corporation, una empresa  especializada en cálculos estadísticos del uso de los servicios en Internet.
En Agosto del 2005, Google compra Android,  una  empresa que había desarrollado un sistema operativo y lenguajes de programación para dispositivos  móviles.
En Diciembre del 2005, Google hace una mega  compra al adquirir AOL (American on Line) un portal de Internet en la suma de mil millones de dólares.
En  Abril del 2006, Google  compra la empresa Orion que había desarrollado un algoritmo de búsqueda avanzado.
En Noviembre del 2006, Google hace  otra  mega  compra al adquirir Youtube,la empresa de gestión de videos, en 1.000'650.000 dólares.
Un largo etcétera de decenas de empresas compradas.


Google, el Rey de los buscadores en Internet

Google es el buscador más utilizado del mundo por mucha distancia. Los especialistas consideran que más del 60% de las búsquedas de Internet se realizan por Google.
El siguiente enlace nos permite ver un video de National Geographic almacenado en Youtube, titulado "Google inside" o sea Google por dentro.


Los creadores de Google

El siguiente documental, en cinco partes, trata de los dos creadores de Google: Sergey Brin y Larry Page.



















No hay comentarios: