В далеком 1995 году у людей были модемы, которые подключались к Интернету по телефонным линиям. Максимальная скорость была 0,056 мегабита в секунду (Мбит/с). Сегодня большинство людей в Америке подключаются к Интернету со скоростью как минимум в 20 Мбит/с. Это значит, что сегодня мы можем скачивать фотографии мгновенно. Но тогда даже загрузка одного изображения низкого качества могла занять несколько минут.
Попрошайничество, Заимствование, Шпионаж
Что делать, если тебе нужна тонна компьютерного оборудования, но у тебя нет тонны денег? Именно с такой проблемой столкнулись Ларри и Сергей. Сидя в своем кабинете, также известном как Гейтс 360 (да, он назван в честь того самого Гейтса, Билла Гейтса из Microsoft), Ларри и Сергей быстро продумали хитрый план.
Рыская у погрузочной платформы здания информатики Стэнфордского университета, Ларри и Сергей шпионили, наблюдая за компьютерными поставками. Они точно выяснили, сколько компьютеров поставлялось и кому они предназначались.
Затем следовал их выход!
– Добрый день!
– Мы тут заметили, что этим утром вам доставили двадцать компьютеров.
– Наверняка вы бы смогли обойтись и девятнадцатью?
И так они ходили от одной двери к другой, отслеживая поставки, попрошайничая, выпрашивая детали и заимствуя компьютеры. Пуская в ход те небольшие деньги, что у них были, и присваивая любые «невостребованные» поставки (кто-то назовет это воровством, другие назовут заимствованием – разница не большая), Ларри и Сергею удалось собрать все необходимое «барахло» для их проекта.
В то время компьютеры удивляли не только своей ценой, но и своим весом. Эта их особенность осложняла переноску. Поэтому Ларри и Сергей купили большую тележку, с помощью которой они тягали ящики «найденных» и «заимствованных» компьютеров в свой кабинет.
К счастью, это пространство они делили с компанией столь же причудливых персонажей.
Теперь, когда они собрали кучу компьютерных компонентов, электроники и дисков, пришло время соединить их.
А что может быть лучшим инструментом для этой задачи, как не… ЛЕГО! Или, вернее, самая дешевая его альтернатива, которую они только смогли найти. Ларри и Сергей решили, что, раз уж они бедные студенты, они не могут позволить себе настоящее Лего.
Во времена учебы в Мичиганском университете Ларри сумел выполнить задание, построив струйный принтер из Лего! Тогда он еще не знал, что эти навыки строительства из кирпичиков сыграют большую роль в достижении его цели по преображению мира.
Перебирая блоки, разбросанные по столу Ларри, парочка стала сцеплять пластиковые кирпичики друг с другом. Вскоре из беспорядка выросли разноцветные башенки. Поместив жесткие диски в такую башенку, они закончили сборку своего домашнего сервера. Некоторые углы даже скрепили клейкой лентой.
Первоначальный сервер Google состоял из десяти дисков объемом 4 ГБ (гигабайт), в общей сложности 40 ГБ или гигабайт. В 1996 году диски на 4 ГБ были самыми большими по объему. Сегодня можно купить жесткий диск, который поместится в ладони и будет вмещать 16 терабайт данных (это 16 000 гигабайт).
На этот сервер можно взглянуть своими глазами. Он выставлен в Инженерном центре Стэнфордского университета.
На сегодняшний день подсчитано, что Google использует около одного миллиона серверов!
Первая стойка для хранения серверов Google (сделанная из блоков Duplo после того, как оригинальный бренд не выдержал и развалился). Фото: Стив Юрветсон
Теперь настал момент истины. Сергей и Ларри подключили свое создание в компьютерную сеть Стэнфорда и начали скачивать Всемирную сеть.
Сработало. Их эксперимент сканировал веб и скачивал его.
Так родился «Google».
На самом деле, эм… он назывался BackRub[3 - BackRub – первое название Google. Дословно переводится как «МассажСпины».]. Именно так, когда Ларри и Сергей придумывали имя для своей идеи, что вскоре должна была изменить мир, они сошлись на BackRub.
И технически они как раз сделали первый шаг на своем пути: сканирование и загрузка всемирной паутины. Но BackRub был просто веб-искателем, удивительным, но все же… Теперь перед Ларри и Сергеем стояла поистине Геркулесова задача математически осмыслить все эти данные.
ЗНАКОМЬТЕСЬ С КОЛЛЕГАМИ ПО ОФИСУ: Шон Андерсон, студент, настолько погруженный в свои исследования, что не мог позволить себе терять время в своей квартире. Он стал и работать, и спать в офисе. Он также заставил весь офис растениями, а затем запрограммировал свой компьютер поливать их.
Тамара Мунзнер была единственной женщиной в группе. Чтобы иметь возможность работать, ей приходилось носить наушники, заглушающие печально известные «дебаты» Ларри и Сергея. На энергичном Лукасе Перейра и тихом студенте Бене Чжу заканчивался список соседей по офису.
У Ларри и Сергея также были два оплачиваемых ассистента: Скотт Хассан и Алан Стеремберг. И Скотт, и Алан учились в Стэнфорде и искали возможность заработать немного денег и поработать на крутом проекте. Когда Алан не был занят помощью Ларри и Сергею, он занимался своим собственным проектом, Weather Underground. Впоследствии он станет одним из самых популярных сайтов с прогнозами погоды благодаря его точности и детализации. А Алан станет президентом Weather Underground.
Скотт Хассан получил работу ассистента после встречи с Сергеем на игре по алтимат фрисби в Стэнфорде. Он был талантливым программистом и столь же одаренным по части пранков. Хассан в дальнейшем стал пионером робототехники и сегодня разрабатывает робота, в котором на катящемся теле располагается голова в виде телевизора с плоским экраном. Вместо того чтобы разговаривать с роботом, ты можешь общаться по видеочату с его владельцем в режиме реального времени, прямо как по FaceTime. Возможно, в будущем вместо того, чтобы идти в школу, можно будет просто отправить своего робота! Инновация Хассана зовется The Beam[4 - Луч (англ.).].
Глава 3. Давно забытый кошмар: поиск до изобретения Google
Сегодня, если ты наберешь «В чем значимость Уильяма Шекспира?» В Google, ты получишь около 16 700 000 результатов всего за 0,63 секунды. И все эти результаты упорядочены по значимости. Не так уж и сложно, не правда ли?
Не правда!
Приготовься. В этой поездке на машине времени будет трясти.
До Google люди жили в мире, где результаты поиска были бессмысленными. Вот ты входишь в поисковую систему. Вводишь какое-нибудь простое ключевое слово, например, «Шекспир», так как поисковая система не может обработать разговорный текст.
Возможно, ты хотел узнать, «где родился Шекспир?». Но все, что ты смог напечатать, – фамилию Уильяма.
Разговорный текст – это фраза или предложение, которое звучит так же, как бы ты его произнес. Это неформальное и естественное выражение твоих мыслей или вопросов.
Ты нажимаешь «ввод» и ждешь, пока страницы за страницами результатов загружаются без какого-либо порядка. Фактически то, что ты ищешь, может находится в самом последнем результате поиска – или где-то в середине. Мало того, спустя целый час поиска ты скорее всего с гневом осознаешь, что нужно было ввести другое ключевое слово (и повторить все заново). Ты пытаешься закричать, но сил нет даже на шепот.
В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.
Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.
PageRank[5 - PageRank – название алгоритма по упорядочиванию поисковых результатов. Названо в честь Ларри Пейджа. Дословно переводится как «ранг страниц» или «ранг Пейджа».]
Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.
Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.
Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.
Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.
Когда изобретатели создают что-то новое, они подают патент на свое изобретение. Эта документация защищает изобретение, чтобы другие не могли его скопировать. Поскольку PageRank был создан студентами Стэнфорда на кампусе, патентом на PageRank владеет Стэнфордский университет. Стэнфорд лицензировал этот патент исключительно для Google в обмен на акции в компании. Когда университет продал эти 1,8 миллиона акций Google в 2005 году, они заработали 336 миллионов долларов. Неплохо! (Думаю, это компенсирует недостающие компьютеры.) С патентом можно ознакомиться здесь: https://www.google.com/patents/US6285999.
В 1996 году, когда Ларри и Сергей запустили BackRub для сканирования в Интернете и создания индекса ссылок, они затем использовали PageRank для организации и ранжирования всех этих веб-данных. Анализируя результаты, они поняли, что их проект был очень похож – ну очень похож – на поисковик, только с точными результатами. Эврика! Они сравнили результаты запроса с результатами самых популярных поисковых систем тех лет. Бесспорно, результаты PageRank оставляли всех остальных далеко позади.
Как и у любого пользователя сети, первый поиск Ларри на BackRub был… его собственное имя.
Ларри и Сергей поняли, что они только что случайно произвели революцию в веб-поиске.
Скриншот первоначальной страницы BackRub из Internet Archive WayBack Machine
Взлет
Шумиха вокруг BackRub разлетелась по кампусу как пожар. Студенты, в частности, были очень взволнованы: не каждый день возвращаешь назад часы своей жизни. Дни просеивания бессмысленных результатов поиска закончились. Это поражало воображение. Челюсти отваливались.