tech Опубликована 27.05.2003 в 21:32

Google может стать впятеро быстрее.

Ученые из Стэнфордского университета опубликовали работу о том, как придать поисковой машине Google гигантское ускорение.

Пользователи любят поисковую машину Google за ее быстроту, но команда из Стэнфорда предложила способ сделать ее еще в пять раз быстрее. При таком запасе быстродействия Google можно будет настраивать индивидуально для каждого пользователя. Например, спортивному болельщику по ключевому слову tiger будут выпадать страницы не о крупной азиатской кошке, а об игроке в гольф Тайджере Вудсе.

Сейчас система ранжирования Google использует метод PageRank, изобретение соучредителя компании Ларри Пейджа. Этот алгоритм определяет популярность и релевантность веб-сайтов по тому, как часто на них ссылаются другие сайты. «Вычисление PageRank для миллиарда веб-страниц может занять несколько дней. Сейчас Google ранжирует и разыскивает три миллиарда веб-страниц, и для каждого персонализированного или тематического ранжирования требуются отдельные многодневные расчеты», — говорится в заявлении университета.

Чтобы ускорить работу PageRank, стэнфордские ученые разработали три метода, основанных на линейной алгебре. Эти методы описаны в трех работах, представленных на Двенадцатой ежегодной конференции по World Wide Web в Будапеште (Венгрия).

Первый метод, BlockRank, дает самое значительное — трехкратное — ускорение PageRank. В нем используется сделанное учеными открытие: на большинстве сайтов до 80% ссылок указывают на другие страницы того же сайта, так что каждый сайт похож на толстый блок ссылок. PageRank обрабатывает каждую ссылку отдельно, а более эффективный метод BlockRank рассматривает все эти внутренние ссылки сайта как одно целое и, только покончив с ними, переходит к внешним ссылкам.

Второй метод использует экстраполяцию. Прежде чем сканировать веб, выдвигаются определенные предположения о важности сайта. В процессе сканирования эти предположения либо подтверждаются, либо отбрасываются, так что по мере увеличения числа обработанных ссылок растет и точность оценок. Когда собирается достаточное количество свидетельств, производится экстраполяция — то есть делается догадка о ранге сайта. По сравнению с PageRank, где ранг сайта определяется лишь по окончании обширного обследования веба, метод экстраполяции работает на 50% быстрее.

Третий метод, называемый Adaptive PageRank, опирается на тот факт, что сайты с более низким рангом обычно обсчитываются быстрее, чем сайты с более высоким. Отказавшись от дальнейшей обработки таких быстро обсчитываемых сайтов, можно увеличить быстродействие на величину до 50%.

Хотя у каждого из этих методов свои преимущества, стэнфордская команда уверена, что в сочетании они обеспечат еще лучший результат. «При использовании всех этих методов возможно еще большее ускорение, — говорит один из участников проекта Сепандар Камвар. — Наши предварительные эксперименты показывают, что их комбинация сделает вычисление PageRank впятеро быстрее. Однако нам предстоит решить ряд проблем. Сейчас мы ближе к тематическому PageRank, чем к персонализированному ранжированию».

Пока теории стэнфордцев остаются теориями — не похоже, чтобы они были как-то связаны с самим Google. «Google приветствует любой вклад в дальнейшее изучение методов анализа гиперссылок в вебе», — ответил представитель компании на вопрос CNETAsia о том, рассмотрит ли Google возможность использования предложений ученых, сообщает ZDNet.

Подписывайтесь на NewsInfo.Ru

Читайте также

Бастрыкин заявил о бессмысленности попыток сегодня в 19:32
Схемы рушатся одна за другой: следствие получает инструменты, от которых не уйдет ни один рубль

Бастрыкин заявил о бессмысленности попыток скрывать незаконные активы и рассказал, как технологии и профилактика усиливают возможности следствия в борьбе с коррупцией.

Читать полностью »
Игнорирование личностного роста замедляет карьеру — хедхантер Кантемирова сегодня в 19:08
Работаете идеально, но стоите на месте? Возможно, вы застряли в уютной ловушке

Хедхантер рассказала MosTimes, какие ошибки в поведении и мышлении мешают карьерному росту, и почему репутация и нетворкинг важнее резюме.

Читать полностью »
Кандидаты уточняют полномочия и зоны ответственности — Ирина Смирнова сегодня в 18:56
Кандидаты выходят из тени: собеседования становятся ареной для сильных

Почему на собеседовании стоит проявлять инициативу и какие вопросы помогут кандидату понять, подходит ли ему данная компания.

Читать полностью »
Сняла с селёдки шубу — от бабушкиного рецепта уже тошнит: неожиданный ингредиент в составе изменил всё сегодня в 18:45

Новый салат, который может стать альтернативой традиционной "Селедке под шубой", поразит гостей необычным вкусом и ярким оформлением. Отличный выбор для праздничного стола.

Читать полностью »
Португальский язык повысил шансы россиян на трудоустройство — Альфред Авчян сегодня в 18:14
Редкий язык дороже диплома: новая валюта карьерного будущего

Китайский, испанский и португальский языки становятся новым ориентиром для тех, кто ищет востребованную профессию и международные перспективы.

Читать полностью »
Путин поручил развивать меры поддержки не только материнства, но и отцовства сегодня в 17:18
Россия делает ставку на отцов:новые инициативы обещают встряхнуть падающую рождаемость

Президент обозначил обновлённый подход к поддержке семей, связав меры для родителей с задачами демографии и заявив о необходимости усиливать участие отцов.

Читать полностью »
Фэтбайк подходит для зимних поездок и катания летом по песку — эксперт Синельников сегодня в 16:07
Замёрзшая дорога не проблема: как безопасно кататься зимой, избегая всех рисков

Как безопасно кататься на велосипеде зимой? Эксперт Игорь Синельников делится советами по выбору оборудования и предотвращению травм.

Читать полностью »
За хищение 6 млн рублей директор сегодня в 14:28
Преступный строитель: как мошенничество на ремонте мостов привело к 5 годам тюрьмы

Директор компании "Мостострой" осуждён на пять лет за хищение 6 млн рублей при ремонте мостов в Саранске. Суд признал его виновным в мошенничестве.

Читать полностью »