Экономика стран

К сожалению, большинство людей, которые будут ими затронуты почти весь мир, не будут иметь никакого влияния на результат. Вести Экономика Дайджест иностранной прессы за 14 августа.
Вести Экономика Греции снова придется списывать долги Греция не сможет самостоятельно расплатиться по долгам, и понадобится новая реструктуризация долгов, чтобы спасти страну от банкротства.

Объяснил алгоритм Google PageRank

  1. Вернуться к оригиналу Google бумага
  2. Вот как изначально был определен расчет PageRank:
  3. Что это значит?
  4. PageRank - это итерационный алгоритм
  5. PageRank визуализируется в Excel
  6. Другие интересные наблюдения, которые ставит Джонс:
  7. Хотите быть в курсе последних тенденций поиска?
  8. Хотите быть в курсе последних тенденций поиска?

Ранее сегодня Диксон Джонс из Majestic поделился в твиттере подробное, понятное объяснение того, как на самом деле работает PageRank.

Я сам подарил ему часы и подумал, что это хороший момент для того, чтобы вернуться к этой дикой части математики, которая за последние 20 лет сильно повлияла на мир.

В качестве знаком мы знаем по состоянию на 2017 что хотя PageRank был удален с панели инструментов в 2016 году, он по- прежнему является важной частью общего алгоритма ранжирования, и поэтому его стоит понять.

Джонс начинается с простого Или, по крайней мере, простая формула.

Для тех, кто не обожает математику или, возможно, забыл несколько технических терминов со времени последнего класса исчисления, эта формула будет читаться вслух так:

«PageRank страницы в этой итерации равен 1 минус коэффициент демпфирования, плюс для каждой ссылки на страницу (кроме ссылок на себя) добавьте рейтинг страницы этой страницы, деленный на количество исходящих ссылок на странице и уменьшается на коэффициент демпфирования. »

Вернуться к оригиналу Google бумага

На этом этапе Джонс продвигается в видео к более простой, но все же полезной версии расчета. Он извлекает Excel, простой визуальный элемент из 5 узлов, и составляет алгоритм ранжирования в течение 15 итераций. Качественный товар.

Лично я хотел немного больше математики, поэтому я вернулся и прочитал полную версию « Анатомия крупномасштабной гипертекстовой поисковой системы »(Естественный первый шаг). Это была статья, написанная Ларри Пейджем и Сергеем Брином в 1997 году. Google , опубликовано в Стэнфордском отделе компьютерных наук. (Да, это долго, и я буду работать немного поздно вечером. Все в хорошем веселье!)

Как это для начальной строки: « В этой статье мы представляем Google прототип крупномасштабной поисковой системы, которая интенсивно использует структуру, присутствующую в гипертексте. »

Повседневный, в общем, продолжающийся стиль.

В качестве дополнительного забавного факта, наши собственные Часы Поисковой машины были процитированы в этом Google дебютная статья! Никто иной, как сами Пейдж и Брин, утверждают, что по состоянию на ноябрь 1997 года уже было 100 миллионов веб-документов.

Во всяком случае, вернуться к работе.

Вот как изначально был определен расчет PageRank:

«Литература по академическому цитированию применяется в Интернете, в основном путем подсчета цитат или обратные ссылки на данную страницу. Это дает некоторое приближение важности или качества страницы. PageRank расширяет эту идею, не считая ссылки со всех страниц в равной степени, и нормализуя по количеству ссылок на странице. PageRank определяется следующим образом:

Мы предполагаем, что на странице A есть страницы T1… Tn, которые указывают на нее (т. Е. Являются цитатами). Параметр d представляет собой коэффициент демпфирования, который можно установить в диапазоне от 0 до 1. Обычно мы устанавливаем значение d в 0,85. Подробнее о d читайте в следующем разделе. Также C (A) определяется как количество ссылок, выходящих за пределы страницы A. PageRank страницы A определяется следующим образом:

PR (A) = (1-d) + d (PR (T1) / C (T1) +… + PR (Tn) / C (Tn))

Обратите внимание, что PageRanks формируют распределение вероятностей по веб-страницам, поэтому сумма PageRanks всех веб-страниц будет равна единице.

PageRank или PR (A) могут быть вычислены с использованием простого итеративного алгоритма и соответствуют главному собственному вектору нормализованной матрицы ссылок сети. Кроме того, PageRank для 26 миллионов веб-страниц можно рассчитать за несколько часов на рабочей станции среднего размера. Есть много других деталей, которые выходят за рамки этой статьи ».

Что это значит?

Потерпите нас! Вот снова наша формула:

PR (A) = (1-d) + d (PR (T1) / C (T1) +… + PR (Tn) / C (Tn))

Обратите внимание, что это то же самое, что и на картинке выше, за исключением того, что фотография «упрощает» вторую часть уравнения, подставляя в верхний регистр сигму (is), которая является символом для математического суммирования, т.е. делайте эту формулу для всех страниц 1 через n, а затем сложите их.

Таким образом, чтобы вычислить PageRank данной страницы A, сначала мы берем 1 минус коэффициент демпфирования (d). D обычно устанавливается как 0,85, как видно из их оригинальной статьи.

Затем мы берем PageRanks всех страниц, которые указывают на страницу A и обратно, складывают их и умножают на коэффициент демпфирования 0,85.

Не так уж и плохо, правда? Проще сказать, чем сделать.

PageRank - это итерационный алгоритм

Возможно, ваши глаза застыли на этой части, но Брин и Сергей фактически использовали слово «собственный вектор» в своем определении. Я должен был искать это.

По-видимому, собственные векторы играют заметную роль в дифференциальных уравнениях. Приставка «eigen» происходит от немецкого языка для «надлежащего» или «характеристики». Также существуют собственные значения и собственные уравнения.

Как Роджерс указал В его классической статье о PageRank самый большой вывод для нас о части собственного вектора состоит в том, что это тип математики, который позволяет вам работать с несколькими движущимися частями. «Мы можем пойти дальше и рассчитать PageRank страницы, не зная окончательного значения PR других страниц . Это кажется странным, но, в основном, каждый раз, когда мы запускаем вычисления, мы получаем более точную оценку окончательного значения. Поэтому все, что нам нужно сделать, это запомнить каждое вычисляемое нами значение и повторять вычисления много раз, пока цифры не перестанут сильно меняться ».

Или, другими словами, важность собственного вектора заключается в том, что PageRank является итеративным алгоритмом . Чем больше раз вы повторяете вычисления, тем ближе вы подходите к наиболее точным числам.

PageRank визуализируется в Excel

В своем видео Джонс сразу же приступает к забавной части, поэтому он настолько эффективен всего за 18 минут. Он демонстрирует, как PageRank рассчитывается на примере 5 веб-сайтов, которые ссылаются друг на друга.

Затем он возвращает его к вычислениям в Excel:

И демонстрирует, как вы будете выполнять итерацию, беря ряд чисел внизу и повторяя вычисления.

После этого числа постепенно начинают выравниваться (это было после 15 итераций):

После этого числа постепенно начинают выравниваться (это было после 15 итераций):

Или, как некоторые могут подписать это фото, «Собственные векторы в дикой природе».

Другие интересные наблюдения, которые ставит Джонс:

  1. Количество ссылок (только общее количество) является плохим показателем. Нам нужно больше заботиться о ранге каждой страницы.
  2. Учитывается рейтинг на уровне страницы, а не авторитет домена . PageRank смотрел только отдельные страницы.
  3. Большинство страниц почти не имеют рейтинга. По его примеру, топ-3 из 10 составляли 75-80% от общего рейтинга.

Итак, наконец, вот оригинальный твит, который спустил меня в эту длинную, захватывающую кроличью нору. Надеюсь, вам всем нравится то же самое!

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Хотите быть в курсе последних тенденций поиска?

Получить лучшие идеи и новости от наших экспертов по поиску.

Хотите быть в курсе последних тенденций поиска?
Что это значит?
Хотите быть в курсе последних тенденций поиска?
Хотите быть в курсе последних тенденций поиска?
Навигация сайта
Реклама
Панель управления
Календарь новостей
Популярные новости
Информация
Экономика стран www.mp3area.ru © 2005-2016
При копировании материала, ссылка на сайт обязательна.