Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Что такое PageRank или что надо знать о PR




Как известно, статус сайта в Интернете измеряется в двух величинах: Яндекс тИЦ и Google PageRank. Про первую есть отдельная статья, а вот с тем, что за зверь такой - Google PageRank - мы сейчас постараемся разобраться.

Прежде всего, стоит сказать, что PR высчитывается по достаточно сложному алгоритму, который, как и в случае с тИЦ, известен только работникам самого поисковика, в нашем случае - Google - крупнейшей и популярнейшей поисковой машины в мире.

Основная задача поисковой машины, как известно, не просто найти все страницы, содержащие нужную информацию, а упорядочить найденные документы так, чтобы наиболее полезная информация отображалась выше, чем менее важная. К тому же те алгоритмы ранжирования, которые были разработаны для коллекций документов, используемых поисковиками при поиске, оказались беззащитны перед простейшими способами воздействия на них, когда для обеспечения хорошего результата достаточно было просто скопировать порядок расположения ключевых слов из текста, хорошо ранжируемого по этому запросу документа. Появилась необходимость разделять информацию на более и менее достоверную, учитывать важность, авторитетность и уникальность данных на ресурсах, предоставляющих ее. Остаётся выбрать оптимальный способ для этого. Лучше всего на основе данных о популярности страницы у пользователей, например посещаемости. Но тогда потребуется устанавливать какой-либо счетчик на каждую страницу (А именно так и сделал, к примеру, Rambler со своим счётчиком Rambler top100). Такой вариант для глобального поиска не подходит - всё-таки Рамблер - это исключение из правила. Тогда в качестве критерия была выбрана теоретическая посещаемость страницы.

Была разработана модель, эмулирующая движение пользователя по документам сети путем перехода по ссылкам с документа на документ, подразумевающая, что пользователь с равной долей вероятности перейдет по любой из ссылок, содержащихся в документе, который он в данный момент просматривает. То есть вероятность пользователя попасть на конкретный документ зависит от количества ссылок на него с других документов и от того, насколько вероятно нахождение пользователя на одном из ссылающихся документов и сколько уникальных исходящих ссылок содержит этот ссылающийся документ. Именно эта вероятность и была принята за показатель авторитетности или ранг страницы (PageRank):

PR a = (1-d) + d * ([Сумма от i=1 до n] PRi/Ci), где

PR a – PageRank рассматриваемой страницы,
d – коэффициент затухания (означает вероятность того, что пользователь, зашедший на страницу, перейдет по одной из ссылок, содержащейся на этой странице, а не прекратит путешествие по сети, обычно устанавливается равным 0,85),
PR i – PageRank i-й страницы, ссылающейся на страницу a,
C i – общее чисто ссылок на i-й странице.

Одним из самых распространенных заблуждений, связанных с PageRank является то, что можно вычислить PageRank по этой формуле для отдельно взятого документа, используя уже известные значения PageRank для документов, ссылающихся на него. На самом деле всё намного сложнее. Чтобы подсчитать PageRank одного документа, надо составить систему из N линейных уравнений данного вида для каждого из документов из поисковой базы, где число N – количество документов в поисковой базе. Эта система будет содержать N неизвестных. Решив ее, получим значения PageRank для каждого документа, известного поисковой машине. В поисковой базе крупнейших поисковых машин содержится огромнейшее число документов. Несмотря на то, что матрица, соответствующая системе уравнений будет сильно разряжена, численное решение этой системы требует огромных вычислительных мощностей. Поэтому поисковая система должна постараться максимально упростить процесс расчета, вводя некоторые допущения. Вот эти конкретные особенности реализации классической формулы PageRank, увы, составляют коммерческую тайну поисковых машин.

Возникает логичный вопрос: "А как узнать свой PageRank или PageRank какого-либо сайта? Узнать PageRank можно с помощью Google Toolbar - надстройки для браузера от крупнейшего мирового поисковика.

Ange1's fall - специально для promote-sites.by.ru

 

тИЦ (Тематический Индекс Цитирования)

Словосочетание " Индекс Цитирования " или просто тИЦ - что же скрывается за этим понятием?

Согласно словарям, индекс цитирования - это общее количество доменов, ссылающихся на сайт, для которого высчитывается индекс цитирования. Как правило, тИЦ устанавливается кратным десяти до 300 (10, 20, 30,..., 290, 300), кратным 50 до 1000 (350, 400,..., 950).

тИЦ высчитывается Яндексом. При его подсчёте также используются многие другие правила, которые, пожалуй, известны только работникам Яндекса.

На данный момент, как утверждает Яндекс, тИЦ абсолютно никак не влияет на порядок сайтов в выдаче поиска. Он служит лишь для расстановки сайтов в Яндекс.Каталоге. Но косвенное значение в расстановке сайтов на странице поиска он имеет - для упорядочения сайтов в результатах поиска служит ВИЦ - Взвешенный Индекс Цитирования, так сказать, аналог PageRank от Яндекса. Его значение до 2002 года можно было увидеть, посмотрев на Яндекс. Бар показывает, что тИЦ - гораздо менее важный показатель. При расчёте ВИЦ учитывается не только количество ссылок, но и их "Качество", то есть ВИЦ - ресурсов, на которых они стоят. Это - довольно сложный алгоритм, и опять-таки с точностью об этом вам могут рассказать только сотрудники Яндекса.

Чем больше ваш тематический индекс цитирования, тем выше будет цена ссылки с главной страницы вашего сайта, да и вообще к вашему сайту будет более уважительное отношение. Но для увеличения тИЦ следует пользоваться только легальными, "белыми" методами.

Разрешено в мире поисковой оптимизации всё, что не запрещено поисковиками. А запрещено ими: создавать страницы, бесполезные для пользователя, служащие для перенаправления на другой сайт (Дорвеи - DoorWay), скрывать ссылки от пользователя (Cloaking - Клоакинг), поисковой спам, некоторые другие методы. Покупка-продажа ссылок также не приветствуется поисковиками. Поэтому недопустимо прибегать к вышеперечисленным методам, а пользоваться другими, легальными методами.




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 253; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.013 сек.