Наверх

Яндекс, Google — кто тут лишний?

Автор kbaott, 21.08.2010 | Просмотров: 4 997 |

Возвращаюсь к вопросу интернет технологий. На этот раз хочу поделиться своими мыслями по поводу поисковых систем. Из названия статьи ясно, что обсуждать я тут буду только Яндекс и Google, так для веб-мастеров, да и чего тут скрывать, для обычных пользователей это две первые поисковые машины; остальные, типа Mail.ru, Rambler, Yahoo и т.д., уже давно утратили статус первых (если он вообще когда-то имел место), поэтому их мы трогать не будем. Также Яндекс и Google нам интересны еще и тем, что эти поисковики рьяно используются для монетизации сайтов, в виду наличия в этих системах «пузомерок».

Сразу перехожу к сути вопроса — какая поисковая система лучше? Сразу стоит ответить для себя на следующие вопросы: «выдача какой ПС лучше?», «алгоритмы индексации какой системы адекватнее?», «методы ранжирования сайтов какой системы понятнее и удобнее?». Для себя я отвечу сразу же: Google, Google и соответственно Google. Всем давно известно, что выдача Яндекса и Google по одному и тому же запросу разная. Иногда кардинально разная и при этом Google показывает как правило наиболее релевантные страницы в отличие от Яндекса. Конечно все дело в алгоритмах ранжирования и индексации. У Google они намного лучше. Тут, конечно же, не лишней будет оговорка — Яндекс хорош для рунета, Google хорош для англоязычных ресурсов. Эти системы вполне можно сочетать между собой, но как ни крути Яндексу еще далеко до уровня Google.  Бесчисленное количество раз я сам себе доказывал: то, что я не могу найти в Яндексе, я обязательно найду в Google.  Говорить о поисковых алгоритмах сложно, да и не нужно, потому как мало кто знает как они на самом деле работают. А вот о результатах работы этих алгоритмов уже сказано много.

Рейтинг сайтов в Яндекс и Google. Больной вопрос всех вебмастеров. Тут абсолютное превосходство Google. Но начну немного издалека. Раньше рейтинг сайта определялся только посещаемостью — чем больше человек заходит на сайт в определенный промежуток времени тем выше рейтинг этого сайта, тем он авторитетнее.  Где-то на просторах Сети я встречал сравнение этой системы рейтинга с рейтингами печатных изданий — газет: чем больше данную газету покупают, чем больше у этой газеты тираж — тем она серьезнее и авторитетнее. Но какое то время назад поисковые машины Яндекс и Google обзавелись новым способ ранжирования сайтов — индексы цитирования. У обоих систем они разные. Практически все уже знают как они работают, но я вкратце повторюсь и сразу буду указывать на плюсы и минусы.

Итак. у нас есть Яндекс тИЦ и Google PR — смысл этих индексов только в том, чтобы на основе количества (и качества) ссылок на данный ресурс вычислить его (ресурса) авторитетность. Раньше ссылки на другие сайты использовались только как инструмент привлечения некоторого количества трафика, поэтому и были в ходу баннеры, так как намного вероятнее, что по красивому анимированному большому баннеру кто-то щелкнет. Теперь ссылки это товар. Ими торгуют. То есть сайты противоестественно наращивают количество ссылок на себя за деньги, при этом сайту присваивается некая авторитетность, собственно, искусственная. Как я уже говорил — сейчас никто не захочет сам по своей доброй воле повесить на своем сайте ссылку на Ваш сайт, такое бывает только в очень редких случаях, а вот за деньги, и, причем очень неплохие деньги, можно размещать на своем сайте ссылки на другие ресурсы. Из-за того, что поисковые системы придумали индексы цитирования, которые присваивают сайтам, а потом на этих сайтах покупают ссылки, а чем выше индекс цитирования у сайта тем дороже с него ссылка, в этом движении начали появляться ссылочные биржи, биржи статей с ссылками в тексте и т.д. Появился способ «легкой наживы» — создаем ГС, вкладываем в него некоторое количество денег, регистрируем на бирже и торгуем с него ссылками — это в общих чертах. В итоге сайты делают не для людей, а для поисковых машин. Вот отсюда и такое количество ГС и другого хлама в Сети. Но я отвлекся. Продолжаем.

Яндекс тИЦ — тематический индекс цитирования. Рассчитывается для сайта в целом и показывает авторитетность ресурса относительно других, тематически близких ресурсов (а не всех сайтов Интернета в целом). ТИЦ используется для ранжирования сайтов в каталоге Яндекса и совершенно не влияет на поисковую выдачу в самом Яндексе. Алгоритм или, не знаю как это назвать, формула вычисления тИЦ никому не известна, иногда складывается впечатление, что команда Яндекса тоже не знает этой формулы, тИЦ назначается хаотично, иногда без определенной логики, но часто (по сравнению с Google PR). Тематический индекс цитирования может быть от 0 (меньше 10) и до огромных значений (1000, 70000 и т.д.) с шагом в 10. То есть тИЦ может расти примерно так: 0 — 10 — 20 и т.д.  Определенно сказать каким будет следующий тИЦ сказать сложно и, практически, невозможно. Из этого следует, что хаотичность и неопределенность назначения тИЦ это жирный минус Яндексу, хотя именно тИЦ Яндекса сейчас наиболее популярный финансовый показатель сайта. Из моего опыта стоит отметить, что для роста тИЦ важна тематика ссылающегося сайта и количество ссылок, а вот тИЦ ссылающегося сайта не очень важен, т.е. «вес» ссылки учитывается не сильно. А, вот еще, в поисковой выдаче тИЦ не играет никакой роли — в выдаче на первом месте может стоять сайт с тИЦ 0, а на втором и третьем месте сайты с тИЦ 100 и 1500. Стоит также вспомнить об откровенно идиотской мысли автоматического определения тематики сайта, которая когда-то муссировалась Яндексом: ладно сайты узкой тематики — автомобили, компьютеры, косметика и т.д., а как быть с блогами, разнообразными порталами, которые охватывают огромное количество тем? Слава Богу этот способ не применили — Яндексу для полного краха еще такого сервиса не хватает.

Google PR (Google Page Rank) — рейтинг страницы, с которым работает Google. PageRank — это числовая величина, характеризующая «важность» веб-страницы, именно одной страницы, а не сайта в целом, хотя и применяется как правило к целому сайту. Чем больше ссылок на страницу, тем она становится «важнее». Из особенностей PR стоит отметить, что «вес» страницы А определяется весом ссылки, передаваемой страницей B. PR может варьироваться от 0 до 10, что мне кажется удобнее, чем тИЦ Яндекса. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на нее — вот тут полная обратность тИЦ, для назначения PR сайту важен PR ссылающегося сайта. Для вычисления PR есть вполне адекватный алгоритм, который показан в виде таблицы:

Как видно из таблицы, чтобы получить PR 1 нужна одна ссылка с сайта с PR 4. Этот алгоритм лично мне очень по душе. Конечно, хороший PR получить очень сложно, но можно. Вот тут и отсекаются разные ГС — вряд ли авторитетный сайт-мастодонт PR 7-8 будет ссылаться на какой-то невнятный ГС, но «и на старуху бывает проруха», один из моих сайтов странным образом получил PR3.

Также есть еще и Яндекс вИЦ – взвешенный индекс цитирования – аналог PageRank, применяемый поисковой системой Яндекс. Значения ВИЦ нигде не публикуются и известны только Яндексу. Поскольку узнать ВИЦ нельзя, следует просто помнить, что у Яндекса есть собственный алгоритм оценки «важности» страниц. А по сему толку от него »ноль».

Вернусь к индексам цитирования и ГС.  До недавнего времени веб-мастера делали так: скупали с разных сайтов кучу дешевых ссылок, поисковый робот проходил по этим сайтам, индексировал ссылки, после этого купленные ссылки можно было снимать для экономии денег, до следующего обхода роботом сайтов. Этот метод работал, теперь же для того, чтобы робот учел ссылку — она должна находиться на сайте некоторое время месяц-два-три, если ссылка появилась на сайте и исчезла, то робот ее не учтет.

Качество поиска в Google несомненно выше чем у Яндекса. Раньше тИЦ задумывался как некий инструмент определения рейтинга и ранжирования, теперь тИЦ превратил Яндекс из поисковой системы в некий промежуточный инструмент монетизации сайтов. Тематическому ИЦ уделяется чересчур много внимания самой поисковой системой, в отличие от Яндекса Google уже давно не ставит PR во главу условий определения рейтинга, Google следит за посетителями сайта, за их поведением на сайте, за временем нахождения на странице — и из этих параметров плюс PR  складывается общий рейтинг сайта и место его в поисковой выдаче.  Как же Google может так ловко следить за посетителями на сайте и за их поведением? С помощью своих дополнительных служб. В первую очередь это Google Analytics. По большому счету Google Analytics это java-скрипт, установленный на сайте в скрытом режиме (т.е. не имеет счетчика или баннера), который просто передает информацию в Google и веб-мастер получает наиболее полную статистику, которая только возможна. Теперь, предположим, что в  Google используется единая схема идентификации пользователей. То есть Ваш переход с поисковика на сайт с установленным Google Analytics будет однозначно Вас идентифицировать. А если это так, что переходы между сайтами и все Ваше поведение автоматически заносятся в единую базу данных.  Задача Google состоит в том, чтобы собрать как можно больше информации о пользователе, а всякие там украшательства в виде картинок его просто не интересуют. А теперь смотрите как все интересно получается: Google жив не единым Analytics, информацию эта система может получить откуда угодно — AdSense, Feedburner и даже Chrome, который, как утверждают некоторые пользователи, все-таки немножко, но шпионит за пользователем. Допустим Google собрал информацию, она была проанализирована и применена к результатам выдачи. Вот Вам и секрет качественного поиска. Этот способ улучшает качество поиска, делая выдачу наиболее релевантной, и при этом разные ГС отсекаются: даже если титаническими стараниями веб-мастера ГС выйдет в топ выдачи, то по поведению на нем пользователей Google сразу поймет что к чему и отправит ГС туда, где ему самое место.

У Яндекса все плохо. Практически все. Возьмем, например, Я.К — Яндекс Каталог — быть в нем раньше было честью для любого сайта, теперь же в Я.К можно найти откровенные ГС. Хотя Я.К и мог стать неким аналогом DMOZ для рунета, но не стал.  Попасть в Каталог можно только платно, сейчас наличие сайта в Каталоге уже ни о чем не говорит и на основе этого нельзя определить ценность данного ресурса. Яндекс Директ — это вообще непонятно что, жесткие правила, невнятная политика, непонятные условия, когда нормальный сайт отметается, с пояснением «мы подумали и решили, что Ваш сайт не подходит». С Директа люди уходят — мастодонты в AdSense, новички в «Бегун» и «Зорьку».

Далее, возвращаюсь к анализу такого явления как тИЦ. С попомщью тИЦ Яндекс сам себе подписал смертный приговор, популярность Яндекса падает, люди уходят в Google, а Google не стоит на месте, Google развивается и предоставляет уже огромное количество сервисов, похожих на сервисы Яндекса, но только намного качественнее. Как я уже говорил, из-за тИЦ Яндекс из поисковой системы превратился в промежуточный инструмент монетизации, собственно, личный дурной пример ПС сказывается и на веб-мастерах. Отказаться от тИЦ навсегда, отключить его Яндекс не может. Если так будет, то Яндекс моментально станет никому не нужным — если сейчас он популярен из-за своего индекса цитирования, то когда останется только обморочный поиск — о Яндексе все забудут. Где-то в рунете один веб-мастер озвучил мысль о том, что неплохо было бы скрыть публичное отображение рейтинга тИЦ и использовать его как внутрисистемный инструмент подсчета рейтинга. В таком случае продажа ссылок для наращивания тИЦ стала бы бессмысленной — ведь непонятно тогда есть толк от продажи аль нет.

Для Яндекса это может оказаться даже более выгодным вариантом, потому что вебмастера перейдут на «традиционные» методы раскрутки: баннеры и контекстную рекламу, а последняя у Яндекса уже есть. С другой стороны баррикад — для вебмастеров исчезнет хаотичная халява в виде Sape, Xap и т.п.  ГС попросту перестанут быть нужны и со временем просто исчезнут. Тогда уже если кто-то и надумает создавать свой сайт, то для этого будут нужны знания и умения.

Вот я и подошел к заключению. Из всего вышесказанного ясно, что сейчас настали не самые безоблачные дни для Яндекса — изначальная неправильная политика этой ПС, привела ее к тому, что мы сейчас имеем. К слову сказать, нововведения Яндекса для защиты от поискового спама, от ссылочного и другого спама, в виде фильтров типа АГС-17, сделали только хуже, работают эти фильтры сбойно и зачастую неправильно — я уже повидал веб-мастеров которые жаловались на то, что их вполне приличные сайты, не продающие ссылки, попали в бан Яндекса без видимых причин. Такая участь и постигла один из моих сайтов, Платон как всегда красноречив, но не это важно. До того, как один из моих сайтов попал в бан Яндекса, его посещаемость была около 200-220 человек в сутки (сайт новый — около месяца). После того как Яндекс прикрыл мой сайт от индексации и не показывал ни одну страницу в выдаче, я начал следить. за посещаемостью и за тем откуда люди ко мне идут. Наблюдения в течении месяца показали, что трафик упал только на первые 4 дня после бана, дальше он увеличился практически вдвое — 360-420 хостов в сутки и основная масса людей с Google. Это, конечно, частный случай, но тоже подтверждает, что Яндекс будет подавлен и смят Google: или команда Яндекса должна что-то менять в своей работе и политике или Google затопчет кованной басурманской подошвой отечественную ПС.

P.S.: Оговорюсь, что это только мои личные мысли и на истинность их я не претендую.

Вместо эпилога:

Чтоб мудро жить, знать надобно не мало,
Два важных правила запомни для начала:
Ты лучше голодай, чем что попало есть,
И лучше будь один, чем вместе с кем попало.

— Омар Хайям

Метки: , , , , ,
Писано 21.08.2010

Понравилась статья? Тогда получайте обновления на e-mail: