На прошлой неделе пользователи форума Hacker News сообщили, что обнаружили в сети исходные коды сервисов Яндекса почти на 45 GB. В компании подтвердили публикацию исходных кодов части проектов из внутреннего репозитория, указав, что их содержимое отличается от текущей версии репозитория, которая используется в сервисах Яндекса. Персональные данные пользователей при этом не пострадали.
Заинтересовавшиеся архивом специалисты обнаружили в нем много папок типа: antirobot, captcha, extsearch, kernel, metrika, robot, search, wmconsole, что указывает на то, что был слит полный репозиторий Search Engine and Indexing Bot.
В папке kernel.tarweb_factors_info лежит файл с 1922 факторами ранжирования Яндекса, включая неиспользуемые (unused) и отмененные (deprecated). В целом, получается 690 потенциально рабочих факторов ранжирования, которые учитываются Яндексом.
Среди них отмечены следующие, которые в общем-то ни для кого не являются секретом:
- PageRank
- Возраст и число входящих ссылок
- Порядок слов в ссылках
- Линковая релевантность с учетом тематичности
- Линковая релевантность с учетом некоммерческости каждой ссылки
- Вес слов запроса, которые есть в линках
- Отношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок
- Наличие https-протокола
- Наличие турбо-страницы
- Доля заглавных букв в Title
- Доля прямых заходов среди всего входящего трафика
- Количество переходов с Википедии
- Региональная посещаемость из ПС по конкретному запросу
- Возвращаемость пользователя на url
- BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)
- Вес слов запроса, которые есть в тексте в точной форме
- Возраст документа и дата последнего обновления
- Наличие на странице встроенных карт
- И т.д.
Есть и забавные факторы, например, «фактор гадкости контента», «нейронная документная модель для поиска неожиданной жести» и даже «значение детектора свежести, рассчитываемого в бегемоте».
Некоторые пользователи форума Searchengines.guru считают, что это не описание факторов ранжирования, а скорее задания или указания для разработчиков или тестировщиков. Тем более, что большинство факторов содержат ссылки на внутреннюю вики, к которой нет доступа.
В любом случае все согласны, что архив очень любопытный. Помимо факторов ранжирования, там можно посмотреть как технически настроено цензурирование контента в новостях и поиске, какой код отвечает за увеличение цены на Маркете, если заходишь с устройства Apple, и еще много интересного.
Примечательно, что зарубежные специалисты тоже активно обсуждают эту новость, и даже на одном из сайтов уже появился полнотекстовый поиск по факторам ранжирования Яндекса. Как сообщил в своем Telegram-канале Александр Алаев (АлаичЪ), этот поиск очень удобно использовать для изучения факторов – например, можно ввести «title» и увидеть все факторы, где в заголовке или описании упоминается это слово, тоже со словами «link», «content» т.д. Также работает и группировка по тегам. Описания некоторых факторов приводятся в оригинале, на русском языке.
SEO-продвижение медицинских сайтов — это процесс оптимизации веб-ресурсов медицинских учреждений с целью повышения их видимости в поисковых системах (таких как Google, Яндекс и другие) и привлечения целевой аудитории. Основная цель SEO — улучшить позиции сайта в результатах поиска по релевантным запросам, чтобы больше пациентов находили и выбирали именно вашу клинику или медицинские услуги.
Преимущества SEO-продвижения для медицинских сайтов:
- Увеличение трафика: Повышение количества посетителей сайта, что может привести к большему количеству записей на приём.
- Увеличение конверсии: Лучшее ранжирование и качественный контент способствуют тому, что большее количество посетителей становится клиентами клиники.
- Долгосрочные результаты: SEO позволяет получить стабильный поток пациентов с органического поиска без постоянных затрат на рекламу.
- Укрепление репутации: Высокие позиции в поисковой выдаче могут повысить доверие к клинике и её специалистам.