Принципы работы поисковых систем

На вебинаре Netpeak разобрал, как работают поисковые системы.

Как работает современный поиск

Слайды 3-7:

  • миллионы результатов за доли секунд;
  • различные типы ответов на запрос;
  • поиск по вертикалям;
  • расширенный поиск.

Основные процессы при работе поисковых систем

Слайды 8-12:

  • сканирование (crawling);
  • индексирование (indexing) и поиск по индексу;
  • ранжирование (ranking).

Индексация. Структура и организация индексов

Слайды 13-17:

  • матрица инцидентности;
  • инвертированный индекс.

Ранжирование

Слайды 18-22:

  • векторная модель документов и запросов;
  • вычисление ранга документа;
  • базовый алгоритм ранжирования в векторной модели;
  • вычисление общего ранга.

Что такое поисковые роботы и как они работают

Слайды 23-26:

  • разделение обязанностей;
  • требования к роботам;
  • базовая схема работы поискового паука.

Категория: