Descore

Релевантность

BM25 по зонам документа

BM25 считается по body, Title, H1, Description, H2/H3, URL и корпусу запросов кластера.

BM

BM25 Text Score

BM25 релевантность основного текста. Page-Level BM25 оценивает соответствие body-контента запросу по лемматизированным терминам. Это не простое вхождение, а скор с нормализацией частоты и насыщением TF.

Body-текст дает самый широкий контекст: здесь BM25 показывает, насколько тема раскрыта в основном содержании, а не только заявлена в заголовках.

TBM

Title BM25

BM25 релевантность заголовка. Считает BM25 только внутри title. Показывает, насколько заголовок страницы релевантен запросу без учета большого body-текста.

Title — короткая и сильная зона. Одно точное попадание здесь заметнее, чем в body, но лишний шум сразу размывает смысл заголовка.

H1BM

H1 BM25

BM25 релевантность H1. Считает BM25 по H1. Это отдельный сигнал, потому что главный заголовок может быть релевантным, даже если остальной текст перегружен или размыт.

H1 показывает главный фокус страницы. Он может поддерживать title, уточнять интент или, наоборот, уводить страницу в слишком общий рекламный заголовок.

DBM

Description BM25

BM25 релевантность мета-описания. Считает BM25 по meta description. Помогает оценить, насколько сниппетная зона поддерживает запрос, а не живет отдельно от темы страницы.

Description — зона сниппета: она не раскрывает тему целиком, но показывает, насколько краткое описание страницы совпадает с запросом пользователя.

HBM

Headings BM25

BM25 релевантность заголовков H2+H3. Считает BM25 по объединенным H2 и H3. Показывает, насколько структура разделов раскрывает запрос, а не только основной текст.

H2 и H3 отвечают за карту разделов. Высокий скор здесь означает, что тема разложена по структуре, а не спрятана только внутри абзацев.

PABM

Position Aware BM25

Релевантность BM25 с учётом позиций слов в документе. Добавляет к BM25 позиционный вес: термины в начале документа получают больший вклад, середина нейтральна, конец слабее. Так учитывается принцип раннего раскрытия темы.

Эта метрика отделяет раннее раскрытие темы от позднего упоминания. Те же слова в начале документа получают больший вес, чем в конце.

CCBM

Cluster Corpus BM25

BM25 релевантность текста к корпусу запросов кластера. Сравнивает body-контент не с одним маркерным запросом, а с корпусом запросов кластера. Это сигнал релевантности странице всей теме, а не одной формулировке.

Corpus BM25 по тексту смотрит шире маркерного запроса: документ сравнивается с языком всего кластера и показывает покрытие темы целиком.

TCBM

Title Corpus BM25

BM25 релевантность заголовка к корпусу запросов кластера. Проверяет title на релевантность корпусу запросов кластера. Полезно, когда кластер шире одного ключа и важно покрыть несколько пользовательских формулировок.

Title Corpus BM25 показывает, не слишком ли узко title сформулирован относительно всего кластера. Это полезно, когда одна посадочная собирает несколько интентов.

H1CBM

H1 Corpus BM25

BM25 релевантность H1 к корпусу запросов кластера. Проверяет H1 относительно корпуса запросов кластера. Показывает, насколько главный заголовок совпадает с языком всей группы запросов.

H1 Corpus BM25 проверяет главный заголовок на ширину темы: сильный H1 по одному ключу может оказаться слабым для корпуса запросов.

DCBM

Description Corpus BM25

BM25 релевантность мета-описания к корпусу запросов кластера. Оценивает meta description относительно корпуса запросов кластера. Помогает увидеть, поддерживает ли описание весь интент, а не только главный ключ.

Description Corpus BM25 показывает, отражает ли сниппетная зона не только главный ключ, но и общий интент кластера.

HCBM

Headings Corpus BM25

BM25 релевантность заголовков H2+H3 к корпусу запросов кластера. Считает корпусный BM25 по H2 и H3. Показывает, вынесены ли важные темы кластера в структуру страницы.

Headings Corpus BM25 показывает, вынесены ли подтемы кластера в структуру H2/H3. Это слой про архитектуру текста, а не про повтор ключа.

UBM

URL BM25

BM25 релевантность URL к запросу. Разбирает URL на токены и считает релевантность адреса запросу. Метрика показывает, насколько путь страницы сам несет тему запроса.

На значение влияют совпадения слов запроса с токенами адреса: понятные разделители, транслитерация и тематический slug дают больше сигнала, чем случайные идентификаторы или параметры.