Descore

Естественность

Водность и закон Ципфа

Эти метрики показывают долю служебной лексики и естественность частотного распределения слов.

WF

Water Full

Процент 'водных' слов. (предлоги, союзы, местоимения). Считает долю стоп-слов по полному словарю: предлоги, союзы, частицы, вводные и модальные слова. Высокое значение показывает размытость текста и слабую концентрацию смысла.

Водность растет вместе с долей стоп-слов: предлогов, союзов, местоимений, вводных и модальных слов. Значимые термины без служебной прослойки снижают процент.

ZC

Zipf Compliance

Соответствие закону Ципфа. (естественность текста). Берет частотный список значимых слов и проверяет, насколько он похож на естественную кривую f(r)=C/r. Низкое значение часто появляется при искусственном переспаме или бедном словаре.

Соответствие Ципфу повышается, когда частоты слов убывают естественной кривой: один лидер, затем плавное снижение. Резкие всплески отдельных слов ломают профиль.