SEO для ИИ
ИИНовости

Проверка реальности llms.txt: что на самом деле показывают 300 000 доменов об AI-цитировании и видимости в поиске

Искусственный интеллект стремительно меняет правила игры в поиске и способах обнаружения контента. SEO-специалисты и маркетологи пытаются понять, как адаптироваться к новой реальности, где LLM-модели используют веб-контент для генерации ответов и рекомендаций. Одной из новых тактик стала оптимизация через файл llms.txt — предполагаемый аналог robots.txt, но для больших языковых моделей.

Однако масштабное исследование SE Ranking, в котором были проанализированы 300 тысяч доменов, ставит под сомнение реальную эффективность llms.txt. Данные показывают: ожидания от файла сильно переоценены, а его влияние на AI-цитирования практически не наблюдается.


Что такое llms.txt и зачем его придумали

Файл llms.txt задумывался как способ структурированно сообщать LLM-системам, какие части сайта наиболее важны, где искать релевантный контент, какие URL лучше использовать для цитирования. По задумке, это должно было:

  • улучшить понимание структуры сайта AI-моделями;
  • повысить вероятность того, что сайт попадёт в AI-обзоры, ответы ChatGPT, цитирования Perplexity и т.д.;
  • стать новым стандартом оптимизации под AI-поиск.

Идея быстро стала популярной среди SEO-специалистов — но данные показывают совсем иную картину.


Как проходило исследование: 300 000 доменов и машинное обучение

SE Ranking проанализировали огромный массив доменов:

  • проверили, есть ли у сайта файл llms.txt;
  • оценили наличие цитирований от LLM;
  • применили корреляции, статистику и модель XGBoost для нахождения значимых факторов.

Такой подход позволяет получить не впечатления или догадки — а реальную статистически значимую картину.


Главный факт №1: llms.txt используют только 10% сайтов

Несмотря на хайп в SEO-сообществе, внедрение файла крайне низкое:

📌 лишь 10,13% доменов имеют llms.txt

То есть 9 из 10 сайтов не считают нужным его использовать.

Причём важно:

  • крупные бренды тоже почти не внедряют файл;
  • сайты с высоким трафиком используют его даже реже среднего;
  • внедрение не зависит от авторитета домена.

Если бы llms.txt реально работал и давал конкурентное преимущество, крупные сайты внедряли бы его первыми. Но этого не происходит — что уже заставляет задуматься.


Главный факт №2: llms.txt никак не влияет на частоту AI-цитирований

Это ключевой вывод исследования.

Используя:

  • простую корреляцию,
  • статистические модели,
  • и ML-алгоритм XGBoost,

исследователи пришли к одному и тому же результату:

никакой значимой связи между наличием llms.txt и AI-цитированиями нет.

Более того:

➡️ когда переменную llms.txt убрали из ML-модели, точность прогнозов выросла
Это означает, что файл не просто бесполезен — он создаёт шум.

Иными словами: LLM-системы сейчас просто игнорируют llms.txt.


А что говорят сами платформы — Google, OpenAI и другие?

Google

Google прямо указывает, что AI Overviews — это часть поисковой системы, и источники для них выбираются теми же алгоритмами, что и обычные результаты.

В документации нет никакого упоминания llms.txt, и Google не намекает, что он влияет на что-то.

OpenAI

OpenAI акцентирует внимание на robots.txt как основном механизме контроля доступа.
GPTBot действительно может скачивать llms.txt, но:

✔️ получать файл ≠ ✔️ использовать его содержимое.

И это полностью согласуется с результатами исследования: файл не влияет на цитирование ChatGPT.


Что это значит для SEO и маркетинга

Внедрять ли llms.txt?

Можно, если:

  • он не требует больших затрат,
  • вам хочется «быть готовыми к будущему».

Но ожидать реального повышения видимости в AI — не стоит.

Куда лучше направить ресурсы

Данные подтверждают:

🔹 качественный, глубокий экспертный контент
🔹 структурированная архитектура страницы
🔹 тематическая специализация
🔹 сильный профиль ссылок
🔹 регулярные обновления материалов

— вот что действительно влияет на AI-цитирования.

Большие языковые модели по-прежнему ориентируются на сигналы качества, похожие на традиционные поисковые алгоритмы.

Для внутренних коммуникаций

Теперь руководителям проще объяснить, почему слепое следование тренду — плохая идея. У вас в руках есть реальное исследование, а не догадки.


Что действительно важно для попадания в AI-цитирования

📌 Экспертиза и глубина контента
LLM предпочитают цитировать авторитетные ресурсы.

📌 Тематика и специализация
Узкая, сильная экспертиза работает лучше, чем поверхностный охват.

📌 Структура и чистая разметка
LLM проще извлекать и использовать корректные ответы.

📌 Доверие к домену
Авторитет сайта и качество ссылок — важнейшие факторы.

📌 Актуальность
Обновляемые материалы ранжируются выше.

И ни один из этих факторов не связан с llms.txt.


Широкий вывод исследования: SEO для AI становится взрослым

Первый год AI-поиска был наполнен догадками, теориями, экспериментами и хайпом.
Теперь аналитика показывает:

  • не всё, что звучит логично, работает на практике;
  • многие новинки — просто красивые идеи без доказательств;
  • будущее SEO в AI-эпоху должно опираться на данные, а не на догадки.

llms.txt — хороший пример такой ситуации.


Итог: опирайтесь на данные, а не на тренды

Исследование SE Ranking даёт важный вывод:

На сегодняшний день llms.txt не влияет на цитирования в AI-ответах.
Компании должны инвестировать в проверенные методы SEO, а не в модные, но недоказанные тактики.

Файл можно внедрить как «опцию на будущее», но ожидать от него пользы сейчас не стоит.

Лучшие инвестиции — это:

  • экспертный контент,
  • техническая чистота сайта,
  • тематический авторитет,
  • проекты по улучшению UX,
  • и фундаментальные SEO-практики.