← Блог

· Яндекс, RSS, ошибки

Яндекс RSS вернул страницу входа вместо XML: что делает NewsPulse

Документация NewsPulse прямо говорит: для Яндекс RSS в некоторых сетях вместо XML может прийти страница авторизации или челлендж. В этом случае источник автоматически пропускается.

Это не «баг», а защита: парсить HTML-страницу входа как RSS бессмысленно и вредно для стабильности сбора.

Что проверить

  1. Прокси в карточке источника или NEWSPULSE_RSS_PROXY на сервере.
  2. Исходящие правила фаервола и DNS.
  3. «Логи сбора» — формулировки этапов подскажут, что ответ не похож на ленту.

Чего не обещаем

Обход капчи или автоматический логин на сторону Яндекса в продукт не входит — только честная работа с доступной лентой.