Яндекс RSS вернул страницу входа вместо XML: что делает NewsPulse
Документация NewsPulse прямо говорит: для Яндекс RSS в некоторых сетях вместо XML может прийти страница авторизации или челлендж. В этом случае источник автоматически пропускается.
Это не «баг», а защита: парсить HTML-страницу входа как RSS бессмысленно и вредно для стабильности сбора.
Что проверить
- Прокси в карточке источника или
NEWSPULSE_RSS_PROXYна сервере. - Исходящие правила фаервола и DNS.
- «Логи сбора» — формулировки этапов подскажут, что ответ не похож на ленту.
Чего не обещаем
Обход капчи или автоматический логин на сторону Яндекса в продукт не входит — только честная работа с доступной лентой.