Блог
Статьи для тех, кто ищет продуктовые детали без маркетинговой «воды».
- Настройки расписания: ежедневный автозапуск и фоновый сбор
Раздел «Настройки расписания»: включение ежедневного автозапуска и параметры фонового сбора — по README.
- DOCX и скрипт app.py: полезные параметры командной строки
README: для app.py обязателен запрос; примеры --max-age-hours, --max-items, --min-text-length, --output для отчёта в DOCX.
- Экспорты файлов: история JSON и DOCX, скачивание и предпросмотр
Раздел «Экспорты файлов»: история созданных файлов, ссылки на скачивание и предпросмотр JSON — по README.
- JSON-экспорт: три режима на странице управления сбором
Управление сбором новостей: JSON в режимах последнего успешного запуска, конкретной даты и диапазона дат — по README.
- Новости в админке: просмотр, поиск и фильтры собранных материалов
Раздел «Новости» для просмотра и фильтров по собранным новостям — как в списке возможностей README.
- Логи сбора: какие этапы показывает NewsPulse
Подробный ход сбора с этапами фильтрации и ошибками доступен в «Логи сбора» и в карточке запуска — по README.
- Запуски сбора: история, статус и ручной запуск из админки
Раздел «Запуски сбора» хранит историю запусков и позволяет запустить сбор из панели — как указано в README.
- Ключевые слова и пустой основной запрос в расписании
Как в NewsPulse устроен запрос: ключевые слова добавляются вручную; основной запрос в настройках расписания может быть пустым — тогда работают только включённые ключевые слова.
- Яндекс RSS вернул страницу входа вместо XML: что делает NewsPulse
Поведение из README: если вместо ленты приходит челлендж, источник пропускается — как диагностировать и что проверить (сеть, прокси).
- Федеральные ленты РИА, ТАСС и другие: как отключить источник без удаления
В README: дополнительные федеральные ленты доступны после миграции; в админке источники можно отключить или удалить — без выдуманных «режимов».
- Как добавить источник Google News RSS в админке NewsPulse
Добавление тематической ленты Google News как типа источника: запрос к агрегатору и учёт цепочки прокси, описанной в README.
- Google News RSS: в каком порядке пробуются прямой доступ и прокси
Как устроена цепочка запросов для ленты Google News RSS в NewsPulse: сначала прямой доступ, затем прокси источника, общий NEWSPULSE_RSS_PROXY и запасные адреса.
- NEWSPULSE_RSS_GOOGLE_TRY_DIRECT_FIRST и запасные прокси для Google News
Две переменные окружения для тонкой настройки Google News RSS: отключить прямой доступ и задать список запасных прокси через запятую.
- Очередь публикаций: ВКонтакте, Telegram и Одноклассники
Постановка постов в очередь, шаблоны и логи результатов — как устроена интеграция с соцсетями в NewsPulse.
- Переменная NEWSPULSE_RSS_PROXY: общий прокси для источников без своего адреса
Когда заполнять NEWSPULSE_RSS_PROXY на сервере: единый выход для всех RSS без отдельного прокси у каждой записи источника.
- Прокси для RSS и страницы статьи: зачем поле у каждого источника
Зачем в NewsPulse у источника новостей своё поле прокси: корпоративные сети, разные правила для разных лент и загрузка HTML без общего «глобального» прокси.
- Схема socks5:// для прокси: зачем нужен пакет PySocks
Кратко о поддержке SOCKS5 в NewsPulse: при использовании socks5:// для RSS или страницы статьи установите PySocks (pip), как указано в README.
- РИА и ТАСС: фильтр по запросу в заголовке и описании RSS
Как в NewsPulse отбираются материалы для дополнительных источников вроде РИА и ТАСС: фильтр по вхождению запроса в заголовок или описание элемента ленты.
- Сбор новостей из RSS: фильтры, Google News и Яндекс.Новости
Как NewsPulse подтягивает ленты RSS и отсекает лишнее по свежести и длине текста — без выдуманных «ИИ-функций», только то, что есть в продукте.
- Произвольная RSS-лента по URL: как добавить свой источник
Общий принцип NewsPulse: помимо преднастроенных типов можно подключать свою RSS по адресу — с прокси на уровне источника и общим NEWSPULSE_RSS_PROXY.
- Установка NewsPulse на свой сервер: архив, Linux, MySQL или SQLite
Кратко о том, что внутри архива NewsPulse-web-archive.zip и как запускается установка через скрипт — без обещаний облачного SaaS.
- Яндекс.Новости как RSS-источник: что учитывает NewsPulse
Подключение ленты Яндекс.Новости в списке источников: типичный сценарий и предупреждение про страницу авторизации вместо XML в некоторых сетях.