Перейти до основного вмісту

Reddit Scraper

Збирає обговорення компаній з Reddit для надання даних соціального настрою.

Огляд

АтрибутЗначення
ДжерелоReddit API (PRAW)
АвторизаціяOAuth2
Обмеження частоти запитів60 запитів/хвилину
Кеш6 годин

Зібрані дані

ПолеОпис
titleЗаголовок допису
textТекст допису + топові коментарі
scoreВподобання
subredditВихідний сабреддіт
dateДата створення допису

Цільові сабреддіти

СабреддітЗміст
r/jobsПошук роботи, відгуки
r/careerguidanceПоради щодо кар'єри
r/cscareerquestionsТехнічні компанії
r/antiworkПроблеми на робочому місці
r/germanyСпецифічне для DACH

Стратегія пошуку

# Search across multiple subreddits
posts = search_company_posts("BMW", limit=100)

Фільтрація релевантності

  • Мінімум 5 вподобань
  • Повинно згадуватися назва компанії
  • Виключити вакансії
  • Виключити рекламні дописи

Виведення настрою

Немає зіркових рейтингів, тому ми виводимо настрій з:

  • Оцінка допису (вподобання)
  • Тон коментарів
  • Виявлення ключових слів
  • Контекст сабреддіта

Конфіденційність

  • Збираються лише публічні дописи
  • Імена авторів не зберігаються
  • Відповідає умовам Reddit API

Reddit надає невідфільтровані погляди співробітників.