Reddit Scraper
Збирає обговорення компаній з Reddit для надання даних соціального настрою.
Огляд
| Атрибут | Значення |
|---|---|
| Джерело | Reddit API (PRAW) |
| Авторизація | OAuth2 |
| Обмеження частоти запитів | 60 запитів/хвилину |
| Кеш | 6 годин |
Зібрані дані
| Поле | Опис |
|---|---|
title | Заголовок допису |
text | Текст допису + топові коментарі |
score | Вподобання |
subreddit | Вихідний сабреддіт |
date | Дата створення допису |
Цільові сабреддіти
| Сабреддіт | Зміст |
|---|---|
| r/jobs | Пошук роботи, відгуки |
| r/careerguidance | Поради щодо кар'єри |
| r/cscareerquestions | Технічні компанії |
| r/antiwork | Проблеми на робочому місці |
| r/germany | Специфічне для DACH |
Стратегія пошуку
# Search across multiple subreddits
posts = search_company_posts("BMW", limit=100)
Фільтрація релевантності
- Мінімум 5 вподобань
- Повинно згадуватися назва компанії
- Виключити вакансії
- Виключити рекламні дописи
Виведення настрою
Немає зіркових рейтингів, тому ми виводимо настрій з:
- Оцінка допису (вподобання)
- Тон коментарів
- Виявлення ключових слів
- Контекст сабреддіта
Конфіденційність
- Збираються лише публічні дописи
- Імена авторів не зберігаються
- Відповідає умовам Reddit API
Reddit надає невідфільтровані погляди співробітників.