Zum Hauptinhalt springen

Reddit Scraper

Sammelt Unternehmensdiskussionen von Reddit, um soziale Stimmungsdaten bereitzustellen.

Übersicht

AttributWert
QuelleReddit API (PRAW)
AuthOAuth2
Rate Limit60 requests/Minute
Cache6 Stunden

Gesammelte Daten

FeldBeschreibung
titleBeitragstitel
textBeitragsinhalt + Top-Kommentare
scoreUpvotes
subredditQuell-Subreddit
dateErstellungsdatum des Beitrags

Ziel-Subreddits

SubredditInhalt
r/jobsJobsuche, Bewertungen
r/careerguidanceKarriereberatung
r/cscareerquestionsTech-Unternehmen
r/antiworkProbleme am Arbeitsplatz
r/germanyDACH-spezifisch

Suchstrategie

# Suche über mehrere Subreddits hinweg
posts = search_company_posts("BMW", limit=100)

Relevanzfilterung

  • Mindestens 5 Upvotes
  • Muss den Firmennamen erwähnen
  • Stellenangebote ausschließen
  • Werbepostings ausschließen

Stimmungsableitung

Keine Sternebewertungen, daher leiten wir die Stimmung ab aus:

  • Beitragswertung (Upvotes)
  • Kommentar-Ton
  • Schlüsselwort-Erkennung
  • Subreddit-Kontext

Datenschutz

  • Es werden nur öffentliche Beiträge gesammelt
  • Autorennamen werden nicht gespeichert
  • Einhaltung der Reddit API-Bedingungen

Reddit bietet ungefilterte Mitarbeiterperspektiven.