Перейти до основного вмісту

Kununu Scraper

Kununu scraper збирає відгуки співробітників з kununu.com, провідної платформи відгуків про роботодавців у регіоні DACH.

Огляд

AttributeValue
Sourcekununu.com
RegionНімеччина, Австрія, Швейцарія
TechnologySelenium + BeautifulSoup
Rate~100 відгуків/хвилина

Зібрані дані

FieldDescription
titleЗаголовок відгуку
textПовний зміст відгуку
ratingРейтинг 1-5 зірок
dateДата подачі відгуку
positionПосада (якщо розкрито)
locationМісцезнаходження офісу
prosПозитивні моменти
consНегативні моменти

Виявлення Slug

Перед скрапінгом ми знаходимо URL Kununu компанії:

  1. Database cache – Перевірити існуючі slugs
  2. Direct URL – Спробувати простий slug (наприклад, klingelnberg)
  3. Kununu search – Розбір результатів пошуку
  4. URL variants – Спробувати суфікси (-ag, -gmbh, -suisse)

Конфігурація

KUNUNU_CONFIG = {
"delay_min": 1.0, # Min seconds between requests
"delay_max": 3.0, # Max seconds between requests
"max_pages": 50, # Max pages to scrape
"reviews_per_page": 4 # Reviews shown per page
}

Заходи проти ботів

  • Затримка 1-3 секунди між запитами
  • User-agent rotation на сесію
  • Session refresh кожні 50 сторінок
  • Respectful scraping – максимум 200 відгуків за один запуск

Фільтрація за датою

Скрапінг лише нещодавніх відгуків:

# Only reviews from last 12 months
job = create_job(company_slug="bmw", months_back=12)

Обробка помилок

ErrorAction
403 ForbiddenЗачекати 60 с, нова сесія
429 Rate LimitedЗачекати 120 с, повторити
CAPTCHAСкинути завдання, ручний перегляд

Kununu є основним джерелом даних для відгуків роботодавців у регіоні DACH.