Themenanalyse (ABSA)
ABSA (Aspect-Based Sentiment Analysis) extrahiert spezifische Themen aus Mitarbeiterbewertungen und deren zugehörige Stimmung (Sentiment).
🎯 Was ist ABSA?
ABSA geht über eine einfache Positiv-/Negativ-Klassifizierung hinaus. Es identifiziert, welche Aspekte Mitarbeiter diskutieren und wie sie über jeden einzelnen denken.
Beispiel:
"Great salary but terrible management"
| Aspect | Sentiment |
|---|---|
| Salary and Benefits | POSITIVE |
| Management | NEGATIVE |
📊 Vordefinierte Aspekte
Das System erkennt 10 zentrale Themen am Arbeitsplatz:
| # | Aspect | Keywords |
|---|---|---|
| 1 | Salary and Benefits | pay, bonus, insurance, pension |
| 2 | Work-Life Balance | hours, overtime, remote, flexibility |
| 3 | Management | boss, leadership, supervision |
| 4 | Company Culture | atmosphere, values, team spirit |
| 5 | Career Growth | promotion, opportunities, development |
| 6 | Job Security | stability, layoffs, restructuring |
| 7 | Work Environment | office, facilities, equipment |
| 8 | Colleagues | coworkers, team dynamics |
| 9 | Training | learning, courses, skills |
| 10 | Communication | transparency, feedback, information |
🔧 Extraktionsmethoden
1. Regelbasiert (Standard)
- Schneller Keyword-Abgleich
- ~65% Genauigkeit
- Keine API-Kosten
- Läuft automatisch
2. KI-gesteuert (Gemini)
- Kontextsensitive Extraktion
- ~85% Genauigkeit
- ~$0.001 pro Bewertung
- Wird für Unternehmen mit hoher Priorität verwendet
📈 Dashboard: Themen-Tab
Die Themen-Seite im Dashboard zeigt:
Top 10 Diskutierte Themen
Balkendiagramm der am häufigsten genannten Aspekte mit Sentiment-Aufschlüsselung.
Themen-Einblicke
- Positivstes Thema - Höchstes positives Sentiment
- Negativstes Thema - Höchstes negatives Sentiment
- Am häufigsten diskutiert - Höchste Erwähnungszahl
Detaillierte Aufschlüsselung
Klicken Sie auf ein beliebiges Thema, um zu sehen:
- Beispiel-Bewertungsauszüge
- Sentiment-Verteilung
- Trend im Zeitverlauf
🔌 API-Zugriff
curl "https://sentryanalytic.com/api/aspects?company=BMW"
Antwort:
{
"company": "BMW",
"aspects": [
{ "aspect": "salary and benefits", "sentiment": "positive", "count": 421 },
{ "aspect": "management", "sentiment": "negative", "count": 318 },
{ "aspect": "work-life balance", "sentiment": "positive", "count": 256 }
]
}
🔄 Automatisierung
ABSA läuft nach dem Scraping automatisch ab:
Scraping Complete → Sentiment Analysis → ABSA → Materialized Views Refresh
Keine manuelle Intervention erforderlich!
🛠️ Manueller Start
Für Ad-hoc-Analysen:
cd backend
source venv/bin/activate
# Analyze specific company
python absa_analyzer.py --company "BMW" --limit 200
# Use AI mode (more accurate)
python absa_analyzer.py --company "BMW"
# Rule-based only (faster)
python absa_analyzer.py --company "BMW" --no-ai
📊 Datenbankschema
CREATE TABLE review_aspects (
id SERIAL PRIMARY KEY,
review_id VARCHAR REFERENCES reviews(review_id),
aspect VARCHAR(100),
sentiment VARCHAR(20),
confidence FLOAT,
snippet TEXT
);
🎨 Anwendungsfälle
Für Jobsuchende
- "What do employees say about work-life balance at BMW?"
- Schnelles Erkennen von Stärken und Schwächen eines Unternehmens
Für HR-Teams
- "Which topics have the most negative feedback?"
- Priorisierung von Verbesserungsbereichen
Für Investoren
- "Is there a pattern of management issues?"
- Risikobewertung für die Due Diligence
ABSA wird von Gemini 2.5 Flash für die KI-gesteuerte Extraktion betrieben.