Data Platform Architecture

Als Data-Driven Community unterscheiden wir uns durch Fakten von "Bauchgefühl"-Clans. Wir bauen eine schlanke, aber skalierbare Datenplattform auf.

Strategie: "Community Intelligence"

Wir nutzen das Medallion Architecture Pattern (Bronze -> Silver -> Gold), angepasst an unsere Scale.

1. Stack Overview

Komponente Technologie Warum?
Ingestion Python (Discord.py, RCON) Flexibel, direkte API-Anbindung.
Orchestration Dagster (oder Airflow) Da du Data Engineer bist: Sauberer State, Backfills möglich.
Storage PostgreSQL + TimescaleDB Relational für User-Daten, Time-Series für Voice/Server-Stats.
Visualization Grafana (Ops) / Metabase (Biz) Grafana für Server-Health, Metabase für Community-KPIs.
Hosting Docker Compose (auf Root-Server) Einfaches Deployment, alles in Containern.

2. Data Flow (Medallion)

🥉 Bronze (Raw Ingestion)

Ziel: Rohdaten unverändert speichern.

🥈 Silver (Refined & Cleaned)

Ziel: Deduplizierung, Typisierung, Anreicherung.

🥇 Gold (Aggregated Business Logic)

Ziel: Report-Ready KPIs.

Implementation Details: KPI Tracking

Wie wir die Metriken technisch erfassen.

1. Discord Tracking (Bot Logic)

Wir schreiben einen eigenen Bot (Python/discord.py), da Public Bots oft Datenhoheit-Probleme haben.

A. Voice Session Tracking

B. Chat Activity / DAU

C. Retention Tracking (SQL)

2. Game Server Tracking

A. Source / CS2 (RCON)

B. Minecraft / Andere

Implementation Roadmap

Weiterführend: KPI Definitions

Home