Over dit project

Basketball Brain is een production-grade Retrieval-Augmented Generation systeem over de Nederlandse basketbalwereld — NBB-regels, FIBA-rules, talentontwikkeling-onderzoek en coachfilosofie. Volledig gegrond in primaire bronnen (geen LLM-gegenereerde inhoud in de kennisbank).

Gebouwd als ADA RAG-eindopdracht én als fundament voor een toekomstige ClubDuty-feature. Geen Microsoft-stack — open-source van embedding tot deploy, zelf-gehost op Hetzner.

Evaluatie (RAGAS-stijl)

Recall@5
0.XX
Precision (source)
0.XX
Groundedness
0.XX

Gemeten over een handgecureerde 20-vragen-testset (6 lookup, 5 coachfilosofie, 5 multi-doc, 4 out-of-scope). Cijfers worden ingevuld na de finale tuning-iteratie.

Stack

  • Backend: FastAPI + LangChain + ChromaDB + rank_bm25
  • Embeddings: bge-m3 (BAAI, MIT) — meertalig, 1024-dim, zelf-gehost
  • Retrieval: Hybrid search — BM25 + vector + Reciprocal Rank Fusion
  • Indexing-trick: Contextual Retrieval (Anthropic, sept 2024) — chunk-prefix via Claude Haiku met prompt caching
  • LLM: Claude Sonnet 4.6 via OpenRouter (model-flexibel, geen vendor-lock-in)
  • Frontend: Next.js 16 + Tailwind 4 + shadcn/ui
  • Hosting: Hetzner zelf-gehost via Docker-compose + Caddy (auto-HTTPS)
  • Eval: Hand-curated test set + RAGAS-stijl metrics

Bronnen (MVP-corpus)

  • NBB Spelregels 2025-2026 — nbb.basketball.nl
  • NBB Talentontwikkeling Richtlijnen
  • FIBA Official Basketball Rules 2024 — fiba.basketball
  • “Te jong, te snel” — Nederlands onderzoek doorschuiven jeugdspelers
  • John Wooden — Pyramid of Success (Wikipedia, fair use)
  • NL/EN Wikipedia: basketbal-artikelen, shot clock

Alle bronnen primair en publiek. LLMs werden gebruikt om bronnen te triangleren, niet om inhoud te genereren.

Open