Over dit project
Basketball Brain is een production-grade Retrieval-Augmented Generation systeem over de Nederlandse basketbalwereld — NBB-regels, FIBA-rules, talentontwikkeling-onderzoek en coachfilosofie. Volledig gegrond in primaire bronnen (geen LLM-gegenereerde inhoud in de kennisbank).
Gebouwd als ADA RAG-eindopdracht én als fundament voor een toekomstige ClubDuty-feature. Geen Microsoft-stack — open-source van embedding tot deploy, zelf-gehost op Hetzner.
Evaluatie (RAGAS-stijl)
Gemeten over een handgecureerde 20-vragen-testset (6 lookup, 5 coachfilosofie, 5 multi-doc, 4 out-of-scope). Cijfers worden ingevuld na de finale tuning-iteratie.
Stack
- Backend: FastAPI + LangChain + ChromaDB + rank_bm25
- Embeddings: bge-m3 (BAAI, MIT) — meertalig, 1024-dim, zelf-gehost
- Retrieval: Hybrid search — BM25 + vector + Reciprocal Rank Fusion
- Indexing-trick: Contextual Retrieval (Anthropic, sept 2024) — chunk-prefix via Claude Haiku met prompt caching
- LLM: Claude Sonnet 4.6 via OpenRouter (model-flexibel, geen vendor-lock-in)
- Frontend: Next.js 16 + Tailwind 4 + shadcn/ui
- Hosting: Hetzner zelf-gehost via Docker-compose + Caddy (auto-HTTPS)
- Eval: Hand-curated test set + RAGAS-stijl metrics
Bronnen (MVP-corpus)
- NBB Spelregels 2025-2026 — nbb.basketball.nl
- NBB Talentontwikkeling Richtlijnen
- FIBA Official Basketball Rules 2024 — fiba.basketball
- “Te jong, te snel” — Nederlands onderzoek doorschuiven jeugdspelers
- John Wooden — Pyramid of Success (Wikipedia, fair use)
- NL/EN Wikipedia: basketbal-artikelen, shot clock
Alle bronnen primair en publiek. LLMs werden gebruikt om bronnen te triangleren, niet om inhoud te genereren.
Open
- GitHub: github.com/vincentblokker/basketball-brain
- Licentie: MIT
- Auteur: Vincent Blokker