Whisper
Synthese
Whisper
Whisper ist OpenAIs Speech-to-Text-Modell; whisper.cpp ist eine portable C/C++-Reimplementierung, die ohne Python-Stack oder GPU auskommt. Das Projekt von ggerganov läuft auf CPU (inkl. Apple Silicon via Metal/CoreML-Beschleunigung) und unterstützt alle Modellgrößen von tiny bis large.
Der Kern-Beitrag von whisper.cpp ist maximale Portabilität bei minimalen Abhängigkeiten: eine einzelne Header-Datei (ggml-Backend), bindings für viele Sprachen, und fertige Beispiele für Echtzeit-Transkription, Voice-Activity-Detection und sogar On-Device-Einsatz auf Raspberry Pi oder Smartphones.