Speech-to-Text

Synthese

Speech-to-Text

whisper.cpp ist eine C/C++-Port von OpenAIs Whisper-Modell, optimiert für lokale Ausführung ohne Cloud-Abhängigkeit. Der Kern-Beitrag: Whisper läuft damit effizient auf Consumer-Hardware (CPU, Apple Silicon via Metal, CUDA), was Offline-Transkription mit guter Genauigkeit ermöglicht.

Das Projekt unterstützt quantisierte Modellvarianten (tiny bis large-v3), sodass zwischen Geschwindigkeit und Genauigkeit abgewogen werden kann. Für die meisten Anwendungsfälle reicht medium oder large-v2 aus; tiny eignet sich für Echtzeit-Szenarien mit begrenzten Ressourcen.

Praktisch relevant: whisper.cpp liefert Zeitstempel auf Wort- oder Segmentebene, was es für Untertitel-Generierung oder durchsuchbare Transkripte nutzbar macht.

Unter-Konzepte

Eintraege