Whisper

Open · OpenAI · Speech model

Widely-used open multilingual speech recognition and translation model.

Specifications

What it was trained for

An automatic speech recognition model trained on a large multilingual, multitask audio dataset to transcribe and translate spoken audio.

Audio inputMultilingual transcriptionSpeech translationOpen weightsSelf-hostable

Robust across accents, background noise, and many languages; a widely adopted baseline for open speech recognition.