Buzz

Startseite ┬Ě IAs ┬Ě Audio ┬Ě Buzz

Wozu dient diese KI?


Buzz ist ein Tool, mit dem Sie Audiodaten offline auf Ihrem Computer transkribieren und ├╝bersetzen k├Ânnen. Es wird von OpenAIs Whisper angetrieben.

F├Ąhigkeiten

Diese KI ist in der Lage, Erstellen von Audiotranskripten, Sprache in Text umwandeln,

Buzz-Merkmale

  • Transkription und ├ťbersetzung in Echtzeit vom Mikrofon Ihres Computers in Text. Transkribieren Sie, w├Ąhrend Sie sprechen.
  • Importieren Sie Audio- und Videodateien und exportieren Sie Transkripte in TXT, SRT und VTT. Sie k├Ânnen mp3, mp4 und weitere Audio- und Videoformate hinzuf├╝gen.
  • Kompatibel mit Whisper, Whisper.cpp und Hugging Face Modellen, die mit Whisper kompatibel sind.
    Wie man Buzz installiert

Wie man Buzz installiert

Buzz ist f├╝r Mac und Windows verf├╝gbar. Auf der Download-Seite (oben verlinkt) k├Ânnen Sie die .DMG-Datei f├╝r Mac oder die .EXE-Datei f├╝r Windows herunterladen. Nach dem Herunterladen ist es so einfach wie der ├╝bliche Software-Installationsprozess, und das war’s, kein ├ärger.

Auf der linken Seite sehen wir den Arbeitsvorrat. Audio- und Videodateien k├Ânnen hinzugef├╝gt werden, um mit der Transkription des Textes zu beginnen. Auf der rechten Seite sehen Sie das Ergebnis der Transkription in verschiedenen Formaten: „TXT“, „SRT“, „VTT“.

Das Programm verstehen

Campo Opciones Descripci├│n
Aufgabe „Umschreiben“, „├ťbersetzen“ „Transcribe“ wandelt das eingegebene Audiomaterial in Text in der ausgew├Ąhlten Sprache um, w├Ąhrend „Transcribe“ es in Englisch umwandelt.
Sprache Eine vollst├Ąndige Liste der unterst├╝tzten Sprachen finden Sie in der Whisper-Dokumentation. Mit „Sprache erkennen“ wird versucht, die im Ton gesprochene Sprache in den ersten Sekunden zu erkennen. Es wird empfohlen, eine Sprache zu w├Ąhlen (falls bekannt), da dies in vielen F├Ąllen die Qualit├Ąt der Transkription verbessert.
Qualit├Ąt Sehr niedrig“, „Niedrig“, „Mittel“, „Hoch“, „Sehr niedrig“, „Niedrig“, „Mittel“, „Hoch“. Die Qualit├Ąt der Transkription bestimmt das f├╝r die Transkription verwendete Whisper-Modell. F├╝r „sehr niedrig“ wird das Modell „winzig“ verwendet, f├╝r „niedrig“ das Modell „niedrig“, f├╝r „mittel“ das Modell „klein“ und f├╝r „hoch“ das Modell „mittel“.

Wie Sie sehen k├Ânnen, ist die Schnittstelle einfach. In den letzten Aktualisierungen wurde die Funktion zum Einreihen verschiedener Dateien in eine Warteschlange hinzugef├╝gt. Dies war ein Geniestreich, der es uns erm├Âglichte, eine lange Aufgabenwarteschlange hinzuzuf├╝gen, damit die KI stundenlang an einem Paket von Audio- oder Videodateien arbeiten konnte.

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht ver├Âffentlicht. Erforderliche Felder sind mit * markiert