System und Verfahren zur sicheren, Echtzeit, hohe Genauigkeit Umwandlung von Sprache in Text
Vereinigte Staaten 7,539,086
Das System ist als Schnittstelle zu externen Geräten und Dienstleistungen, um Audiosignale, die an anderer Stelle gespeichert sein kann wie eine drahtlose phone'voice mail transkribieren, oder die zwischen zwei oder mehr Parteien, wie einer Telefonkonferenz. Ein Audio-Stream wird in viele Audio-Fetzen getrennt, von denen jede Dauer von wenigen Sekunden hat und nicht offenbaren den Kontext des Gesprächs. Eine Belegschaft von geografisch verteilten Transkription Agenten, die die Audio-Fetzen transkribieren kann, um die Transkription zu generieren in Echtzeit, mit vielen Agenten parallel an ein einziges Gespräch. Niemand Agent (oder eine Gruppe von Agenten) empfängt eine ausreichende Anzahl von Audio-Fetzen, den Kontext des Gesprächs rekonstruieren. Die Verwendung menschlicher Abschreiber kann das System typische Einschränkungen der computer-basierten Spracherkennung zu überwinden und ermöglicht eine genaue Transkription der allgemeinen Qualität Rede auch in akustisch schwierigen Umgebungen.
Seien Sie den ersten Kommentar. Hinterlasse einen Kommentar