Perfekte Sprachverständlichkeit

AI Cleans Voice from Noise

In Notsituationen wie Unfällen auf der Straße oder in einer Fabrik zählt jede Sekunde. Wenn Hintergrundgeräusche oder Echoeffekte das gesprochene Wort verzerren oder es völlig unverständlich machen, stehen die Gesundheit oder sogar das Leben von Menschen auf dem Spiel.

Unsere AI Cleans Voice from Noise Technologie ist die revolutionäre Lösung für das Problem der Hintergrundgeräusche. Mithilfe einer KI-basierten Technik, die als "tiefe neuronale Netze" (Deep Neural Networks) bekannt ist, ist die Lösung in der Lage, Hintergrundgeräusche zu eliminieren und das Sprachsignal auf ein erstaunliches Qualitätsniveau zu heben. Das Ergebnis ist vergleichbar mit einer direkten Kommunikation von Angesicht zu Angesicht in einer geräuschfreien Umgebung.

Trusted Voice

Um die Stimme tatsächlich von Störgeräuschen zu befreien, haben wir in enger Forschungskooperation mit dem Institut für Elektronische Musik und Akustik (IEM) an der Kunstuniversität Graz gearbeitet. Mit vereinten Kräften ist es uns gelungen, die Signalverarbeitung unseres Intercom-Moduls im3 und der Sprechstelle od1 deutlich zu optimieren. Das Ergebnis ist ein Sprachbild, das durch ein bisher unerreichtes Maß an Klarheit und Verständlichkeit glänzt, ähnlich wie bei einer hochqualitativen Übertragung in einer Umgebung ohne Hintergrundgeräusche.

Wie es funktioniert

Das Geheimnis dieser bemerkenswerten Leistung liegt in sogenannten tiefen neuronalen Netzen. Tiefe neuronale Netze kann man sich vorstellen wie miteinander verbundene Netzwerke aus künstlichen Gehirnzellen, die aus Daten lernen, um verschiedene Arten von Problemen zu lösen, ähnlich wie unser Gehirn aus Erfahrungen lernt, um Entscheidungen zu treffen. Sie sorgen dafür, dass die Sprachsignale während der Übertragung vollständig von Umgebungsgeräuschen und Echos befreit werden.

Wir waren schon immer stolz auf unsere hochwertige Sprachübertragung. Mit den trainierten neuronalen Netzen haben wir die Messlatte für unsere Trusted Voice jetzt noch höher gelegt. Jegliches Restrauschen wird nahezu perfekt unterdrückt. Das ist das Resultat eines umfassenden Trainingsprozesses mit standardisierten Machine-Learning-Algorithmen. Indem sie mit unzähligen Stunden Audiodaten gefüttert werden, wird ihnen systematisch die gewünschte Erkennungsleistung " antrainiert". Das neuronale Netz reagiert nun mit äußerster Präzision auf die vielfältigen Herausforderungen des Alltags – etwa unterschiedliche Stimmen und ein breites Spektrum an Umgebungsgeräuschen in verschiedenen Situationen.

Überzeugen Sie sich selbst von dem außergewöhnlichen Ergebnis:

Commend weltweit