Gladia
Speech-to-Text-API mit Echtzeit-Transkription in über 100 Sprachen, unter 300 ms Latenz und integrierter Audio-Intelligenz.
📍 Frankreich 🇫🇷, Paris
Produktübersicht
Gladia ist ein Pariser Unternehmen, das eine Speech-to-Text-API für Entwickler und Unternehmen bereitstellt, die Audio in Echtzeit oder aus Aufnahmen transkribieren müssen. Die API unterstützt über 100 Sprachen mit nativem Code-Switching (Erkennung, wenn Sprecher mitten im Satz die Sprache wechseln), Speaker Diarization, Sentimentanalyse, Named Entity Recognition und Übersetzung. Die Echtzeit-Engine liefert Ergebnisse mit einer Latenz unter 300 Millisekunden. Gegründet 2022 von Jean-Louis Quéguiner (ehemals VP of AI bei OVHcloud) und Jonathan Soto (ehemals VP of Engineering bei Sigfox), entstand das Unternehmen, weil Quéguiner frustriert war, dass kein Transkriptionsdienst seinen französischen Akzent korrekt verarbeiten konnte. Gladia hat insgesamt 20,3 Millionen US-Dollar eingeworben, darunter eine Series-A-Runde über 16 Millionen US-Dollar, angeführt von XAnge im Jahr 2024, mit Beteiligung von Sequoia Capital, Illuminate Financial und XTX Ventures. Die Plattform wird von über 2.000 Unternehmenskunden und 300.000 Nutzern verwendet, darunter Attention, VEED.IO, Sana und Circleback. Gladias proprietäres Solaria-Modell ist darauf ausgelegt, Halluzinationen bei verrauschtem Audio aus dem Alltag zu reduzieren. Das Unternehmen nutzt Kundenaudio nicht zum Nachtrainieren seiner Modelle. Alle Daten werden DSGVO-konform mit Hosting-Optionen in der EU und den USA gespeichert. WICHTIGSTE MERKMALE: - Echtzeit- und asynchrone Speech-to-Text-Transkription in über 100 Sprachen - Unter 300 ms Latenz mit nativer Code-Switching-Erkennung - Integrierte Audio-Intelligenz: Diarization, Sentiment, Entity Recognition, Übersetzung - DSGVO-konformes Daten-Hosting mit EU- und US-Regionen - Einzelne API kompatibel mit allen Tech-Stacks, einschließlich SIP, VoIP und Telefonie-Protokollen
Souveränität
Unternehmensübersicht
Weitere europäische Alternativen
Alle anzeigen →Speechmatics
Speech-to-Text-API mit Unterstuetzung fuer ueber 55 Sprachen sowie Cloud-, On-Premise- und On-Device-Bereitstellungsoptionen.
Amberscript
KI-gestützte Transkriptions- und Untertitelungsplattform, spezialisiert auf europäische Sprachen für Bildung, Behörden und Medien.
Happy Scribe
KI-Transkriptions-, Untertitel- und Übersetzungsplattform für über 120 Sprachen mit automatisierten und manuell geprüften Optionen.