ESR News berichtet : Agora und die Echtzeit-API von OpenAI ermöglichen nahtlose Interaktion mit multimodalen KI-Agenten.
Quelle: Agora
Agoras Konversations-KI-Engine bietet wichtige Verbesserungen der Echtzeit-API für natürlichere Kommunikation und Interaktion.
SANTA CLARA, Kalifornien , 5. September 2025 /PRNewswire/ -- Agora (NASDAQ: API), die führende Plattform für Echtzeit-Interaktion und konversationelle KI, gab heute die erweiterte Unterstützung für die Echtzeit-API von OpenAI bekannt, die jetzt allgemein verfügbar . Agoras Integration mit der neuen Echtzeit-API unterstützt jetzt automatisierte Begrüßungen, Interaktionen mit verschiedenen Modalitäten, selektive Aufmerksamkeitssteuerung und weitere fortgeschrittene Funktionen, die für eine natürlichere Interaktion zwischen Nutzern und KI-Agenten entwickelt wurden.
Dieser Meilenstein baut auf Agoras Partnerschaft mit OpenAI auf, da die Echtzeit-API das erste multimodale, große Sprachmodell (MLLM) ist, das in die Agora-Plattform integriert ist. Die kombinierte Lösung ermöglicht es Entwicklern, natürlichere, reaktionsschnellere und menschenähnlichere KI-Agenten zu erstellen, indem sie die Entwicklungskomplexität reduzieren und gleichzeitig fortschrittliche Funktionen in der Echtzeitinteraktion freischalten.
„Echtzeit-Multimodalität ist das fehlende Puzzleteil, damit sich KI-Agenten wirklich menschlich anfühlen“, sagte Tony Zhao , CEO von Agora, sagte: "Durch die Integration der Echtzeit-API von OpenAI in unsere Conversational AI Engine geben wir Entwicklern die Werkzeuge an die Hand, um Erlebnisse zu schaffen, die schneller, intelligenter und natürlicher sind als je zuvor."
Agoras Konversations-KI-Engine bietet jetzt erweiterte Funktionen, um eine natürliche Interaktion mit KI-Agenten zu ermöglichen:
- Automatisierte Begrüßungen : Sorgen für sofortiges Sitzungsbewusstsein und ein natürliches, einladendes Onboarding-Erlebnis.
- Interaktion mit gemischten Modalitäten : Ermöglicht nahtloses Umschalten zwischen Sprach- und Texteingaben innerhalb einer einzigen interaktiven Sitzung.
- Flexible Optionen zur Gesprächsrunden-Erkennung : Bietet Entwicklern detaillierte Kontrolle über den Gesprächsfluss und das Verhalten beim Abwechseln der Gesprächsrunden.
- Ununterbrochene Eingabe : Agoras proprietäre Technologie zur selektiven Aufmerksamkeitssteuerung filtert Umgebungsgeräusche und Störstimmen heraus, um eine ununterbrochene Interaktion zu ermöglichen.
Durch Agoras Conversational AI Engine erhalten Entwickler Zugriff auf eine leistungsstarke Reihe von Tools, die nicht nur die Einführung der Echtzeit-API optimieren, sondern auch neue Funktionen und Anwendungsfälle für multimodale KI-Agenten erschließen. Durch die Kombination von OpenAIs Echtzeit-Sprachmodell mit Agoras globaler Echtzeit-Netzwerkinfrastruktur (SDRTN ® ) und einem speziell entwickelten Entwickler-Toolkit können Teams die Markteinführungszeit verkürzen, die Anwendungsentwicklung vereinfachen und überragende Echtzeit-Konversations-KI-Erlebnisse bieten.
Das Robotik-Startup Carbon Origins nutzt bereits Agoras Technologie, die in die Realtime API von OpenAI integriert ist, um die freihändige Bedienung von schweren Geräten zu ermöglichen und die Effizienz der Bediener zu steigern.
„Die Kombination aus der Echtzeit-API von OpenAI und der konversationsorientierten KI-Technologie von Agora ermöglicht die freihändige Steuerung unserer autonomen Roboterflotte“, sagte Amogha Krishna Srirangarajan, CEO und Gründer von Carbon Origins. „Die Technologie ermöglicht die Automatisierung komplexer Checklisten und Systemabläufe in unserer Constellation-KI-Lösung, sodass sich die Bediener auf strategische Aufgaben und die Orchestrierung konzentrieren können, anstatt auf die manuelle Ausführung.“
Die Integration stärkt Agoras Position als führende Plattform für konversationelle KI, Echtzeit-Interaktion und die Entwicklung multimodaler Agenten weiter. Die Anwendungsbereiche umfassen Kundensupport, Bildung, Gaming, Fan-Engagement und mehr.
Über Agora
Agora ist der weltweit führende Anbieter für Echtzeit-Interaktion und stellt Entwicklern einfache, flexible und leistungsstarke APIs zur Verfügung, um konversationelle KI in Echtzeit, Sprach- und Videoanrufe, interaktives Live-Streaming und Chat in ihre Anwendungen und IoT-Geräte zu integrieren. Hauptsitz in Santa Clara, Kalifornien – Agora genießt das Vertrauen von über 1.700 führenden Organisationen weltweit, um erstklassige Echtzeit-Erlebnisse zu ermöglichen, von sozialen Medien und Live-Shopping bis hin zu Bildung und Telemedizin.