OpenAI近日在API服務中正式上線了新一代旗艦模型GPT-5 Pro,同時推出了一款專為實時語音交互設計的輕量化模型GPT-realtime-mini。這兩項技術突破標志著該公司在多模態人工智能領域邁出了關鍵一步。
據OpenAI首席執行官奧爾特曼透露,GPT-5 Pro作為當前最先進的文本生成模型,將為企業和開發者提供更強大的自然語言處理能力。而同步發布的GPT-realtime-mini則以極低的延遲和資源消耗,實現了高質量的語音識別與合成功能,特別適用于需要實時響應的交互場景。
奧爾特曼特別強調了語音交互在未來人機溝通中的核心地位。他指出,隨著技術發展,語音將成為用戶與AI系統交互的主要方式之一。此次推出的輕量化語音模型,正是為了降低開發者集成語音功能的門檻,推動語音交互技術在更多場景中的普及應用。
業內分析認為,OpenAI此次雙管齊下的產品策略,既保持了其在文本生成領域的領先優勢,又通過專用語音模型完善了多模態交互能力。這種技術布局不僅滿足了市場對高效AI工具的需求,也為構建更自然的人機交互體驗奠定了基礎。











