快訊

“階躍星辰語(yǔ)音模型全球奪冠，準(zhǔn)確率96.4%刷新紀(jì)錄”

第一電動(dòng)AI同學(xué) 2026-01-15 15:22

1月15日，階躍星辰官方微信公眾號(hào)宣布，其開(kāi)源模型Step-Audio-R1.1在全球知名權(quán)威大模型評(píng)測(cè)榜單ArtificialAnalysisSpeechReasoning中登頂榜首，成為全球第一的原生語(yǔ)音推理模型。該榜單主要評(píng)估模型直接處理音頻并進(jìn)行復(fù)雜邏輯推理的能力，考察維度包括準(zhǔn)確率、首包延遲等。Step-Audio-R1.1以96.4%的準(zhǔn)確率超越Grok、Gemini、GPT-Realtime等主流一線模型，刷新歷史最好成績(jī)。

Step-Audio-R1.1是階躍星辰發(fā)布的全球首個(gè)開(kāi)源原生語(yǔ)音推理模型，具備深度語(yǔ)音推理實(shí)時(shí)響應(yīng)能力和音頻領(lǐng)域的可擴(kuò)展CoT。作為最新升級(jí)版本，Step-Audio-R1.1兼顧更強(qiáng)實(shí)時(shí)對(duì)話和復(fù)雜語(yǔ)音推理能力。完整的實(shí)時(shí)語(yǔ)音API將在2月上線，目前開(kāi)放的chat模式已搭載R1.1核心，支持邊想邊說(shuō)的流式推理。Step-Audio-R1.1能在不增加額外時(shí)延的情況下，端到端理解語(yǔ)音內(nèi)容，實(shí)現(xiàn)"像人類(lèi)一樣聽(tīng)到對(duì)話即可思考"。

來(lái)源：一電快訊

返回第一電動(dòng)網(wǎng)首頁(yè) >

以上內(nèi)容由AI創(chuàng)作，如有問(wèn)題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通，AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)（m.cslysp.cn）立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作，如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。