1月15日,階躍星辰官方微信公眾號(hào)宣布,其開(kāi)源模型Step-Audio-R1.1在全球知名權(quán)威大模型評(píng)測(cè)榜單ArtificialAnalysisSpeechReasoning中登頂榜首,成為全球第一的原生語(yǔ)音推理模型。該榜單主要評(píng)估模型直接處理音頻并進(jìn)行復(fù)雜邏輯推理的能力,考察維度包括準(zhǔn)確率、首包延遲等。Step-Audio-R1.1以96.4%的準(zhǔn)確率超越Grok、Gemini、GPT-Realtime等主流一線模型,刷新歷史最好成績(jī)。
Step-Audio-R1.1是階躍星辰發(fā)布的全球首個(gè)開(kāi)源原生語(yǔ)音推理模型,具備深度語(yǔ)音推理實(shí)時(shí)響應(yīng)能力和音頻領(lǐng)域的可擴(kuò)展CoT。作為最新升級(jí)版本,Step-Audio-R1.1兼顧更強(qiáng)實(shí)時(shí)對(duì)話和復(fù)雜語(yǔ)音推理能力。完整的實(shí)時(shí)語(yǔ)音API將在2月上線,目前開(kāi)放的chat模式已搭載R1.1核心,支持邊想邊說(shuō)的流式推理。Step-Audio-R1.1能在不增加額外時(shí)延的情況下,端到端理解語(yǔ)音內(nèi)容,實(shí)現(xiàn)"像人類(lèi)一樣聽(tīng)到對(duì)話即可思考"。


來(lái)源:一電快訊
返回第一電動(dòng)網(wǎng)首頁(yè) >
以上內(nèi)容由AI創(chuàng)作,如有問(wèn)題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(m.cslysp.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。