12月31日,阿里通義大模型開源發(fā)布了Qwen-Image-2512,這一模型在圖像生成領(lǐng)域?qū)崿F(xiàn)了三大核心能力的飛躍式提升。Qwen-Image-2512能夠生成更真實的人物質(zhì)感,通過精準刻畫皮膚紋理、發(fā)絲走向和表情神態(tài),甚至理解“微微前傾”等語義細節(jié),告別了塑料臉和模糊五官的問題。此外,該模型在自然紋理的刻畫上也更為細膩,無論是水流、苔蘚、金毛犬的絨毛還是盤羊的粗硬皮毛,都能得到細致的表現(xiàn)。
Qwen-Image-2512在文字渲染方面也取得了顯著進步,不僅能夠排版時間軸、呈現(xiàn)技術(shù)圖表,還能生成帶多格漫畫和對話框的健康科普海報。在AIArena超過1萬局的用戶盲測中,Qwen-Image-2512在開源模型中表現(xiàn)最優(yōu),并在與多款閉源模型的對比中展現(xiàn)出顯著競爭力。這一模型的全面開源,為圖像生成技術(shù)的發(fā)展提供了新的推動力,其官方生成示例和開源地址已對外公布。



來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(m.cslysp.cn)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。