阿里云開源通義千問Qweb2 支持128K上下文 在測試中表現不俗 – 藍點網
阿里云今天推出了通義千問人工智能模型的藍點重大升級版本:Qwen2,該模型提供 5 個不同的阿里尺寸、上下文長度最高支持 128K tokens,云開源通義千并且在各項測試中表現不俗。問Q文測網
Qwen2 的上下試中所有尺寸版本均已同步在 GitHub、HuggingFace 和 ModelScope 上開源,表現不俗有興趣的藍點開發者可以立即獲取模型進行測試。

此次發布的阿里新版本亮點包括:
- 能力較此前版本有較大幅度提升,在開源模型測試中名列前茅
- 提供 5 個預訓練和指令微調模型,云開源通義千包括 Qwen2-0.5B、問Q文測網廣州花都區外圍(外圍資源)(薇WhatsApp+365-*2895)提供全國外圍女上門、伴游,空姐,網紅,明星,學生上門預約服務 同城30分鐘內到達 面到付款Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B
- 在編程領域和數學方面的能力顯著提高
- 增加上下文長度,現在最高支持 128K tokens
- 在中文和英語的基礎上,增加 27 種語言相關的數據進行訓練

在 Qwen1.5 系列模型中只有 32B 和 110B 版使用 GQA,而在 Qwen2 中所有模型都使用 Qwen2,使用 GQA 后有助于提升推理能力和降低顯存的占用。
同時諸如 Qwen2-0.5B 和 1.5B 版可以在性能更低的設備上運行,例如在智能手機本地運行 Qwen2-0.5B 而不需要云端處理,這種也是未來的趨勢,未來可能所有智能設備都會支持 AI,這就需要更小的模型為本地運行提供支持。
模型評估顯示 Qwen2 能力超過 Llama3:
目前人工智能開源 / 開放社區中最重要的兩個貢獻者就是 Meta 和阿里云,Meta 主要就是 Llama 系列模型最新版本為 Llama3。
在開源 / 開放模型能力評測中,Qwen2-72B 版在各方面超過 Llama3-70B,也超過了 Mixtral-8x22B,所以現在壓力給到了 Meta,不知道 Meta 什么時候發布新版本。



阿里云 AI 團隊表示:
大規模預訓練后,我們對模型進行精細的微調,以提升其智能水平,讓其表現更接近人類。這個過程進一步提升了代碼、數學、推理、指令遵循、多語言理解等能力。此外,模型學會對齊人類價值觀,它也隨之變得更加對人類有幫助、誠實以及安全。我們的微調過程遵循的原則是使訓練盡可能規模化的同時并且盡可能減少人工標注。我們探索了如何采用多種自動方法以獲取高質量、可靠、有創造力的指令和偏好數據,其中包括針對數學的拒絕采樣、針對代碼和指令遵循的代碼執行反饋、針對創意寫作的回譯、針對角色扮演的 scalable oversight、等等。在訓練方面,我們結合了有監督微調、反饋模型訓練以及在線 DPO 等方法。我們還采用了在線模型合并的方法減少對齊稅。這些做法都大幅提升了模型的基礎能力以及模型的智能水平。
限時活動推薦:軟購618多款正版軟件2折購、QQ超會15月108元、B站大會員88元、騰訊視頻128元、愛奇藝138元。
相關文章
最近恐怖游戲夜幕降臨正式登陸steam,這款游戲也是非常具有恐怖色彩的,游戲向玩家展示了非常具有懸疑的氛圍,從游戲畫面和音效就能夠感受到讓人毛骨悚然的感覺,喜歡恐怖游戲的玩家可以關注一下這款游戲。VI2025-12-12
最新消息,圣劍網絡與ImbaTV電競合作簽約儀式于今日上午成功舉行,上海映霸文化傳播有限公司(簡稱:ImbaTV)與上海圣劍網絡科技股份有限公司(簡稱:圣劍網絡)達成戰略合作協議,共同打造全新電競視頻2025-12-12
NASA力勸民眾在COVID-19疾病大流行的大環境下不要圍觀SpaceX的首次載人發射神秘的地球uux.cn報道)據cnBeta:SpaceX即將開展將真人宇航員送往太空的發射任務,作為商業載人發射2025-12-12
Aquaplus遠日公布,將于北京時候11月25日18:00停止《歌頌之物》2022特別直播活動。正在此次直播活動中,廠商將公布足游《歌頌之物:掉降的旗號》新內容,慶賀本做上市三周年記念。別的,《單色2025-12-12
正在悠少而熾熱的夏季里,夜空如朱,繁星面面之下,殘暴的花水劃破沉寂,綻放出無盡的光彩與但愿。7月25日10:00-14:00《拂曉:勝利之刻》將停止臨時保護,期間將臨時出法進進港區,感激批示民們的支撐2025-12-12
太空狼人殺VR版游戲《我們當中VR》本日正式出售,登岸Steam戰Meta Quest 2,Steam版賣價37元,支撐中文,Steam玩家評測為“多數好評”,233篇評測中有79%為好評。古晨,游戲2025-12-12
