日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 數碼

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍

來源: 責編: 時間:2024-10-01 17:06:37 139觀看
導讀 快科技10月1日消息,AMD發布了自己的首個小語言模型(SLM),名為“AMD-135M”。相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對性,非常適合私密性、專業性很強的企業部署。AMD-135小模

快科技10月1日消息,AMD發布了自己的首個小語言模型(SLM),名為“AMD-135M”。TFW28資訊網——每日最新資訊28at.com

相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對性,非常適合私密性、專業性很強的企業部署。TFW28資訊網——每日最新資訊28at.com

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍TFW28資訊網——每日最新資訊28at.com

AMD-135小模型隸屬于Llama家族,有兩個版本:TFW28資訊網——每日最新資訊28at.com

一是基礎型“AMD-Llama-135M”,擁有多達6700億個token,在八塊Instinct MIM250 64GB加速器上訓練了六天。TFW28資訊網——每日最新資訊28at.com

二是延伸型“AMD-Llama-135M-code”,額外增加了專門針對編程的200億個token,同樣硬件訓練了四天。TFW28資訊網——每日最新資訊28at.com

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍創建與部署流程TFW28資訊網——每日最新資訊28at.com

它使用了一種名為“推測解碼”(speculative decoding)的方法,通過較小的草稿模型,在單次前向傳播中生成多個候選token,然后發送給更大的、更精確的目標模型,進行驗證或糾正。TFW28資訊網——每日最新資訊28at.com

這種方法可以同時生成多個token,不會影響性能,還可以降低內存占用,但因為數據交易更多,功耗也會增加。TFW28資訊網——每日最新資訊28at.com

AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型,測試了推測解碼使用與否的性能。TFW28資訊網——每日最新資訊28at.com

比如在MI250加速器上,性能可提升多約2.8倍,銳龍AI CPU上可提升多約3.88倍,銳龍AI NPU上可提升多約2.98倍。TFW28資訊網——每日最新資訊28at.com

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍推測解碼TFW28資訊網——每日最新資訊28at.com

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍TFW28資訊網——每日最新資訊28at.com

AMD-135M小模型的訓練代碼、數據集等資源都已經開源,遵循Apache 2.0。TFW28資訊網——每日最新資訊28at.com

按照AMD的說法,它的性能與其他開源小模型基本相當或略有領先,比如Hellaswag、SciQ、ARC-Easy等任務超過Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務則基本類似GTP2-124MN、OPT-125M。TFW28資訊網——每日最新資訊28at.com

AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍TFW28資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-24-117138-0.htmlAMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AMD發布首個AI小語言模型:6900億token、推測解碼提速3.88倍

下一篇: Intel下下代架構大改!IPC性能飆升、APX新指令集

標簽:
  • 熱門焦點
  • vivo TWS Air開箱體驗:真輕 臻好聽

    在vivo S15系列新機的發布會上,vivo的最新款真無線藍牙耳機vivo TWS Air也一同發布,本次就這款耳機新品給大家帶來一個簡單的分享。外包裝盒上,vivo TWS Air保持了vivo自家產
  • 摸魚心法第一章——和配置文件說拜拜

    為了能摸魚我們團隊做了容器化,但是帶來的問題是服務配置文件很麻煩,然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比,簡單對比下獨立配置中心和k8s作為配
  • CSS單標簽實現轉轉logo

    轉轉品牌升級后更新了全新的Logo,今天我們用純CSS來實現轉轉的新Logo,為了有一定的挑戰性,這里我們只使用一個標簽實現,將最大化的使用CSS能力完成Logo的繪制與動畫效果。新logo
  • Flowable工作流引擎的科普與實踐

    一.引言當我們在日常工作和業務中需要進行各種審批流程時,可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
  • 一文掌握 Golang 模糊測試(Fuzz Testing)

    模糊測試(Fuzz Testing)模糊測試(Fuzz Testing)是通過向目標系統提供非預期的輸入并監視異常結果來發現軟件漏洞的方法。可以用來發現應用程序、操作系統和網絡協議等中的漏洞或
  • 為什么你不應該使用Div作為可點擊元素

    按鈕是為任何網絡應用程序提供交互性的最常見方式。但我們經常傾向于使用其他HTML元素,如 div span 等作為 clickable 元素。但通過這樣做,我們錯過了許多內置瀏覽器的功能。
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人員可能會涉及各種各樣的安全任務,包括但不限于:開發某些安全工具的插件,滿足自己特定的安全需求;自定義github搜索工具,快速查找所需的安全資料、漏洞poc、exp
  • 網紅炒股不為了賺錢,那就是耍流氓!

    來源:首席商業評論6月26日高調宣布入市,網絡名嘴大v胡錫進居然進軍了股市。在一次財經媒體峰會上,幾個財經圈媒體大佬就“胡錫進炒股是否知道認真報道”展開討論。有
  • 華為HarmonyOS 4升級計劃公布:首批34款機型今日開啟公測

    8月4日消息,今天下午華為正式發布了HarmonyOS 4系統,在更流暢的前提下,還帶來了不少新功能,UI設計也有變化,會讓手機煥然一新。華為宣布,首批機型將會在
Top 主站蜘蛛池模板: 吉木乃县| 龙口市| 田东县| 峡江县| 额尔古纳市| 昌邑市| 南川市| 南投县| 湘西| 庆安县| 织金县| 新密市| 资兴市| 扎赉特旗| 尼木县| 泰安市| 玛沁县| 运城市| 赣榆县| 汕头市| 梁平县| 中山市| 五莲县| 东乌珠穆沁旗| 怀柔区| 历史| 莎车县| 汾西县| 西和县| 桑日县| 灵武市| 萍乡市| 东台市| 鄯善县| 荥阳市| 大邑县| 沿河| 砀山县| 剑川县| 宁武县| 郧西县|