日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 科技  > 知識(shí)百科

TensorFlow 2.9上線:oneDNN改進(jìn)實(shí)現(xiàn)CPU性能優(yōu)化,WSL2開(kāi)箱即用

來(lái)源: 責(zé)編: 時(shí)間:2023-08-07 16:30:18 243觀看
導(dǎo)讀 昨日,TensorFlow 官方宣布:TensorFlow 2.9 來(lái)了!距離上次 2.8 版本 的更新僅僅過(guò)去三個(gè)月。新版本亮點(diǎn)包括如下:oneDNN 的性能改進(jìn);DTensor 的發(fā)布,這是一種新 API,可用于從數(shù)據(jù)并

昨日,TensorFlow 官方宣布:TensorFlow 2.9 來(lái)了!距離上次  2.8 版本 的更新僅僅過(guò)去三個(gè)月。iU928資訊網(wǎng)——每日最新資訊28at.com

iU928資訊網(wǎng)——每日最新資訊28at.com

新版本亮點(diǎn)包括如下:iU928資訊網(wǎng)——每日最新資訊28at.com

oneDNN 的性能改進(jìn);DTensor 的發(fā)布,這是一種新 API,可用于從數(shù)據(jù)并行無(wú)縫遷移到模型并行;對(duì)核心庫(kù)進(jìn)行了改進(jìn),包括 Eigen、tf.function 統(tǒng)一以及對(duì) Windows 的 WSL2 的新支持;還為 tf.function retracing 和 Keras 優(yōu)化器發(fā)布了新的實(shí)驗(yàn)性 API。iU928資訊網(wǎng)——每日最新資訊28at.com

下面讓我們來(lái)看看 TensorFlow 2.9 具體的改進(jìn)都有哪些。iU928資訊網(wǎng)——每日最新資訊28at.com

TensorFlow 2.9 新特性提高 CPU 性能:oneDNNiU928資訊網(wǎng)——每日最新資訊28at.com

TensorFlow 已經(jīng)與英特爾合作,將 oneDNN 性能庫(kù)與 TensorFlow 集成,以實(shí)現(xiàn)在英特爾 CPU 上的最高性能。從 TensorFlow 2.5 以來(lái),TensorFlow 已經(jīng)對(duì) oneDNN 進(jìn)行了實(shí)驗(yàn)性支持,它可以提供高達(dá) 4 倍的性能提升。在 TensorFlow 2.9 中,默認(rèn)在 Linux x86 包和具有神經(jīng)網(wǎng)絡(luò)硬件功能(如 AVX512_VNNI、AVX512_BF16、AMX 等)的 CPU 上啟用 oneDNN 優(yōu)化,這些功能可在 Intel Cascade Lake 和更新的 CPU 上找到。iU928資訊網(wǎng)——每日最新資訊28at.com

英特爾表示:我們很高興與 GoogleAI 合作,將 oneDNN 庫(kù)作為 TensorFlow 2.9 中的默認(rèn)后端 CPU 優(yōu)化!TensorFlow 用戶現(xiàn)在將看到由我們的開(kāi)放軟件優(yōu)化驅(qū)動(dòng)的 AI 性能加速,無(wú)需更改代碼!iU928資訊網(wǎng)——每日最新資訊28at.com

iU928資訊網(wǎng)——每日最新資訊28at.com

在啟用 oneDNN 優(yōu)化的情況下運(yùn)行 TensorFlow 的用戶,可能會(huì)觀察到與關(guān)閉優(yōu)化時(shí)略有不同的數(shù)值結(jié)果,這是因?yàn)楦↑c(diǎn)舍入方法和順序不同,可能會(huì)產(chǎn)生輕微的誤差。iU928資訊網(wǎng)——每日最新資訊28at.com

如果上述情況給你帶來(lái)麻煩,請(qǐng)?jiān)谶\(yùn)行 TensorFlow 程序之前通過(guò)設(shè)置 TF_ENABLE_ONEDNN_OPTS=0 來(lái)關(guān)閉優(yōu)化。假如你要重新啟用它們,請(qǐng)?jiān)谶\(yùn)行 TensorFlow 程序之前設(shè)置 TF_ENABLE_ONEDNN_OPTS=1。要驗(yàn)證優(yōu)化是否啟用,請(qǐng)?jiān)诔绦蛉罩局胁檎乙?oneDNN custom operations are on 開(kāi)頭的消息。 iU928資訊網(wǎng)——每日最新資訊28at.com

iU928資訊網(wǎng)——每日最新資訊28at.com

DTensoriU928資訊網(wǎng)——每日最新資訊28at.com

DTensor 是一種新的 TensorFlow API,可用于分布式模型處理,它允許模型無(wú)縫地從數(shù)據(jù)并行遷移到基于單程序多數(shù)據(jù)(SPMD)的模型并行。iU928資訊網(wǎng)——每日最新資訊28at.com

DTensor 的核心設(shè)計(jì)原則如下:iU928資訊網(wǎng)——每日最新資訊28at.com

設(shè)備無(wú)關(guān) API:這允許在 CPU、GPU 或 TPU 上使用相同的模型代碼,包括跨設(shè)備類型劃分的模型;多客戶端執(zhí)行:移除 coordinator 并讓每個(gè)任務(wù)驅(qū)動(dòng)其本地連接的設(shè)備,從而允許在不影響啟動(dòng)時(shí)間的情況下擴(kuò)展模型;global perspective VS per-replica:傳統(tǒng)上使用 TensorFlow,分布式模型代碼是圍繞 replicas 編寫(xiě)的,但使用 DTensor,模型代碼是從 global perspective 編寫(xiě)的,每個(gè) replica 代碼由 DTensor 運(yùn)行時(shí)生成和運(yùn)行。iU928資訊網(wǎng)——每日最新資訊28at.com

TensorFlow 官方已經(jīng)開(kāi)發(fā)了幾個(gè)關(guān)于 DTensor 的入門(mén)教程,參考資料如下:iU928資訊網(wǎng)——每日最新資訊28at.com

DTensor 概念:https://www.tensorflow.org/guide/dtensor_overview帶有 DTensors 分布式 ML:https://www.tensorflow.org/tutorials/distribute/dtensor_ml_tutorial將 DTensors、Keras 聯(lián)合使用:https://www.tensorflow.org/tutorials/distribute/dtensor_keras_tutorialtf.function 的 TraceTypeiU928資訊網(wǎng)——每日最新資訊28at.com

新版本已經(jīng)改進(jìn)了 tf.function 回溯(retraces)方式,使其更簡(jiǎn)單、可預(yù)測(cè)和可配置。iU928資訊網(wǎng)——每日最新資訊28at.com

所有關(guān)于 tf.function 的參數(shù)被分配一個(gè) tf.types.experimental.TraceType。自定義用戶類可以使用跟蹤協(xié)議(tf.types.experimental.SupportsTracingProtocol)聲明一個(gè) TraceType。TraceType 系統(tǒng)使理解追溯規(guī)則變得很容易。iU928資訊網(wǎng)——每日最新資訊28at.com

支持 WSL2iU928資訊網(wǎng)——每日最新資訊28at.com

WSL2 允許開(kāi)發(fā)人員直接在 Windows 上運(yùn)行 Linux 環(huán)境,而不需要傳統(tǒng)虛擬機(jī)或雙啟動(dòng)設(shè)置。TensorFlow 現(xiàn)在支持 WSL2 開(kāi)箱即用,包括 GPU 加速。iU928資訊網(wǎng)——每日最新資訊28at.com

確定性行為iU928資訊網(wǎng)——每日最新資訊28at.com

API tf.config.experimental.enable_op_determinism 使得 TensorFlow 的 op 是確定性的。確定性意味著如果用戶使用相同的輸入多次運(yùn)行一個(gè) op,則 op 每次都返回完全相同的輸出,這對(duì)于調(diào)試模型很有用。iU928資訊網(wǎng)——每日最新資訊28at.com

通常來(lái)講,許多 op 是不確定的,因?yàn)樵?op 中使用了線程,這些線程可以以不確定的順序添加浮點(diǎn)數(shù)。iU928資訊網(wǎng)——每日最新資訊28at.com

TensorFlow 2.8 引入了一個(gè) API 來(lái)使 op 具有確定性,TensorFlow 2.9 在某些情況下提高了確定性性能。如果你希望 TensorFlow 模型確定性地運(yùn)行,只需將以下內(nèi)容添加到程序的開(kāi)頭:iU928資訊網(wǎng)——每日最新資訊28at.com

tf.keras.utils.set_random_seed(1)iU928資訊網(wǎng)——每日最新資訊28at.com
tf.config.experimental.enable_op_determinism()iU928資訊網(wǎng)——每日最新資訊28at.com

第一行設(shè)置 Python、NumPy 和 TensorFlow 的隨機(jī)種子,這是確定性所必需的。第二行使每個(gè) TensorFlow op 具有確定性。請(qǐng)注意,確定性通常是以降低性能為代價(jià)的,因此當(dāng)啟用 op 確定性時(shí),你的模型可能會(huì)運(yùn)行得更慢。iU928資訊網(wǎng)——每日最新資訊28at.com

使用 Keras 優(yōu)化訓(xùn)練iU928資訊網(wǎng)——每日最新資訊28at.com

TensorFlow 2.9 中添加了 Keras Optimizer API 的新實(shí)驗(yàn)版本,即 tf.keras.optimizers.experimental。該 API 提供更統(tǒng)一和擴(kuò)展的內(nèi)置優(yōu)化器目錄,用戶可以更輕松地定制和擴(kuò)展。iU928資訊網(wǎng)——每日最新資訊28at.com

在未來(lái)的版本中,tf.keras.optimizers.experimental.Optimizer(及子類)將取代 tf.keras.optimizers.Optimizer(及子類),這意味著使用舊版本 Keras 優(yōu)化器的工作流將自動(dòng)切換至新的優(yōu)化器。iU928資訊網(wǎng)——每日最新資訊28at.com

如下為新優(yōu)化器類的一些亮點(diǎn):iU928資訊網(wǎng)——每日最新資訊28at.com

一些模型的訓(xùn)練速度越來(lái)越快;更易于編寫(xiě)自定義優(yōu)化器;內(nèi)置對(duì)模型權(quán)重移動(dòng)平均的支持(Polyak 平均)。iU928資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-119-2337-0.htmlTensorFlow 2.9上線:oneDNN改進(jìn)實(shí)現(xiàn)CPU性能優(yōu)化,WSL2開(kāi)箱即用

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 騙過(guò)83%網(wǎng)友!圖像生成界天花板DALL-E 2竟然通過(guò)了圖靈測(cè)試?

下一篇: 云計(jì)算開(kāi)發(fā):Python3數(shù)學(xué)函數(shù)modf()方法詳解

標(biāo)簽:
  • 熱門(mén)焦點(diǎn)
  • 印度登月最關(guān)鍵一步!月船三號(hào)今晚進(jìn)入環(huán)月軌道

    8月5日消息,據(jù)印度官方消息,月船三號(hào)將于北京時(shí)間今晚21時(shí)30分左右開(kāi)始近月制動(dòng)進(jìn)入環(huán)月軌道。這是該探測(cè)器能夠成功的最關(guān)鍵步驟之一,如果成功將開(kāi)始圍
  • 一篇聊聊Go錯(cuò)誤封裝機(jī)制

    %w 是用于錯(cuò)誤包裝(Error Wrapping)的格式化動(dòng)詞。它是用于 fmt.Errorf 和 fmt.Sprintf 函數(shù)中的一個(gè)特殊格式化動(dòng)詞,用于將一個(gè)錯(cuò)誤(或其他可打印的值)包裝在一個(gè)新的錯(cuò)誤中。使
  • 如何通過(guò)Python線程池實(shí)現(xiàn)異步編程?

    線程池的概念和基本原理線程池是一種并發(fā)處理機(jī)制,它可以在程序啟動(dòng)時(shí)創(chuàng)建一組線程,并將它們置于等待任務(wù)的狀態(tài)。當(dāng)任務(wù)到達(dá)時(shí),線程池中的某個(gè)線程會(huì)被喚醒并執(zhí)行任務(wù),執(zhí)行完任
  • 三言兩語(yǔ)說(shuō)透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是兩種很有用的技術(shù),可以幫助我們寫(xiě)出更加優(yōu)雅、泛用的函數(shù)。本文將首先介紹柯里化和反柯里化的概念、實(shí)現(xiàn)原理和應(yīng)用
  • 慕巖炮轟抖音,百合網(wǎng)今何在?

    來(lái)源:價(jià)值研究所 作者:Hernanderz“難道就因?yàn)樽约旱囊粋€(gè)產(chǎn)品牛逼了,從客服到總裁,都不愿意正視自己產(chǎn)品和運(yùn)營(yíng)上的問(wèn)題,選擇逃避了嗎?”這一番話,出自百合網(wǎng)聯(lián)合創(chuàng)
  • 2天漲粉255萬(wàn),又一賽道在抖音爆火

    來(lái)源:運(yùn)營(yíng)研究社作者 | 張知白編輯 | 楊佩汶設(shè)計(jì) | 晏談夢(mèng)潔這個(gè)暑期,旅游賽道徹底火了:有的「地方」火了——貴州村超旅游收入 1 個(gè)月超過(guò) 12 億;有的「博主」火了&m
  • 蘋(píng)果、三星、惠普等暫停向印度出口筆記本和平板電腦

    集微網(wǎng)消息,據(jù)彭博社報(bào)道,在8月3日印度突然禁止在沒(méi)有許可證的情況下向印度進(jìn)口電腦/平板及顯示器等產(chǎn)品后,蘋(píng)果、三星電子和惠普等大公司暫停向印度
  • 三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

    2023年7月26日,三星電子正式發(fā)布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外,Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期
  • iQOO Neo8 Pro真機(jī)諜照曝光:天璣9200+和V1+旗艦雙芯加持

    去年10月,iQOO推出了iQOO Neo7系列機(jī)型,不僅搭載了天璣9000+,而且是同價(jià)位唯一一款天璣9000+直屏旗艦,一經(jīng)上市便受到了用戶的廣泛關(guān)注。在時(shí)隔半年后,
Top 主站蜘蛛池模板: 钟祥市| 普兰县| 丹棱县| 灵宝市| 乌鲁木齐县| 深水埗区| 从化市| 茶陵县| 南和县| 怀集县| 禄丰县| 铁力市| 烟台市| 姚安县| 虹口区| 博客| 南皮县| 许昌县| 许昌市| 崇文区| 佛教| 桂阳县| 大埔县| 靖边县| 读书| 临武县| 且末县| 威海市| 定安县| 哈尔滨市| 泰宁县| 上饶市| 新兴县| 瑞安市| 肃南| 吉林省| 巨野县| 满城县| 鹤庆县| 河南省| 长葛市|