日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

借助Python庫CuPy,發掘GPU的威力

來源: 責編: 時間:2023-11-07 09:13:05 230觀看
導讀譯者 | 布加迪審校 | 重樓CuPy簡介CuPy是一個Python庫,與NumPy和SciPy數組兼容,為GPU加速計算而設計。通過將NumPy換成CuPy語法,您可以在英偉達CUDA或AMD ROCm平臺上運行代碼。這讓您可以使用GPU加速執行與數組相關的任

譯者 | 布加迪GJ028資訊網——每日最新資訊28at.com

審校 | 重樓GJ028資訊網——每日最新資訊28at.com

CuPy簡介

CuPy是一個Python庫,與NumPy和SciPy數組兼容,為GPU加速計算而設計。通過將NumPy換CuPy語法,您可以在英偉達CUDA或AMD ROCm平臺上運行代碼。這可以使用GPU加速執行與數組相關的任務,從而更快地處理更龐大的數組。GJ028資訊網——每日最新資訊28at.com

只需換掉幾行代碼,就可以利用GPU的大規模并行處理能力來顯著加快索引、規范化和矩陣乘法等數組操作。GJ028資訊網——每日最新資訊28at.com

CuPy還支持訪問低級CUDA功能。它允許使用RawKernels將ndarray傳遞給現有的CUDA C/ C++程序,借助Streams簡化性能,并允許直接調用CUDA Runtime API。GJ028資訊網——每日最新資訊28at.com

安裝CuPy

您可以使用pip安裝CuPy,但在此之前,您必須使用以下命令找到正確的CUDA版本。GJ028資訊網——每日最新資訊28at.com

GJ028資訊網——每日最新資訊28at.com

!nvcc --versionnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2022 NVIDIA CorporationBuilt on Wed_Sep_21_10:33:58_PDT_2022Cuda compilation tools, release 11.8, V11.8.89Build cuda_11.8.r11.8/compiler.31833905_0

谷歌Colab的當前版本似乎使用CUDA版本11.8。因此,我們將繼續安裝cupy-cuda11x版本。GJ028資訊網——每日最新資訊28at.com

如果您使用較舊的CUDA版本,我提供了下面的表格來幫助您確定要安裝的合適的CuPy軟件包。GJ028資訊網——每日最新資訊28at.com

GJ028資訊網——每日最新資訊28at.com

選擇正確的版本后,我們將使用pip安裝Python軟件包。GJ028資訊網——每日最新資訊28at.com

GJ028資訊網——每日最新資訊28at.com

pip install cupy-cuda11x

如果您已安裝了Anaconda,還可以使用conda命令自動檢測并安裝CuPy軟件的正確版本GJ028資訊網——每日最新資訊28at.com

GJ028資訊網——每日最新資訊28at.com

conda install -c conda-forge cupy

CuPy基礎知識

在本節中,我們將比較CuPy和Numpy的語法,它們相似度為95%。不是使用np,而是用cp代替它。GJ028資訊網——每日最新資訊28at.com

我們將先使用Python列表創建NumPy和CuPy數組。之后,我們將計算向量的范數。GJ028資訊網——每日最新資訊28at.com

import cupy as cpimport numpy as npx = [3, 4, 5]x_np = np.array(x)x_cp = cp.array(x)l2_np = np.linalg.norm(x_np)l2_cp = cp.linalg.norm(x_cp)print("Numpy: ", l2_np)print("Cupy: ", l2_cp)

正如我們所,我們得到了類似的結果。GJ028資訊網——每日最新資訊28at.com

GJ028資訊網——每日最新資訊28at.com

Numpy: 7.0710678118654755GJ028資訊網——每日最新資訊28at.com

Cupy: 7.0710678118654755GJ028資訊網——每日最新資訊28at.com

為了將NumPy轉換CuPy數組,只需使用cp.asarray(X)。GJ028資訊網——每日最新資訊28at.com

x_array = np.array([10, 22, 30])x_cp_array = cp.asarray(x_array)type(x_cp_array)cupy.ndarray

或者,使用.get()將CuPy轉換Numpy數組。GJ028資訊網——每日最新資訊28at.com

x_np_array = x_cp_array.get()type(x_np_array)numpy.ndarray

性能比較

在本節中,我們將比較NumPy和CuPy的性能。GJ028資訊網——每日最新資訊28at.com

我們將使用time.time()對代碼執行時間進行計時。然后,我們將創建一個3D NumPy數組并執行一些數學函數。GJ028資訊網——每日最新資訊28at.com

import time# NumPy and CPU Runtimes = time.time()x_cpu = np.ones((1000, 100, 1000))np_result = np.sqrt(np.sum(x_cpu**2, axis=-1))e = time.time()np_time = e - sprint("Time consumed by NumPy: ", np_time)Time consumed by NumPy: 0.5474584102630615

類似地,我們將創建一個3D CuPy數組,執行數學運算,并進行計時以評測性能GJ028資訊網——每日最新資訊28at.com

# CuPy and GPU Runtimes = time.time()x_gpu = cp.ones((1000, 100, 1000))cp_result = cp.sqrt(cp.sum(x_gpu**2, axis=-1))e = time.time()cp_time = e - sprint("/nTime consumed by CuPy: ", cp_time)Time consumed by CuPy: 0.001028299331665039

為了計算差異,我們將NumPy時間除以CuPy時間,我們使用CuPy獲得了500倍以上的性能提升。GJ028資訊網——每日最新資訊28at.com

diff = np_time/cp_timeprint(f'/nCuPy is {diff: .2f} X time faster than NumPy')CuPy is 532.39 X time faster than NumPy

注意為了達到更好的效果,建議進行一番預熱運行,以盡量減少時間波動。GJ028資訊網——每日最新資訊28at.com

除了速度優勢外,CuPy還提供了出色的多GPU支持,可以充分利用多個GPU的集體計算能力。GJ028資訊網——每日最新資訊28at.com

此外,如果您想比較結果,可以看看我的Colab筆記本。GJ028資訊網——每日最新資訊28at.com

結論

總之,CuPy提供了一種在英偉達GPU上加速NumPy代碼的簡單方法。只需做幾個修改,將NumPy替換CuPy,就可以體驗到數組計算在速度上有數量級的提升。這種性能提升使您可以處理龐大得多的數據集和模型,從而實現更先進的機器學習和科學計算。GJ028資訊網——每日最新資訊28at.com

相關資源:GJ028資訊網——每日最新資訊28at.com

  • 說明文檔:https://docs.cupy.dev/en/stable/index.html
  • GitHubhttps://github.com/cupy/cupy
  • 示例:https://github.com/cupy/cupy/tree/main/examples
  • APIhttps://docs.cupy.dev/en/stable/reference/

原文標題:Leveraging the Power of GPUs with CuPy in Python,作者:Abid Ali AwanGJ028資訊網——每日最新資訊28at.com


GJ028資訊網——每日最新資訊28at.com

本文鏈接:http://www.www897cc.com/showinfo-26-17375-0.html借助Python庫CuPy,發掘GPU的威力

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Golang 中的 Bytes 包詳解之Bytes.Buffer

下一篇: 想快速進入人工智能領域的Java程序員?你準備好了嗎?

標簽:
  • 熱門焦點
  • 紅魔電競平板評測:大屏幕硬實力

    前言:三年的疫情因為要上網課的原因激活了平板市場,如今網課的時代已經過去,大家的生活都恢復到了正軌,這也就意味著,真正考驗平板電腦生存的環境來了。也就是面對著這種殘酷的
  • 7月安卓手機好評榜:三星S23Ultra好評率第一

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年7月1日至7月31日,僅限國內市場。第一名:三星Galaxy S23 Ultra好評率:95.71%在即將迎來新
  • 5月iOS設備性能榜:M1 M2依舊是榜單前五

    和上個月一樣,沒有新品發布的iOS設備性能榜的上榜設備并沒有什么更替,僅僅只有跑分變化而產生的排名變動,剛剛開始的蘋果WWDC2023,推出的產品也依舊是新款Mac Pro、新款Mac Stu
  • Flowable工作流引擎的科普與實踐

    一.引言當我們在日常工作和業務中需要進行各種審批流程時,可能會面臨一系列技術和業務上的挑戰。手動處理這些審批流程可能會導致開發成本的增加以及業務復雜度的上升。在這
  • 量化指標是與非:挽救被量化指標扼殺的技術團隊

    作者 | 劉新翠整理 | 徐杰承本文整理自快狗打車技術總監劉新翠在WOT2023大會上的主題分享,更多精彩內容及現場PPT,請關注51CTO技術棧公眾號,發消息【WOT2023PPT】即可直接領取
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人員可能會涉及各種各樣的安全任務,包括但不限于:開發某些安全工具的插件,滿足自己特定的安全需求;自定義github搜索工具,快速查找所需的安全資料、漏洞poc、exp
  • 當家的盒馬,加速謀生

    來源 | 價值星球Planet作者 | 歸去來自己“當家”的盒馬,開始加速謀生了。據盒馬官微消息,盒馬計劃今年開放生鮮供應鏈,將其生鮮商品送往食堂。目前,盒馬在上海已經與
  • 微博大門常打開,迎接海外畫師漂洋東渡

    作者:互聯網那些事“起猛了,我能看得懂日語了”。“為什么日本人說話我能聽懂?”“中文不像中文,日語不像日語,但是我竟然看懂了”…&hell
  • 親歷馬斯克血洗Twitter,硅谷的苦日子在后頭

    文/劉哲銘  編輯/李薇  馬斯克再次揮下裁員大刀。  美國時間11月14日,Twitter約4400名外包員工遭解雇,此次被解雇的員工的主要工作為內容審核等。此前,T
Top 主站蜘蛛池模板: 安龙县| 祁阳县| 靖远县| 若羌县| 昌邑市| 威远县| 镇平县| 宁波市| 瑞丽市| 南昌县| 大方县| 抚松县| 越西县| 西吉县| 巨野县| 石台县| 县级市| 惠水县| 通渭县| 乳源| 万全县| 阜新市| 三门县| 舞阳县| 武平县| 天镇县| 丰原市| 拉萨市| 安阳县| 尚志市| 台东县| 陇川县| 盐城市| 镇沅| 新建县| 麻栗坡县| 乌拉特前旗| 邮箱| 潮安县| 香河县| 蓬莱市|