OpenCV是計算機視覺領域最流行的庫之一。它最初是用 C 和 C++ 編寫的?,F在也可以在 Python 中使用。它最初是由英特爾開發的。該庫是一個跨平臺的開源庫。免費使用。OpenCV 庫是一個高度優化的庫,其主要重點是實時應用程序。
OpenCV 庫是2500多個優化算法的組合。它可以用來檢測和識別不同的人臉,在圖像中或實時識別物體,使用視頻和網絡攝像頭分類不同的人類行為,跟蹤攝像機的運動,跟蹤像汽車、人類等移動物體,實時計數物體,將圖像拼接在一起產生高分辨率圖像,從圖像數據庫中找到類似的圖像,從使用閃光燈拍攝的圖像中去除紅眼,提高圖像質量,跟蹤眼球運動,跟蹤人臉等
它擁有大約4.7萬活躍用戶社區,估計下載量超過1800萬次。許多大公司,如谷歌,亞馬遜,特斯拉,微軟,本田等使用OpenCV,使他們的產品更好,更智能。
在開始編寫代碼之前,我們需要在我們的設備上安裝 OpenCV 。如果你是專業的編程人員并且知道每一個 IDE,那么去 Pycharm 并且在設置中從它的包管理器中安裝 OpenCV-python。
如果您是初學者或中級程序員,或者只是想關注該博客,那么我們將使用代碼編輯器而不是IDE。只需轉到Visual Studio Code網站并根據您的操作系統下載最新版本即可?,F在,我們將創建一個虛擬環境,在其中將安裝 OpenCV。打開終端,然后使用cd定位到桌面。使用名為opencv的mkdir創建一個文件夾然后在以下命令中運行。
python -m venv env
現在使用 env/scripts/activate 命令激活環境,你會看到在 C:/Users/username/Desktop/opencv 前出現一個帶小括號的 (env)。現在只需使用 pip 安裝 OpenCV。
pip install opencv-python
我們將在這個博客中涵蓋7個主題:
為了使用 OpenCV 讀取圖像,我們使用函數 imread() ,為了顯示圖像,我們使用函數 imshow() ,為了寫入圖像,我們使用函數 imwrite()。讓我們看看每一個的語法。
imread():
img = cv2.imread("PATH_TO_IMAGE.jpg/png")Exampleimg = imread("images/dog0.jpg")
imshow():
cv2.imshow("WINDOW NAME",IMG_VAR)Exampleimshow("Dog Image",img)
imwrite():
cv2.imwrite(FILENAME, IMAGE)filename: A string representing the file name. The filename must include image format like .jpg, .png, etc.image: It is the image that is to be saved.Examplecv2.imwrite('images/img',img)
讀取視頻文件與讀取 OpenCV 中的圖像文件非常相似。不同之處在于我們使用 cv2.videocapture()
語法:
video = cv2.VideoCapture("FILEPATH.mp4")Examplevideo = cv2.VideoCapture("video/dog/dog.mp4")
視頻是許多幀圖像在一起的集合,每一幀都是一個圖像。要使用 OpenCV 觀看視頻,我們只需要使用 while 循環顯示視頻的每一幀。
while True: success , img = cap.read() cv2.imshow("Video",img) if cv2.waitKey(1) & 0xff==ord('q'):##key 'q' will break the loop break
為了與網絡攝像頭集成,我們需要傳遞網絡攝像頭的端口值,而不是路徑到視頻。如果你使用的是筆記本電腦,沒有連接任何外部攝像頭,那么簡單地傳遞0,如果你連接了任何外部攝像頭,那么傳遞一個攝像頭端口值。
cap = cv2.VideoCapture(0)cap.set(3,640) ## Frame widthcap.set(4,480) ## Frame Heightcap.set(10,100) ## Brightnesswhile True: success, img = cap.read() cv2.imshow("Video",img) if cv2.waitKey(1) & 0xff == ord('q'): break
(1) 縮放圖像
縮放是一個改變圖像形狀的過程。在 Opencv,我們可以使用 resize 函數來調整圖像的形狀。
語法:
cv2.resize(IMG,(WIDTH,HEIGHT))IMG: image which we want to resizeWIDTH: new width of the resize imageHEIGHT: new height of the resize imageExamplecv2.resize(img,(224,224))
要調整圖像的大小,我們首先需要知道圖像的形狀。我們可以利用 shape 找到圖像的形狀,然后根據當前圖像的形狀,我們可以增大或減小圖像的大小。讓我們舉個例子來看看。
import cv2img = cv2.imread("images/img0.jpg") ##Choose any imageprint(img.shape)imgResize = cv2.resize(img,(224,224)) ##Decrease sizeimgResize2 = cv2.resize(img,(1024,1024)) ##Increase sizecv2.imshow("Image",img)cv2.imshow("Image Resize",imgResize)cv2.imshow("Image Increase size",imgResize2)print(imgResize.shape)cv2.waitKey(0)
如果您不想把圖像寬度和高度寫死,您也可以根據現有的形狀,然后根據比例改變圖像的寬度和高度。
import cv2img = cv2.imread("images/img0.jpg") ##Choose any imageprint(img.shape)shape = img.shapeimgResize = cv2.resize(img,(shape[0]//2,shape[1]//2))##Decrease sizeimgResize2 = cv2.resize(img,(shape[0]*2,shape[1]*2)) ##Increase sizecv2.imshow("Image",img)cv2.imshow("Image Resize",imgResize)cv2.imshow("Image Increase size",imgResize2)print(imgResize.shape)cv2.waitKey(0)
(2) 裁剪圖像
裁剪是獲取部分圖像的過程。在 OpenCV 中,我們可以通過定義裁剪后的矩形坐標來執行裁剪。
語法:
imgCropped = img[y1:y2, x1:x2](x1,y1): top-left vertex(x2,y2): bottom-right vertexExampleimgCropped = img[0:100,200:200]
使用裁剪方法,讓我們嘗試從圖像中提取 Monalisa 的臉。
import cv2img = cv2.imread("images/img0.jpg")imgCropped = img[50:250,120:330]cv2.imshow("Image cropped",imgCropped)cv2.imshow("Image",img)cv2.waitKey(0)
您還可以使用繪畫模式來查找(x1,y1)、(x2,y2)的正確坐標。
這里有個小任務:
我們可以在圖像上使用許多基本的濾波器,比如將圖片轉換成灰度、模糊等等。
(1) 從 Img 到 gray
為了將圖像從彩色圖像轉換為灰度圖像,我們可以使用函數 cv2.cvtColor,在這里我們傳遞 cv2.COLOR_BGR2GRAY 作為參數。
語法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)IMG: Original imageCODE: Conversion code for Gray(COLOR_BGR2GRAY)ExampleimgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
(2) 從 Img 到 HSV
為了將圖像轉換為 HSV 顏色空間,我們可以使用函數 cv2.cvtColor,這里我們傳遞 cv2.COLOR_BGR2HSV 作為參數。它主要用于目標跟蹤。
語法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)IMG: Original imageCODE: Conversion code for Gray(COLOR_BGR2HSV)ExampleimgHsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
(3) 模糊圖像
模糊用于去除圖像中的噪聲,也稱為平滑。它是對圖像應用低通濾波器的過程。在 OpenCV 中對圖像進行模糊,我們常用 GaussianBlur。
語法:
imgBlur = cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize)kernalsize ? A Size object representing the size of the kernel.sigmaX ? A variable representing the Gaussian kernel standard deviation in X direction.sigmaY - same as sigmaXExmapleimgBlur = cv2.GaussianBlur(img,(3,3),0)
(4) 邊緣檢測
在 OpenCV 中,我們使用 Canny算子來檢測圖像中的邊緣。也有不同的邊緣檢測器,但最著名的是 Canny算子。Canny算子邊緣檢測是一種邊緣檢測算子,它使用多級算法來檢測圖像中的大范圍邊緣,是由 John F. Canny 在1986年提出的。
語法:
imgCanny = cv2.Canny(img,threshold1,threshold2)threshold1,threshold2:Different values of threshold different for every imagesExampleimgCanny = cv2.Canny(img,100,150)
(5) 膨脹
膨脹被用來增加圖像中邊緣的大小。首先,我們定義了奇數(5,5)的核矩陣大小。然后使用內核,我們對圖像執行膨脹。下面我們對 Canny 算子的輸出圖像進行了膨脹。
語法:
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5imgDialation = cv2.dilate(imgCanny,kernel,iterations=1) ##DIALATION
(6) 腐蝕
侵蝕與膨脹正好相反。該算法用于減小圖像中邊緣的大小。首先,我們定義了奇數(5,5)的核矩陣大小。然后使用內核,我們對圖像執行腐蝕。下面我們對 Canny 算子的輸出圖像進行腐蝕處理。
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5imgDialation = cv2.erode(imgCanny,kernel,iterations=1) ##EROSION
現在,在同一個程序中使用上述基本函數處理 Monalisa 圖像。
我們可以使用 OpenCV 繪制不同的形狀,像矩形,圓形,線等。
(1) 長方形:
要在圖像上繪制一個矩形,我們使用 cv2.rectangle 函數。在函數中,我們將寬度、高度、 x、 y、 RGB 中的顏色、深度作為參數傳遞。
語法:
cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS)w: widthh: heightx: distance from x axisy: distance from y axisR,G,B: color in RGB form (255,255,0)THICKNESS: thickness of rectangel(integer)Examplecv2.rectangle(img,(100,300),(200,300),(255,0,255),2)
(2) 圓形:
為了繪制一個圓形,我們使用 cv2.circle 函數。我們傳遞 x,y,半徑大小,RGB 顏色,深度作為參數。
語法:
cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS)x: distance from x axisy: distance from y axisradius: size of radius(integer)R,G,B: color in RGB form (255,255,0)THICKNESS: thickness of rectangel(integer)Examplecv2.circle(img,(200,130),90,(255,255,0),2)
(3) 直線:
要繪制一條直線,我們使用 cv2.line 函數傳遞起始點(x1,y1)、終點(x2,y2)、 RGB 格式的顏色、深度作為參數。
語法:
cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS)x1,y1: start point of line (integer)x2,y2: end point of line (integer)R,G,B: color in RGB form (255,255,0)THICKNESS: thickness of rectangel(integer)Examplecv2.line(img,(110,260),(300,260),(0,255,0),3)
在 OpenCV 中,我們有一個函數 cv2.puttext,用于在特定位置在圖像上寫入文本。它以圖像、文本、 x、 y、顏色、字體、字號、粗細作為輸入參數。
語法:
cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS)img: image to put text ontext: text to put on imageX: text distance from X axisY: text distance from Y axisFONT: Type of FONT (ALL FONT TYPES)FONT_SCALE: Scale of Font(Integer)R,G,B: color in RGB form (255,255,0)THICKNESS: thickness of rectangel(integer)Examplecv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2)
人臉檢測在人臉識別系統中非常有用。在 OpenCV 中,我們有許多預先訓練的 haar 級聯分類器可用于不同的任務。以下網址可以查看 OpenCV GitHub 上的分類器列表:https://github.com/opencv/opencv/tree/master/data/haarca
scades。
我們使用 haarcascade_frontalface_default.xml 分類器來檢測圖像中的人臉。它將返回圖像的四個坐標(w,h,x,y)。使用這些坐標,我們要在臉上畫一個矩形,然后使用相同的坐標,繼續裁剪人臉。最后使用 imwrite,把裁剪后的圖像保存到目錄中。
import cv2# Load the cascadeface_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# Read the input imageimg = cv2.imread('images/img0.jpg')# Convert into grayscalegray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Detect facesfaces = face_cascade.detectMultiScale(gray, 1.3, 4)# Draw rectangle around the facesfor (x, y, w, h) in faces: cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2) # Cropping Face crop_face = img[y:y + h, x:x + w] #Saving Cropped Face cv2.imwrite(str(w) + str(h) + '_faces.jpg', crop_face)cv2.imshow('img', img)cv2.imshow("imgcropped",crop_face)cv2.waitKey()
本文鏈接:http://www.www897cc.com/showinfo-26-35292-0.htmlOpenCV 常用的七個示例:從讀取到人臉檢測(Python版)
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com