人工智慧-什麼是卷積神經網路

我們會認識到卷積神經網路的應用和它的基本結構,卷積網路是近些年來逐漸興起的一種人工神經網路的結構,因為利用卷積神經網路,在圖片和語言時,別方面能夠給出更優秀的測試結果,這種技術也被廣泛的傳播和應用卷積神經網路。最常被應用的方面是計算機圖片識別不過因為它的不斷創新,它也被應用在了視頻分析、自然語言處理、樣物發現、等等...

很紅的Alpha Go,讓計算機能看懂圍棋同樣也是運用到了這門技術,舉一個識別圖片的例子,我們知道神經網路是由一連串的神經層組成,每一層神經層裡面存在著很多的神經元,這些神經元也就是神經網路識別事物的關鍵,每一種神經網路都會有它的輸入和輸出值,當輸入值是圖片的時候。實際上,輸入神經網路的並不是那些色彩繽紛的圖案,而是一堆堆的數字,當神經網路需要處裡這麼多輸入訊息的時候,也就是卷積神經網路可以發揮它優勢的時候了。那麼,什麼是卷積神經網路呢?我們先把卷積神經網路這個詞拆開,卷積、和神經網路,卷積也就是說神經網路不再是對每個像素的輸入訊息做處理,而是對圖片上每一小塊像素區域的處理。這種作法加強了圖片訊息的連續性,使得神經網路能看到圖形,而非一個點,這種作法,同時也加深了神經網路對於圖片的理解。
                                                                                               

                                                                                                                                                                             圖1 卷積神經網路

具體來說,卷積神經網路有一個大量分類器,持續不斷的在圖片上,滾動,蒐集圖片裡的訊息,每一次蒐集來的訊息只是蒐集了一小塊像素區域,然後把蒐集來的訊息進行整理,這時候整理出來的訊息有了一些實際上的呈現,比如說,這時的神經網路能看到一些邊緣的圖片訊息。然後,再同樣的步驟用類似的批量過濾器,掃過產生的這些邊緣訊息,神經網路用這些邊緣的訊息,總結出更高層的訊息結構,比如說,總結的邊緣訊息能夠畫出眼睛、鼻子、等等...再經過一次過濾臉部的訊息也從這些眼睛、鼻子的訊息中被總結出來,最後我們再把這些訊息套入幾層普通的全連接類神經網路中進行分類,這樣就能得到輸入的圖片能被分為哪一類的結果了。
                                                                                                                                                    

                                                                                                                                                                        圖2 過濾器



圖片有長、寬、高,三個參數,圖片是有高度的。這裡的高,指的是計算機產生顏色使用的訊息。如果是黑白照片的話,高的單位只有 1,如果是彩色照片的話就可能有紅、綠、藍,三種顏色的訊息。這時的高度為 3,我們以彩色照片為例子,過濾器就是影像中不斷移動的東西,它不斷的在圖片蒐集小區塊的像素塊,蒐集完所有訊息後輸出的值,我們可以理解成一個高度更高,長和寬更小的圖片,這個圖片裡包含了一些邊緣訊息。然後,以同樣的步驟再進行多次卷積,將圖片中的長、寬,再次壓縮,高度再次增加就有了對輸入圖片更深的理解,將壓縮增高的訊息嵌入了普通的分類神經層上,我們就能對這種圖片進行分類了。

                                                                                         
                                                                                                                                                                     圖3 彩色圖片

                                                                     
                                                                                                                                                                               圖4 CNN 神經網路

在每一次卷積的時候,神經層可能會無意的丟失一些訊息,這時池化 pooling就可以很好的解決這樣的一個問題,也就是說再卷積的時候。我們不壓縮長、寬,盡量的保留更多的訊息,壓縮的工作就交給池化 (pooling) 了。這樣的一項附加工作,就能夠很有效的提高準確性,有了這些技術,我們就可以搭建一個屬於我們自己的卷集神經網路了。比較流行的一種搭建結構是這樣地從下到上的順序。首先是輸入的圖片image經過一層卷積層 convolution,然後再用池化 pooling 的方式,處理卷積的訊息這裡使用的是 Max pooling 的方式。然後再經過一次同樣的處理把得到的第二次處理的訊息,傳入兩層全連接的神經層 Fully connected,這也是一般的兩層神經網路層。最後再接上一個分類器 Classifier 進行分類預測,這僅僅是對卷積神經網路。




 

★博文內容均由個人提供,與平台無關,如有違法或侵權,請與網站管理員聯繫。

★文明上網,請理性發言。內容一周內被舉報5次,發文人進小黑屋喔~

評論