|
不好山寨,因為這個核心難點并不是視覺,,而是機器學(xué)習(xí),,可能這么說太籠統(tǒng)了和沒說一樣,,那舉個例子吧,先說視覺,,假如一條流水線上所有的產(chǎn)品都要打上商標(biāo)“機械論壇”四個字,,其中一道工序是視覺做檢測看是否每個產(chǎn)品有疏漏商標(biāo),那么實現(xiàn)過程是這樣的,,先隨便取一個樣本做標(biāo)準(zhǔn),,拍照,提取圖片中的有效像素(中間提取過程的灰白處理,,降噪,,濾波等各種過程由代碼完成,類似于雕塑家去掉那些沒有的部分形成美麗的石雕差不多),,最后會得到四幅圖,,“機”“械”“論”“壇”,然后做字符訓(xùn)練,,“機”="機",,“械”=“械”,“論”=“論”,,“壇”=“壇”,,你看著可能覺得我在寫廢話,那是因為你是人,,你看著都一樣,,計算機不知道啊,紅色加大字體是視覺提取到的有效像素,,后面的常規(guī)黑色字體才是我們認(rèn)的字符,,字符訓(xùn)練后,下次拍照提取后的有效像素跟標(biāo)準(zhǔn)樣本對比,,達(dá)到了預(yù)訂的相似度就是“是”,,否則就是“否”,然后輸出結(jié)果,,視覺識別過程差不多就這樣,,他有個硬傷,那就是一旦物品傾斜什么的,,或者光線強弱變化大,,雖然也能拍出來機械論壇四個字,但是相似度差遠(yuǎn)了,,相機識別就會誤判,,說了半天,上面這些就是機器視覺,,現(xiàn)在說機器學(xué)習(xí),,機器學(xué)習(xí)的視覺不變(也有可能略有不同),,還是之前的視覺,只不過加了算法,,這樣的話,,每多識別一個產(chǎn)品,這個識別過的產(chǎn)品就傳到他的樣本庫里面了,,他的可參考的依據(jù)就多了,,這樣越工作,它就越來越準(zhǔn),,這也就是為什么阿拉法狗對戰(zhàn)越多,,戰(zhàn)力就越高的原因,當(dāng)然,,那個應(yīng)該是深度學(xué)習(xí),,這么高端,涉及各種復(fù)雜的矩陣運算的實現(xiàn)過程我這種渣渣肯定不會,,不知道我這么說對你理解機器視覺和機器學(xué)習(xí)的區(qū)別有沒有一點點幫助,,如果我哪里表達(dá)不清,你指出來,,我盡量表達(dá)清楚,,不過蹩腳的水平估計也說不出個啥來
|
評分
-
查看全部評分
|