機(jī)器視覺(jué):深度學(xué)習(xí)解決零售或教育方面的問(wèn)題
在過(guò)去的五年或十年里,隨著深度學(xué)習(xí)的出現(xiàn),我們對(duì)這個(gè)問(wèn)題有了不同的方法。它更多的是數(shù)據(jù)驅(qū)動(dòng),而不是代碼或算法設(shè)計(jì)驅(qū)動(dòng)。
深度學(xué)習(xí)的想法是,我們有一種算法,它是一種學(xué)習(xí)機(jī)器。因此,我們擁有這種通用的學(xué)習(xí)結(jié)構(gòu),而不是在算法中規(guī)定步驟來(lái)解決特定問(wèn)題。我們所做的是,我們展示了很多例子。這是一個(gè)戴著面具的人;這是一個(gè)沒(méi)有面具的人。這里有10,000個(gè)不同情況和方向的戴著口罩的人;這里有 10,000 人沒(méi)有戴口罩。
這些算法的非凡之處在于它們能夠?qū)W習(xí)。這有點(diǎn)像展示和講述之間的區(qū)別。如果您考慮教孩子系鞋帶。如果你試圖一步一步地描述這個(gè)過(guò)程,你永遠(yuǎn)不會(huì)成功。不可能。所以沒(méi)有人這樣做。我們發(fā)現(xiàn)那行不通。如果你想教孩子如何系鞋帶或做一些類似的任務(wù),你就是在示范。甚至可能更進(jìn)一步,引導(dǎo)他們完成這些步驟;你握著他們的手給他們看:你把這個(gè)放在這個(gè)下面,把這個(gè)繞在這里。令人驚奇的是:孩子可以學(xué)習(xí)!
事實(shí)證明,這些深度學(xué)習(xí)算法在通過(guò)示例而不是通過(guò)詳細(xì)的處方來(lái)學(xué)習(xí)的能力方面同樣令人驚嘆。很難夸大這種范式轉(zhuǎn)變的重要性,它使我們能夠解決我們想要從圖像或視頻中提取信息的各種現(xiàn)實(shí)世界問(wèn)題,而這些問(wèn)題并不是像我們所在的生產(chǎn)線那樣控制良好、一致的環(huán)境在某些預(yù)定位置尋找一定數(shù)量的螺栓。
所以現(xiàn)在我們其實(shí)可以很好的解決街上走過(guò)的人戴不戴口罩這樣的問(wèn)題?
我最近遇到的另一個(gè)非常酷的應(yīng)用程序,他們稱之為 Night Nurse。它來(lái)自一家名為 Kepler Vision 的荷蘭初創(chuàng)公司。它用于老年護(hù)理設(shè)施,例如,如果一位老年患者晚上從床上掉下來(lái),系統(tǒng)所做的是,它使用安裝在天花板上的攝像頭,它不僅分析單個(gè)圖像幀,而且分析序列框架,以了解人的行為并能夠區(qū)分正常行為(例如有人起身去洗手間)和異?;蛭kU(xiǎn)行為(例如人從床上掉下來(lái))。因此,護(hù)士不必在晚上經(jīng)常檢查病人并可能打擾他們的睡眠,系統(tǒng)可以持續(xù)監(jiān)控并在病人有危險(xiǎn)時(shí)立即提醒護(hù)士。
這是一種混亂的現(xiàn)實(shí)世界問(wèn)題。我說(shuō)“凌亂”是因?yàn)槟闳绾斡梦淖只驍?shù)字術(shù)語(yǔ)來(lái)描述一個(gè)人比方說(shuō)起床并移動(dòng)到附近的椅子上并坐在那把椅子上與從床上掉下來(lái)之間的區(qū)別。當(dāng)你看到它時(shí)你就知道它,但是用精確的方式用語(yǔ)言描述它是非常困難的。因此,這是深度學(xué)習(xí)的出現(xiàn)使我們能夠有效解決傳統(tǒng)手工算法技術(shù)無(wú)法解決的各種現(xiàn)實(shí)問(wèn)題的一個(gè)例子。
這是過(guò)去五年左右發(fā)生的一個(gè)巨大變化,這種轉(zhuǎn)變是從 1960 年代計(jì)算機(jī)視覺(jué)方法的手工算法到幾年前的轉(zhuǎn)變。現(xiàn)在,這種數(shù)據(jù)驅(qū)動(dòng)的、基于機(jī)器學(xué)習(xí)的方法。這是發(fā)生變化并創(chuàng)造了很多機(jī)會(huì)和興奮的重大事件之一。
我認(rèn)為當(dāng)技術(shù)是新技術(shù)或變化迅速時(shí),找出應(yīng)用它的地方總是一個(gè)挑戰(zhàn)。它真正有意義的地方在哪里?真正能增值在哪里?就深度神經(jīng)網(wǎng)絡(luò)而言,有很多關(guān)于它的炒作和興奮。人們渴望使用它。但是很容易選擇錯(cuò)誤的問(wèn)題,選擇一個(gè)實(shí)際上沒(méi)有必要的問(wèn)題,其中 DNN 是不必要的,經(jīng)典技術(shù)工作正常,所以你只是在浪費(fèi)時(shí)間和金錢?;蛘哌x擇當(dāng)前技術(shù)無(wú)法解決且無(wú)法解決的問(wèn)題。
所以我認(rèn)為真正歸結(jié)為,人們需要學(xué)習(xí)。他們需要學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò);他們的能力;他們不能做什么;他們前進(jìn)的軌跡是怎樣的,他們的演變是怎樣的;以及如何識(shí)別具有適當(dāng)難度的適當(dāng)問(wèn)題。既不太容易(也可以用經(jīng)典技術(shù)解決,而且可能已經(jīng)解決)也不太難(仍然是一個(gè)研究問(wèn)題,商業(yè)部署技術(shù)并不能真正解決這個(gè)問(wèn)題)。
這不是我認(rèn)為可以在文檔中總結(jié)的內(nèi)容。我認(rèn)為這確實(shí)需要深入了解技術(shù)的當(dāng)前狀態(tài),然后查看您的應(yīng)用程序領(lǐng)域。老年護(hù)理或家庭安全或制造或車輛交通優(yōu)化。無(wú)論您的應(yīng)用領(lǐng)域是什么。一旦你了解了技術(shù)的狀態(tài),然后將其映射到最佳問(wèn)題,在那里它可以增加最大的價(jià)值并且實(shí)施起來(lái)也很實(shí)用。
所以這就是我認(rèn)為意識(shí)教育如此重要的地方。電子行業(yè)各個(gè)領(lǐng)域的人都需要了解這項(xiàng)技術(shù)。不一定要掌握它的每一個(gè)細(xì)節(jié),而是要了解它能做什么,能干什么。
做到這一點(diǎn)的另一個(gè)好方法是看看其他人在做什么。其他公司和產(chǎn)品開(kāi)發(fā)商在哪些方面成功使用了該技術(shù)?然后將其映射到,如果他們能夠解決醫(yī)療保健方面的問(wèn)題,我想我可以解決零售或教育方面的問(wèn)題。