當你打開互聯(lián)網(wǎng)搜索引擎,輸入關鍵詞尋找并得到想要的鏈接時,“機器學習”已經(jīng)貫穿整個過程:搜索到的內(nèi)容是機器根據(jù)無數(shù)人搜索關鍵詞的統(tǒng)計結(jié)果,返回的最可能被需要的目標信息;而同時,你的這一次搜索行為也已經(jīng)被機器記錄,加入到它的龐大無比的數(shù)據(jù)庫中,用來了解人的搜索習慣和需求。
隨著計算機與網(wǎng)絡的飛速發(fā)展,機器學習作用越來越大,正在改變著我們的生活和工作?;ヂ?lián)網(wǎng)搜索、在線廣告、機器翻譯、手寫識別、垃圾郵件過濾等等都是以機器學習為核心技術的。
微軟亞洲研究院互聯(lián)網(wǎng)搜索與挖掘組高級研究員李航博士介紹說,機器學習是關于計算機基于數(shù)據(jù)構(gòu)建模型并運用模型來模擬人類智能活動的一門學科。機器學習實際上體現(xiàn)了計算機向智能化發(fā)展的必然趨勢?,F(xiàn)在當人們提到機器學習時,通常是指統(tǒng)計機器學習或統(tǒng)計學習。實踐表明,統(tǒng)計機器學習是實現(xiàn)計算機智能化這一目標的最有效手段。
機器學習最大的優(yōu)點是它具有泛化能力,也就是可以舉一反三。無論是在什么樣的圖片中,甚至是在抽象畫中,人們能夠輕而易舉地找出其中的人臉,這種能力就是泛化能力。
當然,統(tǒng)計學習的預測準確率不能保證100%。
李航說,機器學習是“鄉(xiāng)下人”的辦法。有個笑話。一個鄉(xiāng)下人進城,到餐館吃飯,不知如何在餐館用餐,就模仿旁邊的人。別人做什么,他也就學著做什么。鄰桌的一位故意戲弄他,將桌上的蠟燭卷在餅里,趁鄉(xiāng)下人不注意時把蠟燭扔到地上,然后咬了一口卷著的餅。鄉(xiāng)下人也跟著學,大咬了一口自己的餅。機器學習只是根據(jù)觀測,“模仿”人的智能行為,有時能夠顯得非常智能化。但如果觀測不到關鍵的特征,它就會去“咬卷著蠟燭的餅”。
據(jù)調(diào)查,60%的互聯(lián)網(wǎng)用戶每天至少使用一次搜索引擎,90%的互聯(lián)網(wǎng)用戶每周至少使用一次搜索引擎。搜索引擎大大提高了人們工作、學習以及生活的質(zhì)量。而互聯(lián)網(wǎng)搜索的基本技術中,機器學習占據(jù)著重要的位置。