百度著力于機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘 已成立興趣小組
掃描二維碼
隨時(shí)隨地手機(jī)看文章
互聯(lián)網(wǎng)的飛速發(fā)展使其成為全球信息傳播和共享的重要資源,互聯(lián)網(wǎng)上的數(shù)據(jù)也呈幾何級數(shù)增長,然而要從互聯(lián)網(wǎng)上獲取有用的知識卻變得非常困難,“數(shù)據(jù)爆炸,知識貧乏”已成為當(dāng)下迫切需要解決的問題。而機(jī)器學(xué)習(xí)將會(huì)是解決這些問題的技術(shù)利器,它對海量的數(shù)據(jù)挖掘可以說是意義非凡。中國百分之九十五的網(wǎng)民都是百度的用戶,數(shù)億網(wǎng)民每天的搜索數(shù)據(jù)形成了龐大數(shù)據(jù)庫,這正是機(jī)器學(xué)習(xí)和數(shù)據(jù)訓(xùn)練的重要基石。
百度作為全球最大的中文搜索引擎在逐步的數(shù)據(jù)積累中也愈來愈發(fā)現(xiàn)機(jī)器學(xué)習(xí)的重要性,近些年來百度吸納了不少機(jī)器學(xué)習(xí)領(lǐng)域的專家學(xué)者參與百度的技術(shù)開發(fā)。例如,百度開發(fā)的識圖功能,就運(yùn)用到了機(jī)器學(xué)習(xí)的相關(guān)技術(shù),用戶只要將想要檢索的圖片上傳到搜索引擎中,便可以看到非常精確的搜索結(jié)果,包括給出了與該圖片相似的各種臉部特寫圖片以及完整圖,雖然不是完全正確但也是相當(dāng)了不起了。
其實(shí),計(jì)算機(jī)看到的圖片不僅僅是成百上千的像素,其需要從中分析顏色,亮度,從而進(jìn)行圖片的特征提取,對來自互聯(lián)網(wǎng)的幾百億張圖片進(jìn)行實(shí)時(shí)的圖像特征匹配,從而更加快速的反饋用戶相關(guān)的搜索結(jié)果,這些都需要大數(shù)據(jù)背景下機(jī)器學(xué)習(xí)等技術(shù)作為堅(jiān)實(shí)的后盾。而數(shù)據(jù)挖掘技術(shù)又是大數(shù)據(jù)背景下機(jī)器學(xué)習(xí)應(yīng)用的另一個(gè)重要領(lǐng)域。
雖然,近些年很多專家學(xué)者正在積極的進(jìn)行著機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的研究,但是由于缺乏海量的數(shù)據(jù)資源做支撐以及更多的計(jì)算資源去支撐這些海量數(shù)據(jù)的運(yùn)算,加之溝通范圍的限制和對某些專業(yè)的領(lǐng)域了解的有限,導(dǎo)致很多研究無法深入的進(jìn)行下去,百度校園為了解決這個(gè)問題,正式成立了“機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘興趣小組”,歡迎相關(guān)領(lǐng)域的專家學(xué)者以及對此類技術(shù)有濃厚興趣的人士登陸加入到我們的興趣小組中來,這里將會(huì)是一個(gè)頭腦風(fēng)暴和資源共享的集結(jié)地。
百度校園在活動(dòng)網(wǎng)站專門設(shè)置了“資料共享”欄目,提供相關(guān)的學(xué)術(shù)文章下載,為了拓寬學(xué)生的學(xué)習(xí)和研究視野,百度校園還在近期公布了“中國云”程序互聯(lián)網(wǎng)大賽一等獎(jiǎng)源代碼,讓更多有此方面需要的同學(xué)們可以共享獲獎(jiǎng)?wù)叩闹橇Τ晒云趯ν瑢W(xué)們的學(xué)習(xí)研究有一定的指導(dǎo)和參考作用。當(dāng)然大家也可以將自己的數(shù)據(jù)挖掘算法移植到這里,讓更多人來共享你的算法成果。除了共享資源大家還可以就推薦算法、聚類算法、分類算法等相關(guān)的專業(yè)技術(shù)進(jìn)行學(xué)術(shù)探討,你也可以將遇到的問題發(fā)布出來,讓大家群策群力幫你一起解決。
除此之外,百度在還提供了云計(jì)算平臺(tái),300多臺(tái)服務(wù)器的計(jì)算平臺(tái)可以幫大家解決之前未能觸及的計(jì)算資源;在這里,擁有海量真實(shí)的大數(shù)據(jù),你不會(huì)再遭遇因?yàn)槿狈?shù)據(jù)資源而無法開展研究的尷尬境地。今后,百度校園還會(huì)針對“推薦算法”和“圖像處理”等方向陸續(xù)在平臺(tái)上發(fā)布一些競賽活動(dòng),屆時(shí)歡迎感興趣的同學(xué)踴躍的參與進(jìn)來!