當前位置:首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用
[導(dǎo)讀] 大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)這個概念聽說過挺久的了,但一直沒有系統(tǒng)了解,由于工作需要,想做點深入了解,于是翻了關(guān)于大數(shù)據(jù)的經(jīng)典之作《大數(shù)據(jù)時代》,猛然發(fā)現(xiàn)這本書出版于2012年,已是七年前的著作了。

 大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)這個概念聽說過挺久的了,但一直沒有系統(tǒng)了解,由于工作需要,想做點深入了解,于是翻了關(guān)于大數(shù)據(jù)的經(jīng)典之作《大數(shù)據(jù)時代》,猛然發(fā)現(xiàn)這本書出版于2012年,已是七年前的著作了。

與大數(shù)據(jù)對應(yīng)的是小數(shù)據(jù),在小數(shù)據(jù)時代,由于技術(shù)條件的限制,人類無法獲取大量的數(shù)據(jù),即便獲取了,也無法快速處理那些數(shù)據(jù),為了解決這一難題,聰明的人類發(fā)明了隨機采樣法。在隨機采樣中,由于一切都是隨機的,它本身就綜合了各種因素,又排除了人為因素,所以它的結(jié)論也大致滿足需求。但是在大數(shù)據(jù)時代,樣本=總體。要所有數(shù)據(jù),不管這數(shù)據(jù)是對的還是錯的,有意的或無意的,有用的還是無用的,全要。一個最簡單的例子是翻譯軟件的發(fā)展,在最開始的版本中,翻譯學(xué)家想要把一切語言規(guī)則都內(nèi)置到軟件中,他們認為這樣軟件就會實現(xiàn)自動翻譯,結(jié)果他們發(fā)現(xiàn)自己得到了一坨屎。

《大數(shù)據(jù)時代》這部書算是易懂的,因為它是從宏觀的角度講了大數(shù)據(jù)時代帶來的思維變革,還有很多豐富詳實的案例,但并不涉及數(shù)據(jù)處理細節(jié)那些瑣碎的東西,所以對于非專業(yè)人士來講讀起來并不困難甚至可以說是有趣的。當下的翻譯軟件則不然,它的“師傅們”不再是一堆語言規(guī)則,而是全世界人民!首先,開發(fā)人員先把館藏雙語對照的書籍植入計算機中,其次每個人每天在網(wǎng)絡(luò)上發(fā)的雙語對話都會被計算機記錄并學(xué)習(xí),目前的計算機已經(jīng)可以實現(xiàn)深度學(xué)習(xí),即不要內(nèi)置規(guī)則,它根據(jù)大量的輸入自己學(xué)習(xí)規(guī)則。

在這個簡單的例子中已經(jīng)彰顯出大數(shù)據(jù)的三個特點:

更多:不是隨機樣本,而是全部數(shù)據(jù);

更雜:不是精確性,而是混雜性;

更好:不是因果關(guān)系,而是相關(guān)關(guān)系。

數(shù)據(jù)主義即只認數(shù)據(jù),唯數(shù)據(jù)是從,極端情況就類似于電影《少數(shù)派報告》所展現(xiàn)的場景了,在電影里有三個人具備預(yù)知能力,警方用他們的超能力實施罪前打擊,當一個人想要犯罪還沒有犯罪的當口抓住他,而在數(shù)據(jù)時代,當一個人奉數(shù)據(jù)為圭臬時,他可能六親不認只認數(shù)據(jù),當數(shù)據(jù)預(yù)測到某人要犯罪時,是直接抓他坐牢還是坐等他犯罪?這是個問題。

首先第一點“要全部數(shù)據(jù)”很好理解,本來就是大數(shù)據(jù)嘛,其次第二點“不是精確性而是混雜性”這點也容易理解,這個世界本來就是混亂的,想要秩序不過是人類的一廂情愿而已,從混亂的世界中得到的數(shù)據(jù)自然也是混亂的、不精確的,但這樣的數(shù)據(jù)才能更真實地反映世界的本來面目,何必追求精確呢?在翻譯軟件的例子中,當計算機去識別網(wǎng)絡(luò)上的語句時,它是無法保證每個人寫的都是正確的,但正是這種多樣性的存在才更能賦予計算機翻譯的智能性。最不好理解也最有爭議的就是第三點,用相關(guān)關(guān)系替代因果關(guān)系。相關(guān)關(guān)系顧名思義,當一種現(xiàn)象發(fā)生變化時,另一種現(xiàn)象隨之改變,這說明兩種現(xiàn)象是相關(guān)的,但這里并不強調(diào)二者之間有什么邏輯上的因果性,因果關(guān)系則不然。

在心理學(xué)上有個第三變量問題,說當兩個現(xiàn)象具有相關(guān)關(guān)系時,人們往往會把它誤當作因果關(guān)系,而忽略第三變量。一個典型的例子是說私立學(xué)校和公立學(xué)校教育水平問題,一般來講,人們只看到私立學(xué)校教出來的學(xué)生更優(yōu)秀就認為他們的教育水平更好,而往往忽略上私立學(xué)校的孩子家庭條件更好,父母的受教育程度更好,而這才是影響孩子學(xué)習(xí)成績的關(guān)鍵因素。

從大數(shù)據(jù)的角度來講,取消因果關(guān)系是明智的,因為當數(shù)據(jù)龐大了以后,想要分析因果關(guān)系勢必登天,因為它牽扯的因素太多了,根本無法分析,更重要的是,人們需要因果關(guān)系嗎?人們只需要知道這件事發(fā)生了以后接下來會發(fā)生什么就足夠了,至于為什么會發(fā)生,誰關(guān)心呢?上帝嗎?關(guān)心這個問題的大概都是哲學(xué)家。哲學(xué)家們會擔心,沒有了因果關(guān)系,人在計算機面前就會像傻子一樣任人擺布,這是一種墮落。但不管如何,大數(shù)據(jù)時代的特點就是這樣,接受它你就邁入了大數(shù)據(jù)時代。在這樣的背景下,數(shù)據(jù)開始值錢了,但也不是說誰有數(shù)據(jù)誰就能雄霸天下。有的公司空有一堆數(shù)據(jù)但不會處理,有的公司知道怎么處理數(shù)據(jù)但卻缺少創(chuàng)新思維,不知道拿來何用。最好的是那些既有數(shù)據(jù)又知道怎么處理數(shù)據(jù)還具備創(chuàng)新思維的公司,但這樣的公司又極易淪為數(shù)據(jù)主義。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉