AI在廣電有什么價(jià)值
掃描二維碼
隨時(shí)隨地手機(jī)看文章
隨著工作場(chǎng)所中實(shí)時(shí)流式傳輸和點(diǎn)播視頻的使用不斷增長(zhǎng),添加 AI 有望成倍增加視頻的使用以促進(jìn)廣電工作方式以及員工溝通與協(xié)作方面所帶來(lái)的價(jià)值。
人工智能(AI)允許計(jì)算機(jī)模仿人類能力,自動(dòng)化的過(guò)程是指創(chuàng)建能夠執(zhí)行基于流程的任務(wù)而無(wú)須人工干預(yù)。在當(dāng)下,AI的最常見形式是機(jī)器學(xué)習(xí),將大量數(shù)據(jù)“饋送”到算法中以進(jìn)行訓(xùn)練,一旦訓(xùn)練完成,該算法便能在無(wú)輔助的后續(xù)數(shù)據(jù)饋送中對(duì)項(xiàng)目進(jìn)行分類??苹秒娪啊稒C(jī)器人瓦力》中,主角機(jī)器人瓦力的知識(shí)就是通過(guò)看錄像帶獲得的,他把一盤盤的錄像帶吞吐腹中,人類上百年歷史的影像給了瓦力足夠的知識(shí)去追另一個(gè)機(jī)器人女孩。
然而,機(jī)器學(xué)習(xí)的一個(gè)主要缺點(diǎn)是要依賴擁有大量準(zhǔn)確數(shù)據(jù)的樣本。因此,輸入數(shù)據(jù)來(lái)源的質(zhì)量高低,限制著機(jī)器學(xué)習(xí)應(yīng)用的成效。當(dāng)我們提供足夠好的數(shù)據(jù)樣本時(shí),機(jī)器也會(huì)學(xué)習(xí)得聰明些,不然人工智能就會(huì)變成人工愚蠢。
AI應(yīng)用于視頻最相關(guān)的人工智能學(xué)科是“計(jì)算機(jī)視覺”Computer Vision。“計(jì)算機(jī)視覺”是使用人工智能解釋圖像或視頻的視覺元素。計(jì)算機(jī)視覺可以使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)此目標(biāo),是諸如面部識(shí)別和自動(dòng)車輛無(wú)人駕駛等新興技術(shù)應(yīng)用的基礎(chǔ)。事實(shí)證明,教計(jì)算機(jī)像人類一樣處理視覺數(shù)據(jù)比將算法簡(jiǎn)單地連接到相機(jī)要困難得多。挑戰(zhàn)主要來(lái)自于對(duì)人類視覺如何復(fù)制現(xiàn)實(shí)的基本理解,就好比我們看到樹葉發(fā)黃,會(huì)想到秋天來(lái)了天氣變冷了,甚至?xí)行┰?shī)人的情緒出來(lái)??墒菣C(jī)器人識(shí)別樹葉發(fā)黃就是發(fā)黃了,它是不會(huì)有太多情感上的聯(lián)想的,也不會(huì)把樹葉發(fā)黃的事情理解為秋天的到來(lái),更不會(huì)生發(fā)出豐收抑或愁緒的情感。
正因?yàn)橛?jì)算機(jī)視覺目前缺少情緒管理,我們還是比較難在人文創(chuàng)作或者視頻創(chuàng)作上應(yīng)用這項(xiàng)技術(shù)。科學(xué)家們一直試圖實(shí)現(xiàn)AI人文理解上的突破。十年前我在英國(guó)學(xué)習(xí)時(shí)的室友就是將計(jì)算機(jī)視覺應(yīng)用到宗教研究的博士后,他的課題是讓計(jì)算機(jī)閱讀學(xué)習(xí)歐洲各大教堂的宗教名畫,讓計(jì)算機(jī)能夠刻畫出上帝的真正形象(聽上去很不靠譜的感覺,但這真是人工智能的博士后研究項(xiàng)目)。而央視這次國(guó)慶閱兵也推出了AI剪輯,相關(guān)人士介紹該剪輯就是讓機(jī)器學(xué)習(xí)前幾次閱兵的鏡頭剪輯規(guī)律,讓機(jī)器自動(dòng)剪片,大大節(jié)省了人力。
我們需要了解視頻AI的基石有哪些,能在多大程度上影響廣電業(yè)的發(fā)展和視頻技術(shù)的成長(zhǎng)。很多時(shí)候我們把視頻當(dāng)成活動(dòng)的照片,畢竟我們定義視頻也是每秒多少?gòu)垐D片的連續(xù)動(dòng)畫。但除去影像,語(yǔ)音其實(shí)是視頻的重要組成部分,人工智能可以通過(guò)多種方式幫助解釋、演繹語(yǔ)音:人工智能早期的例子之一是機(jī)器轉(zhuǎn)錄,其中的算法能夠?qū)⒄Z(yǔ)音數(shù)據(jù)解釋轉(zhuǎn)換為文本記錄。這項(xiàng)技術(shù)現(xiàn)在很普遍,甚至已經(jīng)在我們的智能手機(jī)中大量使用,更由于深度學(xué)習(xí)新技術(shù)的出現(xiàn),正在實(shí)現(xiàn)復(fù)興。我一好友在一家得到文化基金投資的創(chuàng)業(yè)公司工作,他們的產(chǎn)品就是利用人工智能轉(zhuǎn)錄技術(shù)將記者外采的視頻語(yǔ)音轉(zhuǎn)化成文字稿,提供給后期編輯撰稿使用。
口語(yǔ)單詞被消化成文本數(shù)據(jù)后,便會(huì)解鎖其他功能,例如翻譯成其他語(yǔ)言。谷歌是人工智能領(lǐng)域的先驅(qū)之一,其于2006年首次使用聯(lián)合國(guó)和歐洲議會(huì)的筆錄作為基礎(chǔ)語(yǔ)言數(shù)據(jù),啟動(dòng)了機(jī)器翻譯服務(wù),當(dāng)下谷歌支持100多種語(yǔ)言,每天服務(wù)5億人。我周邊很多視頻制作者們都在使用一個(gè)人工智能平臺(tái),它能輕松地對(duì)視頻里的語(yǔ)言進(jìn)行識(shí)別翻譯,所以很多朋友用它并非是翻譯視頻,而是制作母語(yǔ)視頻字幕。
現(xiàn)在的虛擬主持人已經(jīng)在應(yīng)用一些人工智能技術(shù),可以想象未來(lái)這些主持人說(shuō)的也不一定是我們的母語(yǔ),很可能是說(shuō)外語(yǔ)的主持人。
人工智能的應(yīng)用正變得越來(lái)越普遍,人工智能無(wú)疑可為廣電制作帶來(lái)價(jià)值。隨著工作場(chǎng)所中實(shí)時(shí)流式傳輸和點(diǎn)播視頻的使用不斷增長(zhǎng),添加AI有望成倍增加視頻的使用以促進(jìn)廣電工作方式以及員工溝通與協(xié)作方面所帶來(lái)的價(jià)值。
來(lái)源:搜狐