AI在廣電有什么價(jià)值

時(shí)間：2020-05-19 13:33:01

關(guān)鍵字： AI 計(jì)算機(jī)視覺機(jī)器學(xué)習(xí) 機(jī)器人

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 隨著工作場(chǎng)所中實(shí)時(shí)流式傳輸和點(diǎn)播視頻的使用不斷增長(zhǎng)，添加 AI 有望成倍增加視頻的使用以促進(jìn)廣電工作方式以及員工溝通與協(xié)作方面所帶來(lái)的價(jià)值。人工智能（AI）允許計(jì)算機(jī)模仿人類能力，自動(dòng)

隨著工作場(chǎng)所中實(shí)時(shí)流式傳輸和點(diǎn)播視頻的使用不斷增長(zhǎng)，添加 AI 有望成倍增加視頻的使用以促進(jìn)廣電工作方式以及員工溝通與協(xié)作方面所帶來(lái)的價(jià)值。

人工智能（AI）允許計(jì)算機(jī)模仿人類能力，自動(dòng)化的過(guò)程是指創(chuàng)建能夠執(zhí)行基于流程的任務(wù)而無(wú)須人工干預(yù)。在當(dāng)下，AI的最常見形式是機(jī)器學(xué)習(xí)，將大量數(shù)據(jù)“饋送”到算法中以進(jìn)行訓(xùn)練，一旦訓(xùn)練完成，該算法便能在無(wú)輔助的后續(xù)數(shù)據(jù)饋送中對(duì)項(xiàng)目進(jìn)行分類?？苹秒娪啊稒C(jī)器人瓦力》中，主角機(jī)器人瓦力的知識(shí)就是通過(guò)看錄像帶獲得的，他把一盤盤的錄像帶吞吐腹中，人類上百年歷史的影像給了瓦力足夠的知識(shí)去追另一個(gè)機(jī)器人女孩。

然而，機(jī)器學(xué)習(xí)的一個(gè)主要缺點(diǎn)是要依賴擁有大量準(zhǔn)確數(shù)據(jù)的樣本。因此，輸入數(shù)據(jù)來(lái)源的質(zhì)量高低，限制著機(jī)器學(xué)習(xí)應(yīng)用的成效。當(dāng)我們提供足夠好的數(shù)據(jù)樣本時(shí)，機(jī)器也會(huì)學(xué)習(xí)得聰明些，不然人工智能就會(huì)變成人工愚蠢。

AI應(yīng)用于視頻最相關(guān)的人工智能學(xué)科是“計(jì)算機(jī)視覺”Computer Vision。“計(jì)算機(jī)視覺”是使用人工智能解釋圖像或視頻的視覺元素。計(jì)算機(jī)視覺可以使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)此目標(biāo)，是諸如面部識(shí)別和自動(dòng)車輛無(wú)人駕駛等新興技術(shù)應(yīng)用的基礎(chǔ)。事實(shí)證明，教計(jì)算機(jī)像人類一樣處理視覺數(shù)據(jù)比將算法簡(jiǎn)單地連接到相機(jī)要困難得多。挑戰(zhàn)主要來(lái)自于對(duì)人類視覺如何復(fù)制現(xiàn)實(shí)的基本理解，就好比我們看到樹葉發(fā)黃，會(huì)想到秋天來(lái)了天氣變冷了，甚至?xí)行┰?shī)人的情緒出來(lái)?？墒菣C(jī)器人識(shí)別樹葉發(fā)黃就是發(fā)黃了，它是不會(huì)有太多情感上的聯(lián)想的，也不會(huì)把樹葉發(fā)黃的事情理解為秋天的到來(lái)，更不會(huì)生發(fā)出豐收抑或愁緒的情感。

正因?yàn)橛?jì)算機(jī)視覺目前缺少情緒管理，我們還是比較難在人文創(chuàng)作或者視頻創(chuàng)作上應(yīng)用這項(xiàng)技術(shù)。科學(xué)家們一直試圖實(shí)現(xiàn)AI人文理解上的突破。十年前我在英國(guó)學(xué)習(xí)時(shí)的室友就是將計(jì)算機(jī)視覺應(yīng)用到宗教研究的博士后，他的課題是讓計(jì)算機(jī)閱讀學(xué)習(xí)歐洲各大教堂的宗教名畫，讓計(jì)算機(jī)能夠刻畫出上帝的真正形象（聽上去很不靠譜的感覺，但這真是人工智能的博士后研究項(xiàng)目）。而央視這次國(guó)慶閱兵也推出了AI剪輯，相關(guān)人士介紹該剪輯就是讓機(jī)器學(xué)習(xí)前幾次閱兵的鏡頭剪輯規(guī)律，讓機(jī)器自動(dòng)剪片，大大節(jié)省了人力。

我們需要了解視頻AI的基石有哪些，能在多大程度上影響廣電業(yè)的發(fā)展和視頻技術(shù)的成長(zhǎng)。很多時(shí)候我們把視頻當(dāng)成活動(dòng)的照片，畢竟我們定義視頻也是每秒多少?gòu)垐D片的連續(xù)動(dòng)畫。但除去影像，語(yǔ)音其實(shí)是視頻的重要組成部分，人工智能可以通過(guò)多種方式幫助解釋、演繹語(yǔ)音：人工智能早期的例子之一是機(jī)器轉(zhuǎn)錄，其中的算法能夠?qū)⒄Z(yǔ)音數(shù)據(jù)解釋轉(zhuǎn)換為文本記錄。這項(xiàng)技術(shù)現(xiàn)在很普遍，甚至已經(jīng)在我們的智能手機(jī)中大量使用，更由于深度學(xué)習(xí)新技術(shù)的出現(xiàn)，正在實(shí)現(xiàn)復(fù)興。我一好友在一家得到文化基金投資的創(chuàng)業(yè)公司工作，他們的產(chǎn)品就是利用人工智能轉(zhuǎn)錄技術(shù)將記者外采的視頻語(yǔ)音轉(zhuǎn)化成文字稿，提供給后期編輯撰稿使用。

口語(yǔ)單詞被消化成文本數(shù)據(jù)后，便會(huì)解鎖其他功能，例如翻譯成其他語(yǔ)言。谷歌是人工智能領(lǐng)域的先驅(qū)之一，其于2006年首次使用聯(lián)合國(guó)和歐洲議會(huì)的筆錄作為基礎(chǔ)語(yǔ)言數(shù)據(jù)，啟動(dòng)了機(jī)器翻譯服務(wù)，當(dāng)下谷歌支持100多種語(yǔ)言，每天服務(wù)5億人。我周邊很多視頻制作者們都在使用一個(gè)人工智能平臺(tái)，它能輕松地對(duì)視頻里的語(yǔ)言進(jìn)行識(shí)別翻譯，所以很多朋友用它并非是翻譯視頻，而是制作母語(yǔ)視頻字幕。

現(xiàn)在的虛擬主持人已經(jīng)在應(yīng)用一些人工智能技術(shù)，可以想象未來(lái)這些主持人說(shuō)的也不一定是我們的母語(yǔ)，很可能是說(shuō)外語(yǔ)的主持人。

人工智能的應(yīng)用正變得越來(lái)越普遍，人工智能無(wú)疑可為廣電制作帶來(lái)價(jià)值。隨著工作場(chǎng)所中實(shí)時(shí)流式傳輸和點(diǎn)播視頻的使用不斷增長(zhǎng)，添加AI有望成倍增加視頻的使用以促進(jìn)廣電工作方式以及員工溝通與協(xié)作方面所帶來(lái)的價(jià)值。

來(lái)源：搜狐