人工智能如何使Web更易于訪問
谷歌于2019年推出了Lookout應(yīng)用,通過圖像處理和機(jī)器學(xué)習(xí)相結(jié)合,幫助盲人了解他們的環(huán)境。這是朝著正確方向邁出的一步,應(yīng)該指出其他企業(yè)從道德和商業(yè)角度做正確的事情。畢竟,每天在互聯(lián)網(wǎng)上共享32億張圖像。沒有AI的幫助,殘疾人將無法知道這些圖片的內(nèi)容。
Facebook是第一個通過推出革命性的自動替代文字功能來解決這個問題的社交媒體巨頭,能夠向視障人士和盲人動態(tài)描述圖像。使用神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí),F(xiàn)acebook可以識別圖像中的不同組件,并以驚人的準(zhǔn)確度描述每個組件。再過五到七年,圖像識別軟件將使alt文本過時。已經(jīng)在各個領(lǐng)域?qū)嵤┝藞D像識別,并取得了顯著的成功。大型數(shù)據(jù)庫和可視化站點(diǎn)將其用于自動化圖像組織,而營銷人員依靠該技術(shù)創(chuàng)建交互式品牌活動。
在殘疾人的要求的推動下,人工智能構(gòu)建模塊現(xiàn)在正在組裝,以創(chuàng)建復(fù)雜,創(chuàng)造性的服務(wù),可以改善他們的生活并代表他們完成任務(wù)。了解這些構(gòu)建模塊如何克服殘疾挑戰(zhàn),并有助于提高在線體驗(yàn)的可訪問性:accessiBe是一款基于人工智能的開創(chuàng)性網(wǎng)絡(luò)輔助功能工具,可簡化網(wǎng)站所有者和公司如何使殘障用戶可以訪問其內(nèi)容。它可以為您的所有網(wǎng)站圖像自動和批量創(chuàng)建準(zhǔn)確的替代文字說明,使其可供視障人士使用。
最重要的是,accessiBe的后臺應(yīng)用程序確保該站點(diǎn)的基礎(chǔ)架構(gòu)符合整個WCAG 2.1,這是Web可訪問性法規(guī)的標(biāo)準(zhǔn):啟用單擊選項(xiàng)可為癲癇患者禁用動畫/閃爍等針對有運(yùn)動障礙的人優(yōu)化網(wǎng)站以進(jìn)行鍵盤導(dǎo)航提供內(nèi)置字典,解釋有認(rèn)知障礙的人的表情,俚語和短語。對顏色,字體和排版進(jìn)行細(xì)粒度調(diào)整,以使視障人士可以訪問內(nèi)容基于面部識別的CAPTCHA錄入。
面部識別對于殘疾人來說是一種福音。但它并非缺乏隱私或安全問題。通過分析數(shù)據(jù) - 通常,從不同角度拍攝一張人臉的大量照片 - 人工智能可以假設(shè)誰在鏡頭前。這可以證明在克服與各種環(huán)境中的在線認(rèn)證相關(guān)的挑戰(zhàn)方面是有用的。蘋果公司在2017年使用面部識別技術(shù)解鎖iPhone,而微軟擁有其專有的Hello軟件。這兩種技術(shù)都允許用戶僅使用他們的面部登錄。無需密碼。
盡管存在安全漏洞和限制,面部識別仍然會推翻傳統(tǒng)的CAPTCHA測試,尤其是隨著互聯(lián)網(wǎng)越來越容易被殘疾人使用。一旦系統(tǒng)識別出通過相機(jī)鏡頭與之交互的人,它就可以在平整比賽場地的同時有效地清除機(jī)器人。
研究人員在2018年提出了深度視頻肖像的想法,它使用人工智能編輯演員的面部表情,以便精確匹配配音,從而節(jié)省時間并降低電影業(yè)的成本。該軟件的應(yīng)用還可以糾正視頻會議中的頭部姿勢和凝視,并允許新的視覺和后期制作效果。像這樣的人工智能技術(shù)很快就會使狡猾的字幕成為過去,讓聽障人士可以在線欣賞視頻內(nèi)容。將該計(jì)劃整合到手機(jī)中將允許聽力受損的個人解釋其他人的言論。
Google DeepMind研究了來自各種BBC視頻的超過100,000個自然語句,涵蓋了各種口音,頭部位置,燈光,語速和語言。他們針對Google DeepMind的神經(jīng)網(wǎng)絡(luò)運(yùn)行這些視頻,結(jié)果令人驚訝。雖然最好的唇讀專業(yè)人員僅解釋了12.4%的內(nèi)容,但人工智能的準(zhǔn)確率達(dá)到了驚人的46.8%??紤]一下這種技術(shù)對聽力問題患者生活的影響。他們不僅可以使用在線視頻,而且自動字幕的質(zhì)量和相關(guān)性也會提高。
想一想 - 每天生成2.5個五分之一字節(jié)的數(shù)據(jù),這可能會增加。這使得自動總結(jié)內(nèi)容成為一項(xiàng)嚴(yán)峻的挑戰(zhàn)。對于識字能力低的人來說,情況要困難得多。長篇新聞文章,對話和文檔的摘要可以更快,更有效地消費(fèi)?,F(xiàn)在,在AI的幫助下,這是可能的。自動文本摘要可以包含各種各樣的實(shí)際應(yīng)用程序,包括媒體監(jiān)控,營銷,研究和分析。
例如,Salesforce 在2017年開發(fā)了一種摘要算法。利用機(jī)器學(xué)習(xí)生成較短的文本摘要,該功能可以幫助人們解決記憶問題,注意力缺陷障礙和學(xué)習(xí)障礙,如閱讀障礙。該公司現(xiàn)在已經(jīng)從一個提取模型變?yōu)槌橄竽P停肓诵碌南嚓P(guān)同義詞和單詞并總結(jié)了文本。全世界大量的文化和語言可以在線呈現(xiàn)各種溝通問題。這就是為什么廣泛的研究進(jìn)入建立系統(tǒng),使人們能夠溝通沒有任何語言障礙。
想想谷歌翻譯。當(dāng)然,早期的翻譯充滿了不一致和錯誤。但是,當(dāng)Google推出神經(jīng)機(jī)器翻譯系統(tǒng)時,所有這些都在2016年11月發(fā)生了變化,將錯誤率降低了85%。GNMT還推廣了全球運(yùn)營翻譯的理念,這些翻譯以每句話句子,每個想法為基礎(chǔ)進(jìn)行操作。隨著人工智能獲得更多的特定語言,它可以學(xué)到更多并生成準(zhǔn)確的翻譯。
所有這些都在2017年發(fā)布Google Pixel Buds時達(dá)到了頂峰。耳塞與公司的像素手機(jī)配合使用,可以自動翻譯用戶聽到的內(nèi)容。該技術(shù)實(shí)時工作,支持近40種不同的語言。這對于減少殘疾人的溝通障礙大有幫助。
人工智能技術(shù)的使用為殘疾人提供了新的機(jī)會。它不僅使互聯(lián)網(wǎng)成為一個更容易獲得的空間,而且還可以提供更多的工作場所支持。企業(yè)必須了解人工智能的發(fā)展,如果他們希望避免訴訟,那么殘疾員工可以使用工作場所。人工智能的進(jìn)步將幫助企業(yè)履行法律義務(wù)并支持多元化的用戶群。但是,隨著時間的推移,必須培養(yǎng)易用性和對AI的信任。到那時,互聯(lián)網(wǎng)需要盡一切努力為所有用戶建立一個包容和可訪問的環(huán)境,無論是殘疾人還是非殘疾人。