摘要:計(jì)算機(jī)的發(fā)展令文字傳播愈發(fā)廣泛,生活中越來(lái)越多的文字需要錄入電腦,以方便轉(zhuǎn)發(fā)、記錄,為此需要耗費(fèi)大量勞動(dòng)力,盡管當(dāng)今已經(jīng)有許多文字識(shí)別錄入方式,但仍難以達(dá)到日常生活中低精度圖片識(shí)別的標(biāo)準(zhǔn)?,F(xiàn)主要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)解決問(wèn)題,輔以區(qū)域識(shí)別,減少圖片本身帶來(lái)的影響,再用多分類方式,實(shí)現(xiàn)部分區(qū)域生成,拆分任務(wù)一一對(duì)應(yīng)識(shí)別,令任務(wù)更加高效。也就是說(shuō),當(dāng)拿到需要處理的圖片后,先將其用不同大小的卷積核處理,進(jìn)行特征的初提取,再將數(shù)據(jù)放入池化層進(jìn)行特征的進(jìn)一步提取,如此往復(fù)循環(huán)后將數(shù)據(jù)進(jìn)行分類,后經(jīng)處理完成識(shí)別。該方法解決了日常生活中書寫文字識(shí)別的部分難點(diǎn),讓文字錄入更為方便高效,減少了大量的時(shí)間浪費(fèi)。
近年來(lái),計(jì)算機(jī)圖形圖像處理技術(shù)獲得突破性的進(jìn)展,個(gè)人PC中也涌現(xiàn)出越來(lái)越多令人驚嘆的圖形處理軟件,憑借著數(shù)學(xué)界領(lǐng)域的最新研究,個(gè)人電腦已經(jīng)開(kāi)始學(xué)會(huì)了“看”圖,讀懂文字
12月4日,深度學(xué)習(xí)算法的發(fā)展,使得人工智能技術(shù)得以廣泛應(yīng)用于生活的各個(gè)領(lǐng)域。 借助圖像識(shí)別、OCR等技術(shù),把一張圖片或書本上的文字,通過(guò)“拍一拍、掃一掃”轉(zhuǎn)化成“電子版”文件,已經(jīng)不是難事。比如百度