摘要:計算機(jī)的發(fā)展令文字傳播愈發(fā)廣泛,生活中越來越多的文字需要錄入電腦,以方便轉(zhuǎn)發(fā)、記錄,為此需要耗費大量勞動力,盡管當(dāng)今已經(jīng)有許多文字識別錄入方式,但仍難以達(dá)到日常生活中低精度圖片識別的標(biāo)準(zhǔn)。現(xiàn)主要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)解決問題,輔以區(qū)域識別,減少圖片本身帶來的影響,再用多分類方式,實現(xiàn)部分區(qū)域生成,拆分任務(wù)一一對應(yīng)識別,令任務(wù)更加高效。也就是說,當(dāng)拿到需要處理的圖片后,先將其用不同大小的卷積核處理,進(jìn)行特征的初提取,再將數(shù)據(jù)放入池化層進(jìn)行特征的進(jìn)一步提取,如此往復(fù)循環(huán)后將數(shù)據(jù)進(jìn)行分類,后經(jīng)處理完成識別。該方法解決了日常生活中書寫文字識別的部分難點,讓文字錄入更為方便高效,減少了大量的時間浪費。
近年來,計算機(jī)圖形圖像處理技術(shù)獲得突破性的進(jìn)展,個人PC中也涌現(xiàn)出越來越多令人驚嘆的圖形處理軟件,憑借著數(shù)學(xué)界領(lǐng)域的最新研究,個人電腦已經(jīng)開始學(xué)會了“看”圖,讀懂文字
12月4日,深度學(xué)習(xí)算法的發(fā)展,使得人工智能技術(shù)得以廣泛應(yīng)用于生活的各個領(lǐng)域。 借助圖像識別、OCR等技術(shù),把一張圖片或書本上的文字,通過“拍一拍、掃一掃”轉(zhuǎn)化成“電子版”文件,已經(jīng)不是難事。比如百度