基于物聯(lián)網(wǎng)的Cortex-A53智能云鏡系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
0 引 言
隨著物聯(lián)網(wǎng)概念的提出和技術(shù)的發(fā)展,及人們對于物聯(lián) 網(wǎng)的熱衷和市場的走向,各類智能產(chǎn)品已慢慢占據(jù)了日常家居 產(chǎn)品市場,豐富了人們對于智能產(chǎn)品的選擇 [1]。越來越多的貼 近生活的智能產(chǎn)品正在涌現(xiàn),將云計(jì)算技術(shù)應(yīng)用于智能家居產(chǎn) 品設(shè)計(jì)中,也是物聯(lián)網(wǎng)技術(shù)深入居民日常生活的印證 [2]。本文 設(shè)計(jì)與實(shí)現(xiàn)的智能云鏡系統(tǒng)正是順應(yīng)以上趨勢把科技融入生 活的樣品,高度體現(xiàn)了科技以人為本的理念。
1 硬件設(shè)計(jì)
1.1 微處理器
系統(tǒng)微處理器選擇 64 位四核 ARM Cortex-A53 處理 器系列的 BCM2837 芯片。該處理器是 ARMv8 架構(gòu) ARM Cortex-A50 系列產(chǎn)品,其可擴(kuò)展性使 ARM 的合作伙伴能夠針 對智能手機(jī)、高性能服務(wù)器等各類不同市場需求開發(fā)系統(tǒng)級 芯片。Cortex-A53 處理器不僅是功耗效率最高的 ARM 應(yīng)用 處理器,也是全球最小的 64 位處理器。能夠支持所有最新的 ARM GNU/Linux,支持各類音頻、視頻和以太網(wǎng)接口等。
1.2 LCD 顯示屏
7 英 寸 通 用 LCD 電 容 式 觸 摸 顯 示 屏 分 辨 率 可 達(dá) 800×480,可支持常用的系統(tǒng)鏡像,如 Raspberry Pi,Banana Pi 和 Banana Pro 等。另外,該顯示屏支持背光控制,更節(jié)省 電能。本系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)采用靜態(tài)加載對 LCD 屏驅(qū)動(dòng)的支 持,需要在 Linux 內(nèi)核編譯時(shí)進(jìn)行配置。選中設(shè)備驅(qū)動(dòng)選項(xiàng) “Device Drivers ->”進(jìn)入設(shè)備驅(qū)動(dòng)配置界面,選中“Graphics support”進(jìn)入圖形支持選項(xiàng)。進(jìn)入“Support for frame buffer devices”配置界面選擇“LCD init in kernel”選項(xiàng)加入內(nèi)核編 譯就可使內(nèi)核實(shí)現(xiàn)對 LCD 屏驅(qū)動(dòng)的支持,為系統(tǒng)顯示設(shè)備提 供編程接口。LCD 驅(qū)動(dòng)配置界面如圖 1 所示。
1.3 原子鏡
原子鏡又稱單向玻璃或單面鏡,是一種對可見光具有高 反射比的玻璃。透過玻璃的觀察面可以清晰觀察另一側(cè),而 在玻璃的被觀察面只能看到反射的鏡像。原子鏡之所以能產(chǎn) 生以上單面反光的效果,是因?yàn)殓R的兩面處于不同光度的環(huán) 境。本系統(tǒng)利用 LCD 屏幕和原子鏡的疊加實(shí)現(xiàn)“智能云鏡” 的外觀顯示。
1.4 WiFi 模塊
ESP8266 芯片可實(shí)現(xiàn)串口轉(zhuǎn) WiFi 功能,ESP8266 是一 款超低耗通用非同步 WiFi 數(shù)據(jù)收發(fā)器,內(nèi)置 TCP/IP 協(xié)議棧, 支持多路 TCP Client 連接。支持豐富的 Socket AT 指令,透 傳時(shí)的數(shù)據(jù)最大傳輸速率為 460 800 bit/s,傳輸可靠性好。本 系統(tǒng)利用該 WiFi 模塊實(shí)現(xiàn)網(wǎng)絡(luò)服務(wù),利用互聯(lián)網(wǎng)上傳或接收 信息。
1.5 LM393 雙電壓比較器
LM393 是雙電壓比較器集成電路。輸出負(fù)載電阻能銜接 在可允許電源電壓范圍內(nèi)的任何電源電壓上,不受 Vcc 端電壓值的限制。此輸出能作為一個(gè)簡單的對地 SPS 開路(當(dāng)不用負(fù) 載電阻沒被運(yùn)用),輸出部分的陷電流被可能得到的驅(qū)動(dòng)和器 件的 β 值所限制。當(dāng)達(dá)到極限電流(16 mA)時(shí),輸出晶體管 將退出且輸出電壓將很快上升。本系統(tǒng)利用比較器確認(rèn)啟用錄 音功能的時(shí)間,當(dāng)用戶發(fā)出的聲音超過指定分貝時(shí)即表示向系 統(tǒng)發(fā)出語音命令。 本系統(tǒng)還使用了 LM386 功模塊、麥克風(fēng)、紅外傳感 器和繼電器等硬件設(shè)備。
2 軟件設(shè)計(jì)
本系統(tǒng)是一款基于物聯(lián)網(wǎng)技術(shù),利用云平臺(tái)實(shí)現(xiàn)的人機(jī) 交互智能云鏡系統(tǒng),摒棄了傳統(tǒng)鏡子功能的單一性。設(shè)計(jì)方 案基于 WiFi 無線通信技術(shù)實(shí)現(xiàn)物聯(lián)網(wǎng)聯(lián)動(dòng),開發(fā)了 GUI 客戶 端程序。用戶可根據(jù)個(gè)人的生活習(xí)慣或喜好,在照鏡子的同時(shí) 和鏡子交流。系統(tǒng)內(nèi)置了感知組件,可根據(jù)用戶的語音和手勢 動(dòng)作完成指令控制操作。例如,向它提出各種問題,獲得日期、 天氣、新聞、菜譜等常用信息 ;讓它像朋友一樣聊天、講笑話 等。系統(tǒng)還包含了音樂播放和燈光控制功能,利用語音識(shí)別等 方式進(jìn)行控制,實(shí)現(xiàn)了一物多用。本系統(tǒng)選擇 Linux 操作系統(tǒng) 作為開發(fā)環(huán)境,結(jié)合百度語音云和圖靈機(jī)器人開發(fā)實(shí)現(xiàn)。
2.1 百度語音云
語音識(shí)別是指與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什 么。中國物聯(lián)網(wǎng)校企聯(lián)盟形象地把語音識(shí)別比作為“機(jī)器的聽 覺系統(tǒng)”。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語 音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù) [3]。語音合成是通 過機(jī)械、電子方法產(chǎn)生人造語音的技術(shù)。TTS 技術(shù)(又稱文 語轉(zhuǎn)換技術(shù))隸屬于語音合成,它是將計(jì)算機(jī)自己產(chǎn)生的、或 外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚?、流利的漢語口語輸出 技術(shù) [4]。
百度語音是語音技術(shù)、自然語言處理、智能搜索三方面 的完美融合。以更自然的交互方式對用戶所說語言進(jìn)行更準(zhǔn)確 地識(shí)別,只有對用戶需求準(zhǔn)確理解,才能為用戶提供更滿意的 結(jié)果。系統(tǒng)集成語音識(shí)別、語義理解、深度問答、知識(shí)推理、 多輪對話、智能摘要、情感分析、語言生成、語音合成等功能, 能夠滿足用戶的多種復(fù)雜需求。
2.2 圖靈機(jī)器人
圖靈機(jī)器人是在人工智能的核心能力基礎(chǔ)上為開發(fā)人員 提供云計(jì)算和大數(shù)據(jù)平臺(tái)的在線服務(wù)和開發(fā)接口,提供機(jī)器 人和人的文字交互,實(shí)現(xiàn)前端業(yè)務(wù)邏輯的自定義 [5]。圖靈機(jī)器 人能用準(zhǔn)確、簡潔的自然語言回答用戶用自然語言提出的問題, 以方便人們快速、準(zhǔn)確地獲取信息。隨著技術(shù)的進(jìn)步,問答 機(jī)器人目前已能夠處理常識(shí)性、開放性問題及聊天問候等。問 答機(jī)器人能夠給用戶提供非常智能化和人性化的服務(wù),為用戶 帶來極大方便和美好體驗(yàn)。
在本系統(tǒng)中可實(shí)現(xiàn)機(jī)器人昵稱、性別、年齡等身份屬性 設(shè)置,同時(shí)在自有平臺(tái)或產(chǎn)品上完成知識(shí)庫的新增、刪減、更 改編輯以及批量導(dǎo)入等操作。此外還能夠?yàn)槊恳晃皇褂谜叻峙?一個(gè)獨(dú)立機(jī)器人。主要涉及的功能包括聊天對話、問答百科、 生活百科、知識(shí)庫、新聞資訊、成語接龍、故事大全、菜譜大 全、笑話大全、天氣查詢和日期查詢等。
3 系統(tǒng)實(shí)現(xiàn)
3.1 功能模塊設(shè)計(jì)
首先通過 LM393 雙電壓比較器來檢測周圍環(huán)境聲音的 強(qiáng)度,當(dāng)聲音強(qiáng)度達(dá)到預(yù)設(shè)值時(shí),系統(tǒng)啟動(dòng),開始錄音。錄 音結(jié)束后,通過 post 方式向百度語音平臺(tái)請求語音識(shí)別服務(wù), 然后接收反饋數(shù)據(jù)。本系統(tǒng)通過對識(shí)別結(jié)果的分析做出相應(yīng) 的響應(yīng),然后將處理后的文字信息上傳到圖靈平臺(tái),實(shí)現(xiàn)智能 語音的目的。
系統(tǒng)對圖靈平臺(tái)處理后的數(shù)據(jù)進(jìn)行分析,并發(fā)送到百度 語音平臺(tái),請求語音合成服務(wù),再驅(qū)動(dòng)聲卡程序播放合成的聲 音。語言合成功能是在無需本系統(tǒng)處理命令的情況下(如聊天 等)將百度語音合成的文字轉(zhuǎn)交給圖靈處理,圖靈處理完成 后再交給百度語音進(jìn)行合成,待接收到合成后的語音時(shí)即可 用系統(tǒng)的揚(yáng)聲器播放出來。
3.2 主要實(shí)現(xiàn)代碼
圖靈平臺(tái)部分代碼如下:
3.3 系統(tǒng)外觀和內(nèi)部結(jié)構(gòu)圖
系統(tǒng)外觀和內(nèi)部結(jié)構(gòu)如圖 2、圖 3 所示。
4 結(jié) 語
本文主要介紹了在 Linux 操作系統(tǒng)下使用 Cortex-A53 處 理器設(shè)計(jì)實(shí)現(xiàn)的智能云鏡系統(tǒng)。本系統(tǒng)具有良好的交互性, 體現(xiàn)了物聯(lián)網(wǎng)感知層的特定含義。系統(tǒng)實(shí)現(xiàn)了文字、音頻、紅 外等信息的采集和處理?;?a href="/tags/物聯(lián)網(wǎng)" target="_blank">物聯(lián)網(wǎng)技術(shù)把圖靈平臺(tái)與百度語 音巧妙結(jié)合,使一面普通的鏡子有了“生命”,可以跟用戶自由 交流。