首頁 > 評測 > One to Many-多核心編程初探——CY8CKIT-062-BLE評測之二

One to Many-多核心編程初探——CY8CKIT-062-BLE評測之二

  • 作者:
  • 來源:21ic
  • [導讀]
  • 任務分配與同步是多核編程的最重要問題

image1_copy.jpg

圖 任務分配與同步是多核編程的最重要問題

多核心與并行概述

Single core processors are a shrinking minority of all the processors in the world. Multicore processors, offering parallel computing, have displaced single core processors permanently. The future of computing is parallel computing, and the future of programming is parallel programming.

-James Reinders. from Intel

為英文不熟的同學翻譯一下子:

單核處理器是處理器世界中正在不斷縮減規(guī)模的少數(shù)群體.多核處理器因為能夠提供并行計算,正在永久性地替代單核處理器的地位.未來的計算將是并行計算的天下,未來的編程亦將是并行編程的天下.

因為說這話的人是Intel的工程師,所以嵌入式系統(tǒng)的工程師聽起來多多少少可能覺得未免危言聳聽了.但是從過去幾十年的科技發(fā)展經(jīng)驗來看,嵌入式系統(tǒng)的發(fā)展總是慢慢會跟隨桌面計算,服務器計算的道路,只是稍稍慢那么一拍而已.考慮到硬件的發(fā)展速度終將不能以摩爾速度無限制的發(fā)展下去,多核與并行的概念引入在嵌入式系統(tǒng)中可能比大多數(shù)人預計的要更早一些吧.作者本人也覺得如同OS概念一樣,多核與并行的概念在嵌入式系統(tǒng)上與桌面/服務器系統(tǒng)上僅僅只是規(guī)模上的差別,不存在本質(zhì)的區(qū)別.

目前而言,作者認為嵌入式系統(tǒng)的多核與桌面/服務器系統(tǒng)的多核有以下顯著的差別:

1. 相對而言,嵌入式系統(tǒng)對運算的要求不是那么苛刻,所以數(shù)學運算方面的庫函數(shù)暫時無需特別定制的并行版本;

2. 因為嵌入式系統(tǒng)的多核心多采用big-LITTLE的非對稱架構(gòu),故此一般有一個核心為主,其余核心都屬于從,比較類似于協(xié)處理器的概念,但是與FPU等協(xié)處理器不同的是這些從核心自主性都很高;

3. 因為上述的big-LITTLE的架構(gòu),故此任務的分配上從算法上來講要簡單一些,但是與硬件耦合較為緊密;所以目前桌面/服務器系統(tǒng)上的多核框架如OpenMP,OpenCL還不能簡單的搬來利用;

4. 操作系統(tǒng)中的thread概念一般被認為是并行編程的低級別并行,桌面/服務器系統(tǒng)中目前的趨勢是拋棄thread這種低級操作,直接使用高級并行框架如OpenMP,Clik Plus等等將整個系統(tǒng)看作一個整體,由框架來分配任務.嵌入式系統(tǒng)對應thread的是各種RTOS的task,這種低等級的并行操作的標準度很低.所以如何將整個嵌入式處理器視作一個整體來隱式進行并行編程可能是最后完成的任務.

我們看一個例子:

 

TIM截圖20180123164326.jpg

 

這段代碼在桌面計算機中以注釋中的命令行build之后運行:

Hello, world.

Hello, world.

Hello, world.

Hello, world.

這是Open MP架構(gòu)與工具鏈結(jié)合,將受控語句分別分配給四個核心(作者的實驗電腦)運行.這個例子如果使用thread來做,創(chuàng)建多個thread,那么移植到嵌入式平臺就好辦了.但是由于硬件,OS,Library等等的不標準,目前在嵌入式系統(tǒng)的開發(fā)中做到如上述代碼這樣的自動化并行程度.

從上面的例子可以得知,嵌入式系統(tǒng)的并行計算還與桌面/服務器領域的發(fā)展趨勢還有一大段距離.感興趣的同學可以去自行了解一下子:Open MP, Open CL, Intel CLik Plus, MPI這幾個項目.目前看來嵌入式平臺的多核架構(gòu)類似于操作系統(tǒng)的多個進程.作者還是從這個層面來做一些實驗來展示相關的并行概念.

Practice: Mutex-資源互鎖

PSoC6的特點是雙核心都能同時訪問外設與內(nèi)存.上一集的Demo正是兩個內(nèi)核分別控制LED進行閃爍.那么如果兩個內(nèi)核同時訪問同一外設會怎樣,比如UART.以下做個實驗試驗一下子.

首先在上次實驗的基礎上拖入一個UART來,直接從右邊的工具盒子里面拖.

image2.png

圖 拖入一個UART

把波特率配置好之后,其余參數(shù)都用默認的.

image3.png

圖 根據(jù)這個把引腳配置

用這個函數(shù)試驗一下子簡單的串口輸出是否OK,過程不多講:

uint32_t Cy_SCB_UART_Put      (CySCB_Type *base, uint32_t data);

確認串口工作之后,重定向STDOUT到串口,也就是要用printf做輸出.(其實這實驗直接使用底層串口輸出函數(shù)也可以進行,只是重定向STDOUT這個以后要經(jīng)常使用,順帶一題.)

因為本系列文章的例子都使用ARM-GCC工具鏈,故此只需要重寫這個函數(shù)即可:

int _write(int fd, const void *buffer, size_t count);

(注:PDL中也有Retarget的實現(xiàn),兼容Keil MDK/IAR/GCC,但是如果只想使用printf,推薦使用本文的簡單方法)

詳細代碼參見作者的git頁面.

之后Cortex M0+與Cortx M4以如下的流程運行:

 

  • 本文系21ic原創(chuàng),未經(jīng)許可禁止轉(zhuǎn)載!

網(wǎng)友評論