高級工程師是如何從復位的序列執行到main函數的

2022-05-13 大方老師單片機

///插播一條：我自己在今年年初錄製了一套還比較系統的入門單片機教程，想要的同學找我拿就行了免費的，私信我就可以哦~點我頭像黑色字體加我地球呺也能領取哦。最近比較閒，帶做畢設，帶學生參加省級或以上比賽///

來源：程序是如何從復位的序列執行到main函數的？

作者：麥克泰技術

連結：程序是如何從復位的序列執行到main函數的？

從事嵌入式開發的夥伴可能會思考過一個問題，我們一般都是使用晶片廠商提供的驅動庫和初始化文件，直接從main函數開始寫程序，那麼系統上電之後，程序怎麼引導進main函數執行的呢？還有，系統上電之後RAM的數據是隨機的，那麼定義的全局變量的初始值又是怎麼實現的呢？

下面我將帶著這兩個問題，以Cortex-M架構為例，采用IAR EWARM作為編譯工具鏈，從系統上電之後執行的第一條代碼開始，梳理系統的啟動過程，了解編譯器在此期間所做的工作。其他的工具鏈，如Keil和GCC在系統初始化過程所做的工作也是相似的，但具體的實現有所差異。

1、啟動文件

晶片廠商提供的啟動文件，一般是採用彙編語言編寫，少數用C語言。在啟動文件中一般至少存在下面兩個部分內容：

1、向量表

2、默認的中斷和異常處理程序

向量表實際上是一個數組，放置在存儲器的零地址，每個元素存儲的是各個中斷或異常處理程序的入口地址。以STM32F107晶片基於IAR工具的啟動文件為例：

文件的開頭定義了一個名為__vector_table的全局符號，「DATA」的作用是在代碼段中定義一個數據區，用作向量表。數據區的內容是使用DCD指令定義的32位寬度常量，除了第一個sfe(CSTACK)比較特殊以為，其他的常量都是異常和中斷服務程序的地址(在編譯時函數名會被替換成函數的入口地址)。sfe(CSTACK)是IAR彙編器段操作，用於獲取段(section)的結束地址，在這裡意欲何為呢？

實際上這是獲取堆棧基地址的操作。IAR在連結器腳本(*.icf)文件中定義堆棧，實際是定義了一個名為「CSTACK」的空閒塊(block)，如下圖的腳本命令所示。所謂的塊就是保留一段連續的地址空間，用來作為堆棧或者堆。當然，塊也可以是用內容的，例如可以用來管理段，但不在今天的討論範圍。

我們知道Cortex-M架構的堆棧模型是滿減棧，堆棧從高地址向低地址增長，因此堆棧的基地址是CSTACK的結束地址。

向量表的第一個元素是棧基址這是由Cortex-M架構定義的。系統上電後硬體自動從向量表中獲取，並設置主堆棧指針MSP，而不是像其他ARM架構，堆棧指針需要通過軟體來設置。

向量表中第二個元素是復位異常(Reset_Handler)的入口地址。系統上電後，硬體自動從__vector_table + 4的位置讀取，並從讀取到的地址開始執行。系統上電後CPU執行的第一條是Reset_Handler函數的第一條語句。

上面的THUMB命令表示接下來的代碼采用THUMB模式(Cortex-M只支持Thumb-2指令集)；SECTION用於定義一個段，段名為「.ResetHandler」，段的類型是代碼(CODE)；REODER指示用給定的名稱開啟一個新的段；ROOT指示連結器，當段內的符號沒有被引用，連結器也不可以丟棄這個段。

PUBWEAK是弱定義，如果用戶在其他位置編寫了中斷處理函數，在連接時實際連結用戶所編寫的，啟動文件中用彙編寫的服務函數會忽略。之所以要在啟動文件中以弱定義的方式編寫全部的異常和中斷服務函數，是為了防止用戶在沒有編寫服務函數的情況下開啟並觸發了中斷，導致系統的不確定。

2、系統初始化過程

在EWARM的工程Options > Debugger > Setup中將「Run to」勾選取消，這樣在進入調試之後就會停第一條要執行的代碼的位置：

進入調試之後會停在啟動文件Reset_Handler函數第一條彙編指令位置：

此時，通過寄存器觀察窗口查看SP的值為0x20009820。通過連結時生成的map文件，查看CSTACK的地址範圍，0x20009820正好是CSTACK的結束地址。有了MSP，C代碼就能運行了。

ystemInit函數是晶片廠商根據ARM的CMSIS標準提供的一個系統基礎配置函數，配置基礎的時鐘系統和向量表重定位等。這裡的LDR是偽指令，它將SystemInit函數的地址加載到寄存器R0，實際上是通過PC偏移尋址來獲取SystemInit的地址。

從上面的圖可以發現一個問題，在反彙編窗口可以觀察到SystemInit的地址是0x20000150，但加載到R0寄存器後卻是0x20000151。這是因為在使用跳轉指令更新PC時，需要置PC的LSB為1，以表示THUMB模式，由於Cortex-M不支持ARM模式，因此LSB總是1。

執行完晶片廠商提供的SystemInit函數之後，跳轉到__iar_program_start，這是IAR編譯器提供的初始化代碼的入口。

__iar_program_start首先會執行兩個函數：__iar_init_core和__iar_init_vfp，可以完成一些CPU和FPU相關的初始化操作，在某些ARM架構打包好的運行時庫會有這兩個函數，用戶也可以重寫這兩個函數來自己實現一些相關的操作。

之後，跳轉到__cmain函數執行。在__cmain中調用了一個__low_level_init函數，該函數專門用於提供給用戶編寫一個初階的初始化操作，它在全局變量初始化之前執行，例如可用在__low_level_init中初始化SDRAM，這樣就可以將全局變量定義到SDRAM中使用。

__low_level_init可以在任意的C文件中編寫，注意它的返回值，如果返回0，後續就會跳過變量初始化操作，正常一般都是返回1。

3、全局變量的初始化

此後進入到__iar_data_init3函數，在這裡會完成所有具有初始值的全局/靜態變量的賦值，以及零初始化全局/靜態變量的清零操作，分別調用__iar_copy_init3和__iar_zero_init3，將保存在ROM區由連結器生成的變量初始值複製到變量的地址。注意，新的EWARM版本默認變量初始化操作可能會採用壓縮算法，實際變量初始化調用的函數可能有區別。

在全局變量未初始化之前，通過watch窗口可以看到，變量的值都是隨機數。

在__iar_data_init3執行完成後，全部變量的初值賦值已經完成。

在__cmain函數的最後，跳轉到用戶的main函數，最終開始用戶的代碼執行。

了解了編譯器所提供的初始化過程和處理器架構，我們可以根據自己的需求定製系統的初始化。

例如，在進入__iar_program_start之前，就可以執行必要的硬體初始化操作，可以用彙編寫，也可以用C寫。還可以手動控制變量的初始化操作，自己實現變量的初始化。甚至，完全不採用IAR編譯器提供的初始化操作，自己從復位序列引導至main函數那也是可以的。

高級工程師是如何從復位的序列執行到main函數的

高學歷畢業生，該學單片機還是plc？

做工程師還是轉型做產品經理？

想學硬體，該學什麼啊？

新能源汽車為何得以推廣？

為什麼我認識的機械工程師都抱怨工資低？

如何看待2022年秋招Java後端開發崗一片紅海？

HTTPS 加密了什麼內容？

人窮志不短，窮學生也能玩轉樹莓派

數莓派 4怎麼樣？可能的玩法有哪些？

大家有沒有覺得學機械的人很可怕？

如何學習可編程邏輯控制器（PLC）？

電源插座是如何傳輸電的？困擾小夥伴這麼多年的簡單問題

交流電和直流電的區別是什麼？

linux 運維工程師的前景怎麼樣？

哪個程式語言實現hello world最煩瑣？

Python和Java二選一該學啥？

30歲了開始自學編程，家裡比較困難還來得及嗎？

系統的去學習一門程式語言，原來有如此捷徑

參加工作後的過來人告訴你，嵌入式工作是什麼樣的，要學什麼？

玩 Arduino 需要做哪些準備？

學完基礎的verilog語言後如何進一步學習fpga

ST電機庫5.0完全開源對電機控制軟體工程師有何影響？

程式設計師35歲失業，為什麼還那麼多人建議學計算機？

辭職自學編程，大家覺得可行嗎