首页 > 代码库 > ti-sdk-evm-am335x-05.07 uboot分析(MLO跳转到u-boot之前)
ti-sdk-evm-am335x-05.07 uboot分析(MLO跳转到u-boot之前)
--------------------------------------------------------------------------------
ROM CODE如何从MMC启动
--------------------------------------------------------------------------------
ROM code将boot parameters的结构体指针通过R0寄存器传递给MLO,在start.s的reset部分,第一句指令就是:
bl save_boot_params.
5.07版本中相关代码比较复杂,而7.00中就相对简单:
就是将R0的数据存储到r1所指的地址中,仅仅存储了一个指针就返回了。
-------------------------------------------------------------------------
Start.s Start-------------------------------------------------------------------------
位于arch/arm/cpu/armv7/start.s
上电直接跳到reset异常处理例程
调用save_boot_params,保存boot参数,不详述。continue...
cpy_clk_code是将DPLL的代码拷贝到SRAM中,暂不述。
cpu_init_crit只在SPL阶段会被调用,用于setup important registers and memory timing.
接着调用lowlevel_init函数,位于arch/arm/cpu/armv7/omap-common/lowlevel_init.s文件。
从名字可以看出,该文件用于底层的初始化。
--------------------------------------------------------------------------------
lowlevel_init Start(lowlevel_init.s)--------------------------------------------------------------------------------
这里首先建立一个临时的栈,用于运行接下来c程序s_init。其中LOW_LEVEL_SRAM_STACK定义在asm/arch/omap.h文件里面。
而0x4030B7FC位于MPU的L3 OCMC0区域。
调用的函数s_init,位于board/ti/am335x/evm.c下。
在s_init中有几步很关键
1、 preloader_console_init()用于初始化串口,调用serial_init(),该函数位于common/serial.c文件里面。
serial_init()函数首先检查当前有没有串口,显然没有,就只能用默认串口default_serial_console结构。该结构定义在drivers/serial/serial.c中。
其中CONFIG_CONS_INDEX宏定义在include/configs/am335x_evm.h,定义为1表示使用UART0口。
这块是移植时候需要注意的地方,否则调试u-boot时候在默认的串口上不会打印信息。
2、 enable_i2c0_pin_mux() i2c_init()以及read_eeprom(),这三个函数主要适用于TI公司AM335x相关的板子。
这一系列板子上面都有EEPROM并且存储了板子的信息,read_eeprom用于读取相关信息。
s_initContinue...
定义变量is_ddr3用于选择初始化的对象,这也是移植时候需要注意的地方。
--------------------------------------------------------------------------------
lowlevel_init End(lowlevel_init.s)--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
call_board_init_f Start(start.s)--------------------------------------------------------------------------------
Back to start.s
调用完cpu_init_crit后,start.s会继续,接着会调用board_init_f(),在调用之前会在内部SRAM中设立栈指针,
这样才能调用函数,因为函数调用需要入栈的操作。
1、栈指针值CONFIG_SYS_INIT_SP_ADDR
start.s又包含 config.h 文件(位于am335x/include/config.h,am335x是编译时候生成的,Makefile将与目标板相关的文件集中在此处)
config.h文件内容:
在configs/am335x_evm.h中定义了CONFIG_SYS_INIT_SP_ADDR:
即CONFIG_SYS_INIT_SP_ADDR = SRAM0_START + SRAM0_SIZE - GENERATED_GBL_DATA_SIZE
其中 SRAM0_START定义在hardware.h中,进入后可知 SRAM0_START = 0x402F0400,正是Memory Map中SRAM internel的首地址。
SRAM0_SIZE定义在cpu.h中,进入后可知 SRAM0_SIZE = 0x1B400,这个SIZE一直将SRAM延伸到OCMC0里面,结束地址为0x4030B800。
GENERATED_GBL_DATA_SIZE定义在generic-asm-offset.h(asm-offset.h包含此头文件)中,值为128。
这个size的空间是用于存储global_data结构的数据,存储空间以16字节对齐(这个并未证明,因为代码里面没有在任何地方提到将全局变量指针指向此地)。
总结一下,到这一步,在MPU的内部OCMC0区设置栈底SP = 0x4030B800 - 128 = 0x4030B780,并在栈底上面存储分配128 Bytes空间用于存储全局数据。
2、MLO重定位
board_init_f函数位于arch/arm/cpu/armv7/omap-common/spl.c。该函数唯一做的事情就是向relocate_code
函数传入三个参数,然后程序流程又回到start.s文件。
在board_init_f()函数调用start.s中的relocate_code函数,这里实现重定位(实现机理可以百度之),
http://blog.csdn.net/zsy2020314/article/details/9824035 这个解释不错
http://blog.sina.com.cn/s/blog_7656589b0100ys1l.html 这个解释不错
重定位后,后面的puts不会运行了,因为relocate_code不会返回。见下图。
--------------------------------------------------------------------------------
relocate_code Start(start.s) --------------------------------------------------------------------------------
relocate_code的代码如下:
/*
* void relocate_code (addr_sp, gd, addr_moni)
*
* This "function" does not return, instead it continues in RAM
* after relocating the monitor code.
*
*/
.globl relocate_code
relocate_code:
mov r4, r0 /* save addr_sp */
mov r5, r1 /* save addr of gd */
mov r6, r2 /* save addr of destination */
/* Set up the stack */
stack_setup:
mov sp, r4
adr r0, _start
cmp r0, r6
moveq r9, #0 /* no relocation. relocation offset(r9) = 0 */
beq clear_bss /* skip relocation */
mov r1, r6 /* r1 <- scratch for copy_loop */
ldr r3, _image_copy_end_ofs
add r2, r0, r3 /* r2 <- source end address */
copy_loop:
ldmia r0!, {r9-r10} /* copy from source address [r0] */
stmia r1!, {r9-r10} /* copy to target address [r1] */
cmp r0, r2 /* until source end address [r2] */
blo copy_loop
#ifndef CONFIG_SPL_BUILD
/*
* fix .rel.dyn relocations
*/
ldr r0, _TEXT_BASE /* r0 <- Text base */
sub r9, r6, r0 /* r9 <- relocation offset */
ldr r10, _dynsym_start_ofs /* r10 <- sym table ofs */
add r10, r10, r0 /* r10 <- sym table in FLASH */
ldr r2, _rel_dyn_start_ofs /* r2 <- rel dyn start ofs */
add r2, r2, r0 /* r2 <- rel dyn start in FLASH */
ldr r3, _rel_dyn_end_ofs /* r3 <- rel dyn end ofs */
add r3, r3, r0 /* r3 <- rel dyn end in FLASH */
fixloop:
ldr r0, [r2] /* r0 <- location to fix up, IN FLASH! */
add r0, r0, r9 /* r0 <- location to fix up in RAM */
ldr r1, [r2, #4]
and r7, r1, #0xff
cmp r7, #23 /* relative fixup? */
beq fixrel
cmp r7, #2 /* absolute fixup? */
beq fixabs
/* ignore unknown type of fixup */
b fixnext
fixabs:
/* absolute fix: set location to (offset) symbol value */
mov r1, r1, LSR #4 /* r1 <- symbol index in .dynsym */
add r1, r10, r1 /* r1 <- address of symbol in table */
ldr r1, [r1, #4] /* r1 <- symbol value */
add r1, r1, r9 /* r1 <- relocated sym addr */
b fixnext
fixrel:
/* relative fix: increase location by offset */
ldr r1, [r0]
add r1, r1, r9
fixnext:
str r1, [r0]
add r2, r2, #8 /* each rel.dyn entry is 8 bytes */
cmp r2, r3
blo fixloop
b clear_bss
_rel_dyn_start_ofs:
.word __rel_dyn_start - _start
_rel_dyn_end_ofs:
.word __rel_dyn_end - _start
_dynsym_start_ofs:
.word __dynsym_start - _start
#endif /* #ifndef CONFIG_SPL_BUILD */
clear_bss:
#ifdef CONFIG_SPL_BUILD
/* No relocation for SPL */
ldr r0, =__bss_start
ldr r1, =__bss_end__
#else
ldr r0, _bss_start_ofs
ldr r1, _bss_end_ofs
mov r4, r6 /* reloc addr */
add r0, r0, r4
add r1, r1, r4
#endif
mov r2, #0x00000000 /* clear */
clbss_l:str r2, [r0] /* clear loop... */
add r0, r0, #4
cmp r0, r1
bne clbss_l
/*
* We are done. Do not return, instead branch to second part of board
* initialization, now running from RAM.
*/
jump_2_ram:
/*
* If I-cache is enabled invalidate it
*/
#ifndef CONFIG_SYS_ICACHE_OFF
mcr p15, 0, r0, c7, c5, 0 @ invalidate icache
mcr p15, 0, r0, c7, c10, 4 @ DSB
mcr p15, 0, r0, c7, c5, 4 @ ISB
#endif
ldr r0, _board_init_r_ofs
adr r1, _start
add lr, r0, r1
add lr, lr, r9
/* setup parameters for board_init_r */
mov r0, r5 /* gd_t */
mov r1, r6 /* dest_addr */
/* jump to it ... */
mov pc, lr
_board_init_r_ofs:
.word board_init_r - _start
* void relocate_code (addr_sp, gd, addr_moni)
*
* This "function" does not return, instead it continues in RAM
* after relocating the monitor code.
*
*/
.globl relocate_code
relocate_code:
mov r4, r0 /* save addr_sp */
mov r5, r1 /* save addr of gd */
mov r6, r2 /* save addr of destination */
/* Set up the stack */
stack_setup:
mov sp, r4
adr r0, _start
cmp r0, r6
moveq r9, #0 /* no relocation. relocation offset(r9) = 0 */
beq clear_bss /* skip relocation */
mov r1, r6 /* r1 <- scratch for copy_loop */
ldr r3, _image_copy_end_ofs
add r2, r0, r3 /* r2 <- source end address */
copy_loop:
ldmia r0!, {r9-r10} /* copy from source address [r0] */
stmia r1!, {r9-r10} /* copy to target address [r1] */
cmp r0, r2 /* until source end address [r2] */
blo copy_loop
#ifndef CONFIG_SPL_BUILD
/*
* fix .rel.dyn relocations
*/
ldr r0, _TEXT_BASE /* r0 <- Text base */
sub r9, r6, r0 /* r9 <- relocation offset */
ldr r10, _dynsym_start_ofs /* r10 <- sym table ofs */
add r10, r10, r0 /* r10 <- sym table in FLASH */
ldr r2, _rel_dyn_start_ofs /* r2 <- rel dyn start ofs */
add r2, r2, r0 /* r2 <- rel dyn start in FLASH */
ldr r3, _rel_dyn_end_ofs /* r3 <- rel dyn end ofs */
add r3, r3, r0 /* r3 <- rel dyn end in FLASH */
fixloop:
ldr r0, [r2] /* r0 <- location to fix up, IN FLASH! */
add r0, r0, r9 /* r0 <- location to fix up in RAM */
ldr r1, [r2, #4]
and r7, r1, #0xff
cmp r7, #23 /* relative fixup? */
beq fixrel
cmp r7, #2 /* absolute fixup? */
beq fixabs
/* ignore unknown type of fixup */
b fixnext
fixabs:
/* absolute fix: set location to (offset) symbol value */
mov r1, r1, LSR #4 /* r1 <- symbol index in .dynsym */
add r1, r10, r1 /* r1 <- address of symbol in table */
ldr r1, [r1, #4] /* r1 <- symbol value */
add r1, r1, r9 /* r1 <- relocated sym addr */
b fixnext
fixrel:
/* relative fix: increase location by offset */
ldr r1, [r0]
add r1, r1, r9
fixnext:
str r1, [r0]
add r2, r2, #8 /* each rel.dyn entry is 8 bytes */
cmp r2, r3
blo fixloop
b clear_bss
_rel_dyn_start_ofs:
.word __rel_dyn_start - _start
_rel_dyn_end_ofs:
.word __rel_dyn_end - _start
_dynsym_start_ofs:
.word __dynsym_start - _start
#endif /* #ifndef CONFIG_SPL_BUILD */
clear_bss:
#ifdef CONFIG_SPL_BUILD
/* No relocation for SPL */
ldr r0, =__bss_start
ldr r1, =__bss_end__
#else
ldr r0, _bss_start_ofs
ldr r1, _bss_end_ofs
mov r4, r6 /* reloc addr */
add r0, r0, r4
add r1, r1, r4
#endif
mov r2, #0x00000000 /* clear */
clbss_l:str r2, [r0] /* clear loop... */
add r0, r0, #4
cmp r0, r1
bne clbss_l
/*
* We are done. Do not return, instead branch to second part of board
* initialization, now running from RAM.
*/
jump_2_ram:
/*
* If I-cache is enabled invalidate it
*/
#ifndef CONFIG_SYS_ICACHE_OFF
mcr p15, 0, r0, c7, c5, 0 @ invalidate icache
mcr p15, 0, r0, c7, c10, 4 @ DSB
mcr p15, 0, r0, c7, c5, 4 @ ISB
#endif
ldr r0, _board_init_r_ofs
adr r1, _start
add lr, r0, r1
add lr, lr, r9
/* setup parameters for board_init_r */
mov r0, r5 /* gd_t */
mov r1, r6 /* dest_addr */
/* jump to it ... */
mov pc, lr
_board_init_r_ofs:
.word board_init_r - _start
从代码的最后可以看出来,最后mov pc,lr,是跳到重定位后的board_init_r函数处。
代码还是那段代码,只是在内存中的位置变化了。
再回到board_init_f中调用relocate_code函数,传入三个参数:
relocate_code(CONFIG_SPL_STACK, &g_data, CONFIG_SPL_TEXT_BASE);
第一个参数是栈指针:CONFIG_SPL_STACK
第二个参数是全局数据结构指针:&g_data
第三个参数是重定位的目的地址:CONFIG_SPL_TEX_BASE
relocate_code的代码是用汇编书写的,这里要提到的是C参数如何传递给汇编语言的。这里必须要提到ABI和EABI,
ABI是Application Binary Interface的缩写,跟API很类似。但ABI是比API更贴近硬件的一层接口,它规定的
是二进制代码之间的调用规则。
我们知道API是与机器硬件平台无关的接口,如熟悉的printf函数,不同的库的实现可能是不同的,但是它们的接口名称
与参数类型都是一样的。ABI比API的要求更严格,它要求在寄存器级别遵守同样的接口规范,如函数调用的参数传递规则,
寄存器、堆栈的使用方式等。编译器被要求遵守同样的ABI规范,这样不同编译器编译出来的库(相同硬件)才能被别的
编译器使用。
EABI是使用与嵌入式场合的应用二进制接口。这里就简单提一下:函数调用时,传递的参数如果都小于32bit则使用
R0-R3传递参数,参数个数超出4个则使用STACK传递,因此为了代码的效率,程序员应该尽量保证将函数的参数个数限制
在4个以下。
对于CONFIG_SPL_STACK,是LOW_LEVEL_SRAM_STACK的宏定义。
另外am335x_evm.h还包含hardware.h
hardware.h包含omap.h
在omap.h中有LOW_LEVEL_SRAM_STACK的宏定义,这个宏定义和前文提到调用s_init函数前的建立栈底是一样的。
由于栈生长的方向是向下的,所以栈底必须设置为高地址处,这个地址已经快接近OCMC0的底部。
对于CONFIG_SPL_TEXT_BASE,正是MPU内部SRAM的起始地址。
--------------------------------------------------------------------------------
relocate_code End(start.s)--------------------------------------------------------------------------------
总结一下:从打印信息看,我们的板子的stack生长方向是递减的。
有一点很疑惑的是:在调用board_init_f之前,SP设置为0x4030B780,进入board_init_f后调用
relocate_code,传入的SP地址参数为0x4030B7FC,SP往上面移动了,这是为什呢?因为重定位后是不会从
relocate_code函数返回的,所以board_init_f的入栈参数会被抹掉但无所谓,但是能不能将这两次的SP设置成一样的呢?
(PS: TI-SDK-AM335X-EVM-07.00中堆栈的设置没有让人confused的地方了)
--------------------------------------------------------------------------------
call_board_init_f End(start.s)--------------------------------------------------------------------------------
board_init_f函数调用relocate_code,该函数实现代码的搬迁。从下面的图中可以看到:
_start处于内存位置:0x402F0400
在relocate_code中,
relocate_code:
mov r4, r0 /* save addr_sp */
mov r5, r1 /* save addr of gd */
mov r6, r2 /* save addr of destination */
mov r4, r0 /* save addr_sp */
mov r5, r1 /* save addr of gd */
mov r6, r2 /* save addr of destination */
stack_setup:
mov sp, r4
mov sp, r4
adr r0, _start
cmp r0, r6
moveq r9, #0 /* no relocation. relocation offset(r9) = 0 */
beq clear_bss /* skip relocation */
mov r1, r6 /* r1 <- scratch for copy_loop */
ldr r3, _image_copy_end_ofs
add r2, r0, r3 /* r2 <- source end address */
cmp r0, r6
moveq r9, #0 /* no relocation. relocation offset(r9) = 0 */
beq clear_bss /* skip relocation */
mov r1, r6 /* r1 <- scratch for copy_loop */
ldr r3, _image_copy_end_ofs
add r2, r0, r3 /* r2 <- source end address */
将_start加载到r0中,与r6比较,而r6是由r2传递过来的目标地址CONFIG_SPL_TEXT_BASE=0x402F0400。
因此会执行beq clear_bss处,即copy_loop的代码不会执行。
在代码里面加入宏开关,重新编译后依然能执行,证实了这个想法:
MLO阶段不会将自己copy到SRAM中,copy动作应该是由ROM Code实现的。
另外一个证明就是,ti-sdk-07.00版本的u-boot代码中明确了没有在MLO阶段调用relocate_code,仅仅在u-boot阶段调用。
-------------------------------------------------------------------------
Start.s End-------------------------------------------------------------------------
--------------------------------------------------------------------------------
board_init_r Start(start.s)--------------------------------------------------------------------------------
relocate_code结束的时候,跳到board_init_r函数处,该函数位于arch/arm/cpu/armv7/omap-common/spl.c。
该函数主要初始化内存、各个外设:
mem_malloc_init()
timer_init()
i2c_init()
spl_board_init()
然后选择从那个外设加载image。我们调试的时候从SD卡加载u-boot的image,所以关注spl_mmc_load_image函数。
--------------------------------------------------------------------------------
spl_mmc_load_image Start(board_init_r) --------------------------------------------------------------------------------
首先取得boot_device的序号,这个序号是定义在boot_params结构体的第三个成员项
omap_boot_device函数定义在arch/arm/cpu/armv7/omap-common/boot-common.c中。
结构体omap_boot_parameters定义在,这个定义与最开始
时候的Booting Parameters Structure是一致的。
将boot_device和boot_params的地址都打印出来,如下图所示:
可以看到boot device是8,对应的是MMC/SD port 0设备,boot_params结构体的地址是0x40303990,位于L3 0CMC0存储区,很显然这个地址是由连接器分配的,位于“Downloaded Image”区域。
而在spl_mmc_load_image中最关键的部分是,
将boot_mode打印出来,2对应MMCSD_MODE_FAT模式。
另外,由于代码的增加,这儿可以看到boot_params结构体的地址变成了0x403039B8。
而mmc_load_image_fat中最重要的代码就是解析header和读出image。
spl_parse_image_header将header的中信息解析出来放在结构体spl_image里面,file_fat_read函数将image读到spl_image.load_addr所指向的缓冲区。
--------------------------------------------------------------------------------
spl_mmc_load_image End(board_init_r)
--------------------------------------------------------------------------------
spl_image是很重要的一个结构体,将其打印出来看看有什么。
spl_image的地址已经到了0x8000,0000,这已经是Externel SDRAM的首地址了。那么谁安排spl_image的地址的?
搜索一番,发现spl_image处于.bss区域,即未初始化区域,map里面将其放在0x8000000地址。
回过头来查看arch/arm/cpu/armv7/omap-common/u-boot-spl.lds链接脚本文件,可以看到:
也就是说.bss段被指向sdram存储区域,map文件则显示链接器将spl_image安排在第一个。不知道这种安排是否是有意为之?(后来从7.00上面证明并非刻意安排,而是ld的行为)从map看,似乎是谁离lds文件更近谁出现在map的最前面,这种安排是有些道理的,一定程度上能解释为什么spl_image在map上处于第一个。
从spl_image.os的数值可以得出,下一步就是执行jump_to_image_no_args()函数。
该函数首先typedef一个新类型,该类型是入参和返回值均为void的函数指针类型,并且用这个类型定义一个变量image_entry,将spl_image.entry_point赋值给它,最后执行这个函数,从汇编的角度看,就是将spl_image.entry_point赋值给PC,下一步就是跳转到SDRAM的0x80100000执行。
--------------------------------------------------------------------------------
board_init_r End(start.s)--------------------------------------------------------------------------------
MLO阶段结束。
ti-sdk-evm-am335x-05.07 uboot分析(MLO跳转到u-boot之前)
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。