asm03 - 超级玉米人的博客

超级玉米人

公告

欢迎来到我的博客！这里将分享我的日常与技术学习笔记。~(∠・ω< )⌒★

Learn More

标签

超级玉米人

公告

欢迎来到我的博客！这里将分享我的日常与技术学习笔记。~(∠・ω< )⌒★

Learn More

标签

超级玉米人

公告

欢迎来到我的博客！这里将分享我的日常与技术学习笔记。~(∠・ω< )⌒★

Learn More

标签

945 字

3 分钟

asm03

2025-10-13

language

asm

寻址方式#

在 GAS 汇编中有多种寻址方式，可以给我们便利的的访问或者操纵内存中的值，下面是寻址方式总结表

寻址方式	语法示例	描述
立即寻址	`mov eax, 123`	操作数在指令中
寄存器寻址	`mov eax, ebx`	操作数在寄存器中
直接内存	`mov eax, [var]`	地址在指令中
寄存器间接	`mov eax, [esi]`	地址在寄存器中
基址+偏移	`mov eax, [ebp-8]`	基址寄存器 + 偏移
基址+变址	`mov eax, [ebx+esi]`	基址寄存器 + 变址寄存器
基址+比例变址	`mov eax, [ebx+esi*4]`	基址 + 变址 * 比例因子
全寻址方式	`mov eax, [base+index*scale+disp]`	完整的寻址表达式

伪指令#

在 GAS 汇编中，有丰富的伪指令

段定义伪指令
数据定义伪指令
符号和标签伪指令
对齐和位置伪指令
…

关于段定义伪指令#

GAS 伪指令	等效的 `.section`	描述
`.text`	`.section .text`	定义代码段。
`.data`	`.section .data`	定义已初始化数据段。
`.bss`	`.section .bss`	定义未初始化数据段。
`.section 名称`	-	定义自定义段或指定详细属性。

`.bss` & `.data` 的区别#

特性	`.data` 段	`.bss` 段
用途	存储已初始化的全局/静态变量	存储未初始化或零初始化的全局/静态变量
可执行文件大小	占用磁盘空间	不占用磁盘空间（只记录大小）
程序加载时	数据从文件直接读入内存	内存区域被分配并自动清零
汇编指令	`.byte`, `.word`, `.asciz` 等	`.lcomm`, `.comm`

简单来说， .bss 段是程序运行时的一块“空白画布” ，操作系统保证在你开始使用它时，它已经是干净（全零）的状态，同时又不让你的可执行文件变得臃肿。这是一种非常高效的内存初始化策略。

自定义段 `.sections`#

自定义段允许程序员创建非标准的、特定用途的内存区域

1
.section 段名称 [, 标志] [, 类型] [, 参数]

段标志定义了该内存区域的属性和权限：

标志	含义	描述
`a`	allocatable	段在程序加载时会被分配内存
`w`	writable	段可写
`x`	executable	段可执行
`d`	data	数据段（通常与 `w` 一起使用）
`M`	mergeable	段内容可合并
`S`	contains strings	段包含字符串
`G`	member of group	段属于某个组

示例：#

1
.intel_syntax noprefix
2
.section string_data, "a" #自定义 string_data 段
3
msg:
4
  .ascii "HELLO ASM!\n"
5
  msg_len = . - msg
6

7
.text
8
.global main
9
.type main, @function      # 定义标签 main为函数
10
main:
11

12
  mov rax, 1
13
  mov rdi, 1
14
  lea rsi, [msg]
15
  mov rdx, msg_len
16
  syscall
17

18
  ret
19

20
.global _start
21
_start:
22
  call main
23

24
  mov rax, 60
25
  xor rdi, rdi
26
  syscall

`.include` 伪指令#

它用于在汇编过程中包含其他源文件

基本语法

1
.include "文件名"

我们可以简单封装一些函数，来供其他汇编程序调用，提供代码的复用性比如我们创建一个函数 asm_print 用于打印字符串, 在文件 asm_simple_func.s

1
.intel_syntax noprefix
2
.text
3

4
.global asm_print
5
.type asm_print, @function
6
asm_print:
7
  # push address[msg]
8
  # push msg_len
9
  mov rax, 1
10
  mov rdi, 1
11
  mov rsi, [rsp + 16]
12
  mov rdx, [rsp + 8]
13
  syscall
14
  ret 16

然后我们可以这样调用他(includeTest.s)

1
.intel_syntax noprefix
2

3
.include "./asm_simple_func.s"
4

5
.data
6
msg:
7
    .ascii "HELLO ASM!\n"
8
    msg_len = . - msg
9
.text
10
.global _start
11
_start:
12

13
  lea rax, [msg]
14
  push rax
15
  push msg_len
16
  call asm_print
17

18
  mov rax, 60
19
  mov rdi, 42
20
  syscall

大小写转化问题#

ASCII码#

ASCII码 （American Standard Code for Information Interchange，美国信息交换标准代码）是一种字符编码标准，用于在计算机中表示文本字符。

核心特性：#

7位编码 ：使用7位二进制数表示字符（共128个字符）
标准字符集 ：包含英文字母、数字、标点符号和控制字符
广泛兼容 ：几乎所有计算机系统都支持

常见的ascii 码值

1
数字
2
'0' = 48 (0x30)    '1' = 49 (0x31)    ...    '9' = 57 (0x39)
3
大写字母
4
'A' = 65 (0x41)    'B' = 66 (0x42)    ...    'Z' = 90 (0x5A)
5
小写字母
6
'a' = 97 (0x61)    'b' = 98 (0x62)    ...    'z' = 122 (0x7A)
7
特殊字符
8
空格 = 32 (0x20)   换行 = 10 (0x0A)   回车 = 13 (0x0D)
9
'!' = 33 (0x21)    '\n' = 10 (0x0A)   '\0' = 0 (0x00)

下面考虑一个问题将字符串str1的字母转化为小写, str2的字母转化为大写

通过ASCII字符的分析发现大写和小写ASCII字符在二进制的第5位有差异，小写字母为1，大写字母为0，所以可以使用位运算来实现大小写的转换

如下是功能实现

1
.intel_syntax noprefix
2

3
.include "./asm_simple_func.s"
4

5
.data
6
  str1:
7
    .ascii "basic"
8
    str1_len = . - str1 # 5
9

10
  str2:
11
    .ascii "INFOMATION"
12
    str2_len = . - str2 # 11
13

14
  msg1:
15
    .ascii "\nSolve Str ...\n"
16
    msg1_len = . - msg1
17

18
.text
19

20
.global _start
21
_start:
22
  asm_println str1 str1_len
23
  asm_println str2 str2_len
24
  # 处理字符串 str1
25

26
  asm_println msg1 msg1_len
27

28
  mov r12, str1_len
29
  mov r13, 0
30
str1_loop:
31
  mov al, [str1 + r13]
32
  and al, 0xdf             # 0xDF = 1101 1111
33
  mov [char_buf_1], al
34

35
  asm_print char_buf_1 1
36

37
  inc r13
38
  dec r12
39
  jnz str1_loop
40

41
  asm_print char_endline 1
42

43
  mov r12, str2_len
44
  mov r13, 0
45
str2_loop:
46
  mov al, [str2 + r13]
47
  or al, 0x20           # 0x20 = 0010 0000
48
  mov [char_buf_1], al
49

50
  asm_print char_buf_1 1
51

52
  inc r13
53
  dec r12
54
  jnz str2_loop
55

56
  asm_print char_endline 1
57

58
  # end
59
  mov rax, 60
60
  mov rdi, 42
61
  syscall

除了使用位运算的方法还可以使用算数的方法来实现大小写的转化，在ASCII码中小写字母和大写字母之间的差值为20H

如果这篇文章对你有帮助，欢迎分享给更多人！

asm03

https://yoyolp.github.io/posts/c_asm/asm03/

作者

超级玉米人

发布于

2025-10-13

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

asm02

Markdown Tutorial

超级玉米人の部屋

寻址方式#

伪指令#

关于段定义伪指令#

`.bss` & `.data` 的区别#

自定义段 `.sections`#

示例：#

`.include` 伪指令#

大小写转化问题#

ASCII码#

核心特性：#

目录

超级玉米人の部屋

寻址方式#

伪指令#

关于段定义伪指令#

.bss & .data 的区别#

自定义段 .sections#

示例 ：#

.include 伪指令#

大小写转化问题#

ASCII码#

核心特性：#

目录

`.bss` & `.data` 的区别#

自定义段 `.sections`#

示例：#

`.include` 伪指令#