穿插在代码研读中的细节

数据类型:
    类型定义:
        内核使用typedef来定义各种数据类型,以避免依赖于体系结构相关的特性,比如,各处理器上标准数据类型的位长可能不相同。定义的类型名称如sector_t、pid_t等,这些都是由内核在特定于体系结构的代码中定义的,以确保相关类型的值落在适当的范围内,因此一般无需了解这些类型的具体定义。但如果某个变量类型是typedef而来的,就不能直接访问,而是通过辅助函数。
        某些时候必须使用精确定义了位数的变量,例如使用USB时,为此内核定义了若干整数数据类型,不仅明确了是有符号数还是无符号数,而且指定了精确的位数(__s8,__u8、__u16,__s16、__u32,__s32、__u64,__s64)
    字节序:
        cpu_to_le64将64位数据转换为小端序格式,le64_to_cpu所做刚好相反。(如果体系结构采用的是小端序,这两个例程是空操作)
    
    per-cpu变量:
        普通的用户空间程序设计不会涉及的特殊事项就是per-cpu变量,他们通过DEFINE_PER_CPU(name,type)声明,其中name是变量名,type是其数据类型(例如int[3]、struct hash等)。单处理器上,与常规变量声明没有区别,在有若干CPU的SMP系统上,会未每个CPU分别创建变量的一个实例。用于某个特定CPU的实例可以用get_cpu(name,cpu)获得,其中smp_processor_id()可以返回当前活动处理器ID,用于cpu参数。
    
    访问用户空间:
        源代码中多处指针都标记为__user,该标识符对用户空间程序设计是未知的。内核使用该记号来标识指向用户地址空间中区域的指针,在没有进一步预防措施下,不能轻易访问这些指针指向的区域。内核需要确保指针所指向的页帧确实存在于物理内存中。
体系结构相关知识:
    对齐:
        在内核的某些地方,可能需要访问非对齐的数据类型。个体系结构必须为此定义两个宏(在<asm-arch/unaligned.h>中)。
        get_unaligend(ptr)对位于非对齐内存位置的一个指针,进行反引用操作
        put_unaligned(val,ptr)向ptr指定的一个非对齐(因而不适合直接访问)内存位置写入值val。
    页面:
        <asm-arch/page.h>中必须定义以下宏
        PAGE_SHIFT指定了页长度以2为底的对数
        PAGE_SIZE指定了内存页的长度,单位为字节
        PAGE_ALIGN(addr)可以将任何地址对齐到页边界
        对页的两个标准操作,通常通过优化的汇编指令执行:
        clear_page(start)删除从start开始的一页,并将其中填充0字节
        copy_page(to,from)将from处的页数据复制到to
        PAGE_OFFSET宏指定了物理页帧在虚拟地址空间中映射到的位置,在大多数体系结构上,这隐含地定义了用户地址空间的长度,或将整个地址空间划分为内核地址空间和用户地址空间。但有例外,Sparc对内核和用户空间使用了两个独立的地址空间,AMD64在虚拟地址空间中部有个不可寻址的空洞。因而必须使用asm-arch/process.h中定义的TASK_SIZE常数来确定用户空间的长度
    系统调用:
        标准文件<asm-arch/unistd.h>负责与系统调用相关的以下两个方面任务
        它定义了预处理器常数,将所有系统调用的描述符关联到符号常数。这些常数的名称诸如__NR_chdir和__NR_send等,各体系结构所用的数值可能是不同的。
        它定义内核内部调用系统所用的函数,通常,为此使用了一种预处理机制,连同用于自动生成代码的内联汇编
    字符串处理:
        所有体系结构在<asm-arch/string.h>中都定义了自身的各种字符串操作
        int strcmp(const char *cs,const char *ct)逐字符比较两个字符串
        int strncmp(const char *cs,const char *ct,size_t count)类似于strcmp,但最多只比较count个字符
        int strnicmp(const char *s1,const char *s2,size_t len)类似于strncmp,但不考虑大小写
        char *strcpy(char *dest,const char *src)
        char *strncpy(char *dest,const char *src,size_t count)类似于strcpy,但最大长度不超过count个字符
        size_t *strlcpy(类似于strncpy,如果源字符串的字符数多余size,那么目标字符串仍是以0结尾的)/*什么坑爹函数啊*/
        char *strcat(char *dest,const char *src)
        char *strncat(char *dest,const char *src,size_t count)
        size_t strlcat(char *dest,const char *src,size_t count)类似于strncat,但结果字符串长度不超过
        char *strchr(const char *s,int c)在字符串s中查找字符c出现的第一个位置
        char *strrchr(const char *s,int c)在字符串s中查找字符c出现的最后一个位置
        ....
        ....
        ....
        所有这些函数都是用来替换用户空间中所用的c标准库的同名函数。
        对于每个由体系结构自身以优化形式定义的字符串操作来说,都必须定义相应的__HAVE_ARCH_OPERATION宏,对于memcpy必须设置__HAVE_ARCH_MEMCPY。体系结构代码未能实现的所有函数,都替换为lib/string.c中实现的体系结构无关的标准操作,依据是否定义__HAVE_ARCH_OPERATION判断是否替换。
    线程表示:
        用于保存寄存器的结构定义在下列文件:
        <asm-arch/ptrace.h>中定义了用于保存所有寄存器的pt_regs结构,在进程因为系统调用、中断、或任何其他进制由用户状态切换到核心态时,会将保存各寄存器值的pt_regs结构实例放置在内核栈上。该文件也通过预处理器常数定义了各寄存器在栈上的顺序,在跟踪调试一个进程而需要从栈读取寄存器值时,这是必须的。
        <asm-arch/processor.h>包含了thread_struct结构,它用于描述所有其他寄存器和所有其他进程状态信息。该结构通常进一步分为很多特定于处理器的部分
        <asm-arch/thread.h>中定义了thread_info结构,其中包含了为实现进入和退出内核态、汇编代码必须访问所有的task_struct成员。
    位操作:
        内核特定于体系结构的位操作必须在<asm-arch/bitops.h>中定义一下函数
        void set_bit(int nr,volatile unsigned long *addr)将位置nr的比特位置位,计数从addr开始。
        int test_bit(int nr,const volatile unsigned long *addr)检查指定的比特位是否置位
        void clear_bit(int nr,volatile unsigned long *addr)请出位置nr上的比特位
        void change_bit(int nr,volatile unsigned long *addr)将位置nr处的比特位取反
        int test_and_set_bit(int nr,volatile unsigned long *addr)将一个比特位置位,并返回该比特位此前的值
        int test_and_clear_bit(int nr,volatile unsigned long *addr)将一个比特位清除,并返回该比特位此前的值
        int test_and_change_bit(int nr,volatile unsigned long*addr)将一个比特位取反,并返回该比特位此前的值
        以上函数都是原子的,非原子版前缀为下划线(如__set_bit)。
    字节序之间的转换:
        内核提供<byteorder/little_endian.h>和<byteorder/big_endian.h>头文件,用于当前处理器的版本会包含到<asm-arch/byteorder.h>中
        默认的函数定义在<byteorder/swab.h>中,但可以由特定的于处理器的实现覆盖。__arch__swab16、__arch__swab32、__arch__swab64在各种表示之间交换字节,因而能将大端序转换为小端序,反之亦然,__arch__swab16p、__arch__swab32p、__arch__swab64p完成同样的操作,适用于指针变量,swab表示交换字节
    页表:
        为内存管理,内核提供一个将各体系结构不同点抽象出去的内存模型,各种移植版必须提供操作页表和页表项的函数。这些声明定义在<asm-arch/pgtable.h>中
    校验和计算:
        如果可能的话,各个体系结构都应该采用人工优化的汇编代码来计算校验和。相关代码声明在<asm-arch/checksum.h>中。
        其中有两个函数是最重要的:
        unsigned short ip_fast_csum 依据IP报头和包头长度计算必要的校验和
        csum_partial根据依次接收的各个分片,为每个数据包计算校验和
    上下文切换:
        在调度器决定通知当前进程放弃CPU以便另一个进程运行之后,会进行上下文切换中硬件相关的部分。为此,所有体系结构都必须提供switch_to函数或对应的宏,原型如下,声明定义在<asm-arch/system.h>中:
        void switch-to(struct task_struct *prev, struct task_struct *next, struct task_struct *last)
        prev保存当前进程,next指向下一要切换的进程,last用于在切换后再回到prev时获得刚刚运行过的进程的信息,对内核各处都很有用的。
    查找当前进程:
        current宏用于找到一个指向当前运行进程的task_struct的指针。每个体系结构都必须在<asm-arch/current.h>中声明该宏,该指针保存在一个独立的处理器寄存器中,可以使用current直接或间接的查询。根据体系结构的不同,有些体系结构使用它来存储一个指向当前task_struct实例的指针,但大多数使用它保存一个指向当前有效的thread_info实例的指针。后一种情况下,thread_info包含了一个指针,指向相关进程的task_struct,current可以绕一个弯子来实现。