一个简单的时间片轮转多道程序内核代码分析
学号尾号:155
基于ubuntu kylin 18.10虚拟机
原创作品转载请注明出处https://github.com/mengning/linuxkernel/
实验准备
apt-get install qemu #安装qemu
ln -s /usr/bin/qemu-system-i386 /usr/bin/qemu #链接两个目录
wget https://www.kernel.org/pub/linux/kernel/v3.x/linux-3.9.4.tar.xz # 获取Linux Kernel 3.9.4的源代码
wget https://raw.github.com/mengning/mykernel/master/mykernel_for_linux3.9.4sc.patch # 获取 mykernel_for_linux3.9.4sc.patch
xz -d linux-3.9.4.tar.xz
tar -xvf linux-3.9.4.tar
cd linux-3.9.4
patch -p1 < ../mykernel_for_linux3.9.4sc.patch
make allnoconfig
make
在执行make命令时出现了以下问题:
这个问题是由于gcc的版本太高导致的,执行以下两条命令即可解决:
apt-get install gcc-4.8 #安装gcc4.8
update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100 #将gcc-4.8设置为默认版本
如下所示,执行以上命令后便可以正常编译了
再执行如下命令启动mykernel
qemu -kernel arch/x86/boot/bzImage
如图所示,mykernel启动成功了!
代码分析
cd mykernel/
在该目录中,我们可以看到两个.c文件:
//mymain.c
/*
* linux/mykernel/mymain.c
*
* Kernel internal my_start_kernel
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/types.h>
#include <linux/module.h>
#include <linux/proc_fs.h>
#include <linux/kernel.h>
#include <linux/syscalls.h>
#include <linux/stackprotector.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/delay.h>
#include <linux/ioport.h>
#include <linux/init.h>
#include <linux/initrd.h>
#include <linux/bootmem.h>
#include <linux/acpi.h>
#include <linux/tty.h>
#include <linux/percpu.h>
#include <linux/kmod.h>
#include <linux/vmalloc.h>
#include <linux/kernel_stat.h>
#include <linux/start_kernel.h>
#include <linux/security.h>
#include <linux/smp.h>
#include <linux/profile.h>
#include <linux/rcupdate.h>
#include <linux/moduleparam.h>
#include <linux/kallsyms.h>
#include <linux/writeback.h>
#include <linux/cpu.h>
#include <linux/cpuset.h>
#include <linux/cgroup.h>
#include <linux/efi.h>
#include <linux/tick.h>
#include <linux/interrupt.h>
#include <linux/taskstats_kern.h>
#include <linux/delayacct.h>
#include <linux/unistd.h>
#include <linux/rmap.h>
#include <linux/mempolicy.h>
#include <linux/key.h>
#include <linux/buffer_head.h>
#include <linux/page_cgroup.h>
#include <linux/debug_locks.h>
#include <linux/debugobjects.h>
#include <linux/lockdep.h>
#include <linux/kmemleak.h>
#include <linux/pid_namespace.h>
#include <linux/device.h>
#include <linux/kthread.h>
#include <linux/sched.h>
#include <linux/signal.h>
#include <linux/idr.h>
#include <linux/kgdb.h>
#include <linux/ftrace.h>
#include <linux/async.h>
#include <linux/kmemcheck.h>
#include <linux/sfi.h>
#include <linux/shmem_fs.h>
#include <linux/slab.h>
#include <linux/perf_event.h>
#include <linux/file.h>
#include <linux/ptrace.h>
#include <linux/blkdev.h>
#include <linux/elevator.h>
#include <asm/io.h>
#include <asm/bugs.h>
#include <asm/setup.h>
#include <asm/sections.h>
#include <asm/cacheflush.h>
#ifdef CONFIG_X86_LOCAL_APIC
#include <asm/smp.h>
#endif
void __init my_start_kernel(void)
{
int i = 0;
while(1)
{
i++;
if(i%100000 == 0)
printk(KERN_NOTICE "my_start_kernel here %d \n",i);
}
}
//myinterrupt.c
/*
* linux/mykernel/myinterrupt.c
*
* Kernel internal my_timer_handler
*
* Copyright (C) 2013 Mengning
*
*/
#include <linux/kernel_stat.h>
#include <linux/export.h>
#include <linux/interrupt.h>
#include <linux/percpu.h>
#include <linux/init.h>
#include <linux/mm.h>
#include <linux/swap.h>
#include <linux/pid_namespace.h>
#include <linux/notifier.h>
#include <linux/thread_info.h>
#include <linux/time.h>
#include <linux/jiffies.h>
#include <linux/posix-timers.h>
#include <linux/cpu.h>
#include <linux/syscalls.h>
#include <linux/delay.h>
#include <linux/tick.h>
#include <linux/kallsyms.h>
#include <linux/irq_work.h>
#include <linux/sched.h>
#include <linux/sched/sysctl.h>
#include <linux/slab.h>
#include <asm/uaccess.h>
#include <asm/unistd.h>
#include <asm/div64.h>
#include <asm/timex.h>
#include <asm/io.h>
#define CREATE_TRACE_POINTS
#include <trace/events/timer.h>
/*
* Called by timer interrupt.
*/
void my_timer_handler(void)
{
printk(KERN_NOTICE "\n>>>>>>>>>>>>>>>>>my_timer_handler here<<<<<<<<<<<<<<<<<<\n\n");
}
由上图的运行结果我们可以发现,内核启动后会调用mymain.c,然后周期性地调用myinterrupt.c。
了解了内核是如何工作后,接下来将时间片轮转的代码加入进去。代码可以在mykernel中找到,包含mymain.c、myinterrupt.c、mypcb.h。将这三个文件下载下来后放入mykernel目录中覆盖即可。然后重新编译内核代码:
make allnoconfig
make
加入时间片轮转的代码后,运行结果如图所示:
可以看到已经实现了进程切换。
—
首先对mypcb.h文件的内容进行分析
struct Thread {
unsigned long ip;
unsigned long sp;
};
Thread结构体定义了两个变量,其中ip表示当前指令位置,sp表示栈顶位置
typedef struct PCB{
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
unsigned long stack[KERNEL_STACK_SIZE];
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry;
struct PCB *next;
}tPCB;
PCB结构体定义了一个进程块,pid表示进程id,state表示进程状态(-1表示不能运行 0表示可运行 -1表示停止),next表示指向下一个进程块的指针。
下面分析mymain.c
tPCB task[MAX_TASK_NUM];
tPCB * my_current_task = NULL;
volatile int my_need_sched = 0;
在文件的开头定义了三个变量,task是一个进程数组,用于存储创建的所有进程;my_current_task是一个指向当前进程的指针;my_need_sched是一个标志当前进程是否需要被调度的变量。
void __init my_start_kernel(void)
{
int pid = 0;
int i;
/* Initialize process 0*/
task[pid].pid = pid;
task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].next = &task[pid];
/*fork more process */
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
//*(&task[i].stack[KERNEL_STACK_SIZE-1] - 1) = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].thread.sp = (unsigned long)(&task[i].stack[KERNEL_STACK_SIZE-1]);
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp\n\t" /* set task[pid].thread.sp to esp */
"pushl %1\n\t" /* push ebp */
"pushl %0\n\t" /* push task[pid].thread.ip */
"ret\n\t" /* pop task[pid].thread.ip to eip */
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/
);
}
在内核启动后,便会调用my_start_kernel函数。该函数的执行步骤如下:
- 初始化第一个进程:0号进程
- 将pid置为0
- 将进程状态置为runnable
- 将进程的任务入口和线程的指令指针指向my_process函数
- 将线程的sp指针指向栈的末尾
- 将该进程的next指针指向自身(因为当前只有一个进程)
- 接着开启一个循环,创建四个进程,每个进程中线程的sp都指向其栈的末尾,然后将创建的进程块用一个单循环链表连接起来。
- 接着开始启动0号进程,这段汇编代码便是启动进程的代码。首先将0号进程的sp放入esp,然后将sp、ip入栈,然后将ip出栈(即my_process函数的地址),然后开始执行my_process函数。
void my_process(void)
{
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
my_process()函数是一个死循环,循环输出当前进程的进程号,并且如果需要调度的标志位为1,便执行my_schedule()函数进行进程调度。
下面分析my_interrupt.c
void my_timer_handler(void)
{
#if 1
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = 1;
}
time_count ++ ;
#endif
return;
}
首先分析my_timer_handler()函数,该函数用于响应时钟中断,当系统发生中断时,该函数会被调用,将my_need_sched标志位置为1,这样my_process()函数便会调用my_schedule()函数进行进程的切换。
void my_schedule(void)
{
tPCB * next;
tPCB * prev;
if(my_current_task == NULL
|| my_current_task->next == NULL)
{
return;
}
printk(KERN_NOTICE ">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
{
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
/* switch to next process */
asm volatile(
"pushl %%ebp\n\t" /* save ebp */
"movl %%esp,%0\n\t" /* save esp */
"movl %2,%%esp\n\t" /* restore esp */
"movl $1f,%1\n\t" /* save eip */
"pushl %3\n\t"
"ret\n\t" /* restore eip */
"1:\t" /* next process start here */
"popl %%ebp\n\t"
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
}
return;
}
该函数用于进程的切换。
- 首先判断当前进程是否存在或当前进程的next指针是否不为空,若next所指为空或当前进程不存在,则进程无法切换,直接返回。
- 创建指向进程块的next指针和prev指针,其中next指针指向下一个进程块,prev指针指向当前进程块。
- 判断next指针指向的进程是否是runnable状态,若是则开始进行进程切换
- 将my_current_task变量指向next指针指向的进程块
- 输出当前进程的进程号和下一个进程的进程号,向用户表明切换对象
- 执行进程切换的汇编代码
- 将ebp入栈
- 将esp存入当前进程的sp(栈顶指针)
- 将下一个进程的sp指针存入esp
- 将下一个进程的ip入栈
- 将下一个进程的ip出栈赋给eip
- 将ebp出栈
- 该函数执行完毕后,继续执行my_process()函数
总结
经过这次进程调度的代码分析,了解到了操作系统进程调度的工作方式:在内核启动时,会创建一个0号进程,这是最初的进程,之后的进程都由这个0号进程创建,当发生时钟中断时,会保护现场和恢复现场,进行进程的切换。