| 首页 | 技术文章 | 软件下载 | 博客 | 论坛 | 精品教程 | 黑客动画 | 视频资源 | 在线服务 | 黑客游戏 | 

您现在的位置: 中国X黑客小组 >> 技术文章 >> 编程技术 >> 黑客编程 >> 文章正文 用户登录 新用户注册
  教你轻松识别验证码 - 解读百度贴吧杀手源代码         ★★★ 【字体:
教你轻松识别验证码 - 解读百度贴吧杀手源代码
作者:未知    文章来源:CnXHacker.Net    点击数:    更新时间:2005-8-19    

前些时候我制作了《百度贴吧群发》,可以自动换IP、并且自动更换关键字、标题、内容、图片,
过了几天以后百度贴吧增加了验证码,所以这个程序也用不了了。

今天好奇研究了一下百度的验证码,做了一个新的程序,做这个程序的目的完全是研究技术。
除了测试,我不会去贴吧发广告,也请大家不要去发广告。

授人以鱼不如授人以渔,下面我简单介绍一下识别验证码的过程。用类似的方法可以识别所有常见的验证码。

一、序
大家知道,识别验证码、图文识别都是技术开发的难题,人眼能轻易分别的字符,计算机却需要大量的计算,而且结果很难做到准确。就算是用C++来做,也是很费劲很难得到好的效果。不过在这里我们使用模拟精灵,可以很简单的完成图文识别,模拟精灵虽然大小不足1M、而且是绿色软件完全独立运行,却内置了大部份常用的类库,如模拟编程、WEB编程、windows编程、图像编程都可以轻松实现

二、下载验证码样本

打开c:\test文件夹,选“查看缩略图”,然后重复运行下面的LAScript脚本(每次更换验证码的网址),

img = image.new();
----附注:image库也有抓屏函数,可以直接在屏幕上截取验证码。
image.corp(img, 9 ,0 , 41 , 20 )
img:save("c:\\test\\test.jpg") --保存到硬盘

--折分图片,指定一行四列
img2,img3,img4,img5 = img:split(1,4);

img2:save("c:\\test\\0001.jpg")
img3:save("c:\\test\\0002.jpg")
img4:save("c:\\test\\0003.jpg")
img5:save("c:\\test\\0004.jpg")

image.del(img);

三、生成验证码样本数据库

运行下面的脚本,把所有的验证码样本保存到ApeML数据岛

codeKey ={};
--添加所有数字键
for i =0,9,1 do
codeKey[""..i] = 0; --这里我们用字符串连接的方法把数字转换为字符串
end;

--k参数为键,v参数表示值 一个典型的table迭代器回调函数
loadCodeKey = function(k,v)
    local img = image.new();
    img:load("C:\\test\\"..k..".jpg")
    codeKey[k]= string.encode( img:getBytes("*.jpg") , ""); --因为转换到字符串还是二进制,所以用base64进行编码
    image.del(img);
end;

--遍历表codekey的所有元素,调用loadcodekey加载图片文件
table.foreach (codeKey, loadCodeKey);

--把所有图片保存到数据岛,
ape:saveTable(codeKey,"验证码样本")

四、识别验证码

运行下面的脚本测试一下


--从数据区块读取base64编码的图片数据
codekey = ape:loadTable("验证码样本");
imgBinKey = {}; --这是一个图像数组,用来储存还原后的验证码样本的图片数据
--必须进行一个转换,因为codekey里面只是base64编码的普通字符串,而imgBinKey 将是真正的图片对象(二进制数据)

--还原到图片对象
toImage = function(k,v)
    local img9 = image.new();
    img9:setBytes( string.decode( v ,"") ,"*.jpg");
    imgBinKey[k] = img9;
end;

table.foreach(codekey,toImage);

--下载验证码图片
imgD = image.new();
if (imgD:getURL("/editor/UploadFile/2005-9/1/200591145040974.jpg") ~= true) then
    win.messageBox("下载图像失败","")
    image.del(imgD)
    do return false end;
end;

image.corp(imgD, 9 ,0 , 41 , 20 );
--使用split函数分割图片
img2,img3,img4,img5 = imgD:split(1,4);

function test(imgX)
    limit = 1;
    chr = "";
    win.messagePrint("正在检测图片,请稍候....")
    testimg = function(k,v)
        local n = imgX:testX(imgBinKey[k]);
        if(n            limit = n;
            chr = k.."";
        end;
    end;
    table.foreach(imgBinKey,testimg);
    return chr;
end;

win.messageBox("验证码".. test(img2)..test(img3)..test(img4)..test(img5),"")

五、小结

效果很不错,百分百的准确,唯一的遗憾是识别验证码的过程不是很快,在我电脑上估计要5秒左右,不过图像处理是需要一定的时间,基本上不防碍发信息的的效率。

至于怎么改关键字、标题、内容、图片,这个较简单,熟练使用模拟精灵的话应当不难。如果没用过的看下面的示意图


文章录入:IceRiver    责任编辑:IceRiver 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关文章
    轻松9步加强路由器安全防护能
    教你Rootkit技术的木马知识
    拒绝威胁 教你如何合理高效配
    适合的才是最好的 教你如何挑
    轻轻松松铲除恶意网站 实战I
    网络遭遇“8749病毒”攻击 专
    教你怎样从端口信息 判断病毒
    局域网病毒传播方式特点 教你
    拒绝威胁 教你如何合理高效配
    教你如何手动驱逐流氓软件
      网友评论:(只显示最新5条。评论内容只代表网友观点,与本站立场无关!)
    Powered by ICE RIVER - STUDIO
    » CnXHacker.CoM   © CopyRight 2002-2006, CnXHacker.CoM™, Inc. All Rights Reserved.