本程序实现模拟登录淘宝联盟并且下载淘宝客订单xls文件。现提供源码下载,有不明白的可以问我,同时如果您有好的修改建议请回复。我是第一次开发Http程序,请多包涵。
本次开发环境与工具如下:
IE9.0浏览器 + IE抓包插件HttpWatch +WIN7 64位系统 + VS2005 IDE + .NET 2.0框架
测试时注意事项:
必须取消淘宝帐号登录保护 http://110.taobao.com/protect/protect_web.htm
做这个程序关键是分析数据,只有数据分析出来了,才能动手写代码。
下面来几张截图说明分析数据步骤:
第一步:在淘宝联盟 www.alimama.com上面使用淘宝账号登录,输入账号密码点击登录后,截到如下数据
现在我们知道了要POST的URL,即" https://login.taobao.com/member/login.jhtml",以及要POST的数据,还有服务器将会回复的内容,那么请看如下代码:
private void Login()
{
HttpItem item = new HttpItem();
item.URL = https://login.taobao.com/member/login.jhtml;
item.Method = "post";
item.Postdata = string.Format("ua=056u5Ob……&TPL_username={0}&TPL_password={1}&...……", HttpUtility.UrlEncode(txtLoginId.Text.Trim()), HttpUtility.UrlEncode(txtPwd.Text.Trim()));
item.ContentType = "application/x-www-form-urlencoded; charset=UTF-8";
item.Allowautoredirect = true;
HttpResult result = m_Http.GetHtml(item);
string html = result.Html;//服务器回复的内容,它是json格式,包括message,token等字段,message为空为登录成功,否则不为空
string cookie = result.Cookie;//保存cookie便于后面还要使用
Match m = Regex.Match(html, "(?<=,\"message\":\").*?(?=\",)");
if (string.IsNullOrEmpty(m.Value)) //登录成功账号密码正确的情况下
{
Match token = Regex.Match(html, "(?<=\"token\":\").*?(?=\")");//捕获token的值,后面提交的网址中将要使用它
if (!string.IsNullOrEmpty(token.Value))
{
……
}
}
}
如上代码所示,当访问请求提交后,服务器返回的json内容在变量html里面,其中message字段表示是否有错误,如:账号密码不正确,如果账号密码正确message字段值将为"",所以我们利用正则表达式捕获message的值。另外token字段我们也要获取下来,因为下一个访问的网址要用到它。
第二步:根据捕获的token值拼装网址并继续访问,如下图
从上面得到的token值,经过拼装字符串得到下次访问的URL,即 " https://passport.alipay.com/mini_apply_st.js?site=0&token={0}&callback=vstCallback62 "。这次访问后服务器会返回一段js代码,其中包含一个"st"的值(看上图的红色框部分),同样,这次我们也像上次一样用正则表达式捕获"st”的值并且保存,因为后面要使用到它。
(小结:其实我一直在做一件事情,即:把这次访问的结果作为参数拼装一下将得到下次要访问的网址)
private void Login(){
……
Match token = Regex.Match(html, "(?<=\"token\":\").*?(?=\")");//获取token值
if (!string.IsNullOrEmpty(token.Value))
{
item = new HttpItem();
item.Method = "get";
item.URL = string.Format(" https://passport.alipay.com/mini_apply_st.js?site=0&token={0}&callback=vstCallback62 ", token.Value);
item.Accept = "application/javascript, */*;q=0.8";
result = m_Http.GetHtml(item);
html = result.Html;
cookie += result.Cookie;
Match st = Regex.Match(html, "(?<=\"st\":\").*?(?=\")");//捕获st的值,后面还要使用它
……
}
}
第三步:根据捕获的st值,继续访问,如下图
通过将上面得到的st值再次拼装下网址得到URL即 https://login.taobao.com/member/vst.htm?st={0}&……TPL_username%3D{1}……&callback=jsonp75
,{0}处填写上一步的st,{1}处填写淘宝账号,这次服务器同样会返回下一次要访问的网址,我们将他捕获出来它就是url字段(上图中红框标记)
第四步:我们继续访问这个url,服务器将会进行重定向三次,每次重定向的网址从HttpResult.Header中Location字段中得到再赋值给item.URL进行访问。如下图
本次开发环境与工具如下:
IE9.0浏览器 + IE抓包插件HttpWatch +WIN7 64位系统 + VS2005 IDE + .NET 2.0框架
测试时注意事项:
必须取消淘宝帐号登录保护 http://110.taobao.com/protect/protect_web.htm
做这个程序关键是分析数据,只有数据分析出来了,才能动手写代码。
下面来几张截图说明分析数据步骤:
第一步:在淘宝联盟 www.alimama.com上面使用淘宝账号登录,输入账号密码点击登录后,截到如下数据
现在我们知道了要POST的URL,即" https://login.taobao.com/member/login.jhtml",以及要POST的数据,还有服务器将会回复的内容,那么请看如下代码:
private void Login()
{
HttpItem item = new HttpItem();
item.URL = https://login.taobao.com/member/login.jhtml;
item.Method = "post";
item.Postdata = string.Format("ua=056u5Ob……&TPL_username={0}&TPL_password={1}&...……", HttpUtility.UrlEncode(txtLoginId.Text.Trim()), HttpUtility.UrlEncode(txtPwd.Text.Trim()));
item.ContentType = "application/x-www-form-urlencoded; charset=UTF-8";
item.Allowautoredirect = true;
HttpResult result = m_Http.GetHtml(item);
string html = result.Html;//服务器回复的内容,它是json格式,包括message,token等字段,message为空为登录成功,否则不为空
string cookie = result.Cookie;//保存cookie便于后面还要使用
Match m = Regex.Match(html, "(?<=,\"message\":\").*?(?=\",)");
if (string.IsNullOrEmpty(m.Value)) //登录成功账号密码正确的情况下
{
Match token = Regex.Match(html, "(?<=\"token\":\").*?(?=\")");//捕获token的值,后面提交的网址中将要使用它
if (!string.IsNullOrEmpty(token.Value))
{
……
}
}
}
如上代码所示,当访问请求提交后,服务器返回的json内容在变量html里面,其中message字段表示是否有错误,如:账号密码不正确,如果账号密码正确message字段值将为"",所以我们利用正则表达式捕获message的值。另外token字段我们也要获取下来,因为下一个访问的网址要用到它。
第二步:根据捕获的token值拼装网址并继续访问,如下图
从上面得到的token值,经过拼装字符串得到下次访问的URL,即 " https://passport.alipay.com/mini_apply_st.js?site=0&token={0}&callback=vstCallback62 "。这次访问后服务器会返回一段js代码,其中包含一个"st"的值(看上图的红色框部分),同样,这次我们也像上次一样用正则表达式捕获"st”的值并且保存,因为后面要使用到它。
(小结:其实我一直在做一件事情,即:把这次访问的结果作为参数拼装一下将得到下次要访问的网址)
private void Login(){
……
Match token = Regex.Match(html, "(?<=\"token\":\").*?(?=\")");//获取token值
if (!string.IsNullOrEmpty(token.Value))
{
item = new HttpItem();
item.Method = "get";
item.URL = string.Format(" https://passport.alipay.com/mini_apply_st.js?site=0&token={0}&callback=vstCallback62 ", token.Value);
item.Accept = "application/javascript, */*;q=0.8";
result = m_Http.GetHtml(item);
html = result.Html;
cookie += result.Cookie;
Match st = Regex.Match(html, "(?<=\"st\":\").*?(?=\")");//捕获st的值,后面还要使用它
……
}
}
第三步:根据捕获的st值,继续访问,如下图
通过将上面得到的st值再次拼装下网址得到URL即 https://login.taobao.com/member/vst.htm?st={0}&……TPL_username%3D{1}……&callback=jsonp75
,{0}处填写上一步的st,{1}处填写淘宝账号,这次服务器同样会返回下一次要访问的网址,我们将他捕获出来它就是url字段(上图中红框标记)
第四步:我们继续访问这个url,服务器将会进行重定向三次,每次重定向的网址从HttpResult.Header中Location字段中得到再赋值给item.URL进行访问。如下图
至此登录就完成了,接下来就是下载xls文件了。对于下载xls文件较简单,直接get方式提交网址,得到byte[]字节数组并利用FileStream类写到文件中。大家根据以上分析的思路学会分析才是最重要的,所以下载这部分就留给大家自已分析了。提示:下载观看我的源码+观察HttpWatch截获的数据2种方式相结合去分析,对于观察HttpWatch截获的数据主要观看他是POST还是GET方式,以及访问的地址和提交的COOKIE以及服务器返回的COOKIE,还有服务器的回复流这几个方面着手分析。
上面我在讲解的过程中分了4个步骤,是从第1步至第4步讲解的,其实我们在分析数据的时候应该首先从第4步开始一直回溯cookie就得到了第1步,因为第4步中服务器发来的cookie才是最重要的,有了它才能访问淘宝联盟的首页(这个结论当然是通过几次试验得出的),但如果不进行第123步的话第4步的访问地址t和cookie无法得出,所以第4步是分析数据的切入点,至关重要。
点击进入源码下载页面
点击进入HttpWatch下载页面