一个特殊的内码转换处理对于XML格式的UTF-8
<P>一般来说我们所使用的中文网站都是基于UTF-8的,只需要在录制或者是回放时设置对应的编码就行了,但是随着技术的升级,慢慢的我们发现有些内容的UTF-8无法处理了。</P><P>例如在新版的discuz!.net 3.0中,采用了新的AJAX处理方法,将登陆成功的信息通过UTF-8 的XML返回,这样就出现了一个问题,无法针对这个返回进行检查点函数了(LR不会对返回的XML进行UTF-8解析),这里给出两个解决方案:</P>
<P>1.检查点函数直接用UTF-8编码后的乱码来做</P>
<P><BR> web_reg_find("Search=Body",<BR> "SaveCount=loginst",<BR> "Text=登录æˆåŠŸ",<BR> LAST);</P>
<P><BR> web_submit_data("login.aspx_2", <BR> "Action=http://172.168.2.200:8081/login.aspx?infloat=1&&inajax=1", <BR> "Method=POST", <BR> "TargetFrame=", <BR> "RecContentType=text/xml", <BR> "Referer=http://172.168.2.200:8081/", <BR> "Snapshot=t3.inf", <BR> "Mode=HTML", <BR> ITEMDATA, <BR> "Name=username", "Value=admin", ENDITEM, <BR> "Name=password", "Value=51testing", ENDITEM, <BR> "Name=question", "Value=0", ENDITEM, <BR> "Name=answer", "Value=", ENDITEM, <BR> "Name=templateid", "Value=0", ENDITEM, <BR> LAST);</P>
<P> </P>
<P>2.通过关联获得这块文字,再通过函数转换内码</P>
<P>web_reg_save_param("login",<BR> "LB=<p>",<BR> "RB=</p>",<BR> "Ord=1",<BR> "Search=Body",<BR> LAST);</P>
<P><BR> web_submit_data("login.aspx_2", <BR> "Action=http://172.168.2.200:8081/login.aspx?infloat=1&&inajax=1", <BR> "Method=POST", <BR> "TargetFrame=", <BR> "RecContentType=text/xml", <BR> "Referer=http://172.168.2.200:8081/", <BR> "Snapshot=t3.inf", <BR> "Mode=HTML", <BR> ITEMDATA, <BR> "Name=username", "Value=admin", ENDITEM, <BR> "Name=password", "Value=51testing", ENDITEM, <BR> "Name=question", "Value=0", ENDITEM, <BR> "Name=answer", "Value=", ENDITEM, <BR> "Name=templateid", "Value=0", ENDITEM, <BR> LAST);</P>
<P>lr_convert_string_encoding(lr_eval_string("{login}"),"utf-8",NULL,"my");</P>
<P>这里使用函数lr_convert_string_encoding函数,将login参数中的utf-8编码转换为当前系统的编码,最后在my参数中会出现登陆成功的内容,这样就可以在通过字符串比较来确认事务是否成功了。</P>
<P> </P>
<P>另:奇怪的是用lr_convert_string_encoding将"登陆成功"转换为utf-8再去做检查点判断时,会检查不到该内容,可能是内码转换后格式还是有些不同导致的,所以没有采用先转内码再对转化后的内码做检查点的方式。<BR></P> 直接encoding64再decoding64
万用编码解决方案 lr_convert_string_encoding函数,但是在使用这个函数的时候会有个小问题,就是用该函数转出来的内容会自动附加一个/x00的结尾,导致如果用他来做关联或者检查点的匹配会错误。
lr_convert_string_encoding("登陆成功",NULL,"UTF-8","temp");
如果这样用得出的结果是
登录æˆåŠŸ\x00
而正确的结果应该是
登录æˆåŠŸ
为了去掉这个最后的\x00,可以通过下面这个办法去掉
lr_save_string(lr_eval_string("{temp}"),"temp");
当你对一个带有/x00的参数取值时,会自动去除掉,所以只需要再存一次就行了 用正则去除多余字符吧
不过传参的时候在中间部分就转换好不是更好么
传出的时候ENCODE 收到的时候再DECODE传出 这样的话就算转换的时候有\x00也不会对结果产生影响 其实LR需要改进的地方挺多的,hp怎么就不作为呢
页:
[1]