云层 发表于 2009-12-19 09:33:56

一个特殊的内码转换处理对于XML格式的UTF-8

<P>一般来说我们所使用的中文网站都是基于UTF-8的,只需要在录制或者是回放时设置对应的编码就行了,但是随着技术的升级,慢慢的我们发现有些内容的UTF-8无法处理了。</P>
<P>例如在新版的discuz!.net 3.0中,采用了新的AJAX处理方法,将登陆成功的信息通过UTF-8 的XML返回,这样就出现了一个问题,无法针对这个返回进行检查点函数了(LR不会对返回的XML进行UTF-8解析),这里给出两个解决方案:</P>
<P>1.检查点函数直接用UTF-8编码后的乱码来做</P>
<P><BR>&nbsp;web_reg_find("Search=Body",<BR>&nbsp;&nbsp;"SaveCount=loginst",<BR>&nbsp;&nbsp;"Text=&ccedil;™&raquo;&aring;&frac12;•&aelig;ˆ&aring;ŠŸ",<BR>&nbsp;&nbsp;LAST);</P>
<P><BR>&nbsp;web_submit_data("login.aspx_2", <BR>&nbsp;&nbsp;"Action=http://172.168.2.200:8081/login.aspx?infloat=1&amp;&amp;inajax=1", <BR>&nbsp;&nbsp;"Method=POST", <BR>&nbsp;&nbsp;"TargetFrame=", <BR>&nbsp;&nbsp;"RecContentType=text/xml", <BR>&nbsp;&nbsp;"Referer=http://172.168.2.200:8081/", <BR>&nbsp;&nbsp;"Snapshot=t3.inf", <BR>&nbsp;&nbsp;"Mode=HTML", <BR>&nbsp;&nbsp;ITEMDATA, <BR>&nbsp;&nbsp;"Name=username", "Value=admin", ENDITEM, <BR>&nbsp;&nbsp;"Name=password", "Value=51testing", ENDITEM, <BR>&nbsp;&nbsp;"Name=question", "Value=0", ENDITEM, <BR>&nbsp;&nbsp;"Name=answer", "Value=", ENDITEM, <BR>&nbsp;&nbsp;"Name=templateid", "Value=0", ENDITEM, <BR>&nbsp;&nbsp;LAST);</P>
<P>&nbsp;</P>
<P>2.通过关联获得这块文字,再通过函数转换内码</P>
<P>web_reg_save_param("login",<BR>&nbsp;&nbsp;"LB=&lt;p&gt;",<BR>&nbsp;&nbsp;"RB=&lt;/p&gt;",<BR>&nbsp;&nbsp;"Ord=1",<BR>&nbsp;&nbsp;"Search=Body",<BR>&nbsp;&nbsp;LAST);</P>
<P><BR>&nbsp;web_submit_data("login.aspx_2", <BR>&nbsp;&nbsp;"Action=http://172.168.2.200:8081/login.aspx?infloat=1&amp;&amp;inajax=1", <BR>&nbsp;&nbsp;"Method=POST", <BR>&nbsp;&nbsp;"TargetFrame=", <BR>&nbsp;&nbsp;"RecContentType=text/xml", <BR>&nbsp;&nbsp;"Referer=http://172.168.2.200:8081/", <BR>&nbsp;&nbsp;"Snapshot=t3.inf", <BR>&nbsp;&nbsp;"Mode=HTML", <BR>&nbsp;&nbsp;ITEMDATA, <BR>&nbsp;&nbsp;"Name=username", "Value=admin", ENDITEM, <BR>&nbsp;&nbsp;"Name=password", "Value=51testing", ENDITEM, <BR>&nbsp;&nbsp;"Name=question", "Value=0", ENDITEM, <BR>&nbsp;&nbsp;"Name=answer", "Value=", ENDITEM, <BR>&nbsp;&nbsp;"Name=templateid", "Value=0", ENDITEM, <BR>&nbsp;&nbsp;LAST);</P>
<P>lr_convert_string_encoding(lr_eval_string("{login}"),"utf-8",NULL,"my");</P>
<P>这里使用函数lr_convert_string_encoding函数,将login参数中的utf-8编码转换为当前系统的编码,最后在my参数中会出现登陆成功的内容,这样就可以在通过字符串比较来确认事务是否成功了。</P>
<P>&nbsp;</P>
<P>另:奇怪的是用lr_convert_string_encoding将"登陆成功"转换为utf-8再去做检查点判断时,会检查不到该内容,可能是内码转换后格式还是有些不同导致的,所以没有采用先转内码再对转化后的内码做检查点的方式。<BR></P>

八宝粥 发表于 2009-12-28 09:00:03

直接encoding64再decoding64
万用编码解决方案

云层 发表于 2009-12-28 11:09:15

lr_convert_string_encoding函数,但是在使用这个函数的时候会有个小问题,就是用该函数转出来的内容会自动附加一个/x00的结尾,导致如果用他来做关联或者检查点的匹配会错误。

lr_convert_string_encoding("登陆成功",NULL,"UTF-8","temp");

如果这样用得出的结果是

&ccedil;™&raquo;&aring;&frac12;•&aelig;ˆ&aring;ŠŸ\x00

而正确的结果应该是

&ccedil;™&raquo;&aring;&frac12;•&aelig;ˆ&aring;ŠŸ

为了去掉这个最后的\x00,可以通过下面这个办法去掉
lr_save_string(lr_eval_string("{temp}"),"temp");

当你对一个带有/x00的参数取值时,会自动去除掉,所以只需要再存一次就行了

八宝粥 发表于 2009-12-28 21:44:18

用正则去除多余字符吧
不过传参的时候在中间部分就转换好不是更好么
传出的时候ENCODE   收到的时候再DECODE传出    这样的话就算转换的时候有\x00也不会对结果产生影响

xueying1123 发表于 2012-6-27 11:10:44

其实LR需要改进的地方挺多的,hp怎么就不作为呢
页: [1]
查看完整版本: 一个特殊的内码转换处理对于XML格式的UTF-8