|
使用RFT工具取网页中的表格数据时,本来异想天开地想使用什么atCell之类的方法(因为看上去挺像是处理这一类问题的),但是不知道是没这种功能还是我不知道怎么用,反正就不会用,于是我就直接取table().getPropertites().get(".text"),这个取出来就是一个字符串,各行的数据完全粘在一个字符串中了(还好有空格),于是我需要根据规则来分解数据,假如数据格式如下:
Date colnameA colnameB colnameC <——假设这是表头,下面的是数据
2009/09/24 xxxxxx xxxxxx xxxxxx
2009/09/25 xxxxxx xxxxxx xxxxxx
2009/09/26 xxxxxx xxxxxx xxxxxx
2009/09/27 xxxxxx xxxxxx xxxxxx
那么就先看看表头的最后一个字段跟数据的第一个字段(即colnameC和2009/09/24)之间有没有什么特征,如果第一列的数据特征很明显,比如是时间格式,如2009/09/24,那么你就可以根据这个来分解。当遇到xxxx/xx/xx时就分行,到此,就进行了行的分解(使用split方法,我所做的项目只要分解到此就可以了)。如果还需要继续进行单元格的分解,那么就在刚才的基础上,再根据单元格之间有空格来分解(当然,如果是在一个单元格中就有空格,那就另想办法吧),这样就完成了整个表的分解了。反正原则是根据有特征的值来分解,但有一个限制就是特征必须很明确,否则,假设第一列的数据是一个序号,如1,2,3...,那么这样就没法分解了。我现在的项目中正是遇到了这个问题。 附数据的格式:
No. colname colname colname <——假设这是表头,下面的是数据
1 xxxxxx xxxxxx xxxxxx
2 xxxxxx xxxxxx xxxxxx
3 xxxxxx xxxxxx xxxxxx
4 xxxxxx xxxxxx xxxxxx
我现在需要实现的目的是,取这个表格的数据,一行就串成一个字符串即可,目的是为了跟数据库中查询的记录一致的格式。不知道该如何实现了。。。。哎,很郁闷~~不知道哪位高手能不能给指点一下。谢了~~~
[ 本帖最后由 lovecy 于 2009-9-28 22:10 编辑 ] |
|