51Testing软件测试论坛

标题: 关于爬下来数据的清洗 [打印本页]

作者: 测试积点老人    时间: 2019-2-21 09:44
标题: 关于爬下来数据的清洗
爬下来的数据如下图(用python scrapy爬取到mysql)
[attach]122184[/attach]
现在需要对material具体提取其中的食材,修饰词不要。并且去menu形成联系,构成如下图csv关系文件以便导入neo4j
[attach]122185[/attach]
请问如何批量清洗数据?

作者: 疯愚者    时间: 2019-2-22 10:52
这个自己写个python脚本不就OK,也不复杂




欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) Powered by Discuz! X3.2