Sqoop 增量导MySQL数据 至Hive
Sqoop 增量导MySQL数据 至Hive通过Sqoop 增量导数据到Hive, 命令如下:
./sqoop-job
--meta-connect jdbc:hsqldb:hsql://127.0.0.1:16000/sqoop
--create t_order_increment_job
-- import --connect jdbc:mysql://127.0.0.1:3306/kevin?serverTimezone=Asia/Shanghai
--username root --password 123456
--append
--table t_order_increment
--columns "id,name,my_time"
--incremental lastmodified
--check-column my_time
--last-value '2019-08-30 21:36:16'
--as-textfile
--target-dir /user/hive/warehouse/t_order_increment
如果同一条记录,被修改后,导入Hive,会出现两条id相同的记录。有什么好办法可以去掉重复的记录?
select * from Hive where id=1 参考下这个链接https://jingyan.baidu.com/article/b2c186c88b1f33856ef6ff8b.html https://www.cnblogs.com/Alcesttt/p/11432547.html 参考下这个 这个有点难..等大神回答{:4_85:} 可以筛选和定义吧
页:
[1]