博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop Streaming框架使用(二)
阅读量:7097 次
发布时间:2019-06-28

本文共 840 字,大约阅读时间需要 2 分钟。

上一篇文章介绍了Streaming的各种参数,本文具体介绍使用方法。

提交hadoop任务示例: 

  $HADOOP_HOME/bin/hadoop streaming \

-input /user/test/input -output /user/test/output \ 

-mapper “mymapper.sh” -reducer “myreducer.sh” \

-file/home/work/mymapper.sh \

-file /home/work/myreducer.sh \

-jobconf mapred.job.name=”file-demo” 

上面的命令提交了一个hadoop任务,输出和输入分别为 /user/test/output 和/user/test/input。 map程序为 mymapper.sh,reduce程序为myreducer.sh。这里需要注意一定要将这两个文件用-file分发到集群的节点上。最后一行指定了任务的名字。

 

还有一些较为复杂的使用,比如需要指定任务个数等,可以使用

-jobconf mapred.job.map.capacity=m -jobconf mapred.job.reduce.capacity=n 

上面的命令设置最多同时运行m个map任务,n个reduce任务,如果m或n为0或者没有指定,则对应的capacity没有限制,默认配置就是0没有限制。建议在运行作业时都设置map和reduce capacity,防止作业占用过多资源。 

 

当然,这里只是简单介绍了最基本的用法,hadoop streaming还有很多高级使用方法,可一些很强大的排序指定功能,这里不再过多介绍,有需要的朋友可以给我留言进行询问,只要我遇到过的问题一定给出解决方案。如果运行时出现错误,可以参见我的另一篇文章——

from:

转载于:https://www.cnblogs.com/Vito2008/p/5458476.html

你可能感兴趣的文章
angularjs 过滤器filter
查看>>
puppet之文件管理
查看>>
Wi-Fi搞不清?五问五答一看就明
查看>>
配置Configuration Manager站点和层次架构(2)
查看>>
Cognos Schedule stops working
查看>>
键盘谍影 键盘监视器的原理和防范
查看>>
配置交换机etherchannel
查看>>
活力四射的Windows Embedded Standard 7
查看>>
了解区块链,从挖矿开始
查看>>
【Java学习笔记】java.lang包学习
查看>>
配套自测连载(四)
查看>>
iOS网络编程-解决iCloud文档存储过程中文档冲突问题
查看>>
Java5 并发学习
查看>>
传输信道加密Stunnel配置
查看>>
DHCP服务器如何检测穿过中继代理的IP地址冲突(gratuitous ARP肯定是不行的)
查看>>
恭喜CocoStudio 1.5和Mac版本发布
查看>>
Exchange server 2010系列教程之二 图文安装Exchange 2010
查看>>
玩转CVSNT+TortoiseCVS 版本控制系统(图解)(上)
查看>>
利用CSVDE命令实现域用户账户的批量添加示例
查看>>
解决 Exchange2013提示“出现意外错误,无法处理您的请求”,无法打开OWA和ECP
查看>>