GitHub - Jerrick/Scavenger: Hadoop job monitor & killer & reportor

#Scavenger

#for Hadoop 0.* & 1.*

#项目介绍&使用说明文档（中文）：

https://github.com/Jerrick/Scavenger/wiki/%E9%A1%B9%E7%9B%AE%E4%BB%8B%E7%BB%8D&%E4%BD%BF%E7%94%A8%E8%AF%B4%E6%98%8E%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89

#使用背景:

Hadoop 集群中会运行很多个Job, Job可能来源于MR脚本、Hive SQL 、Pig 脚本等, 最初公司的集群没有管理Job, 有些mapper数过大的Job会抢占所有的资源，造成其他Job进程的阻塞。而最初都是看JobTracker(50030)时发现再人工kill, 非常不够智能。所以就有了本项目的设想，监控JobTracker上的job，发现超过设定好的最大Mapper数或最长时间则kill 掉，然后邮件报告出来。

#层级目录:

|____common 
| |______init__.py
| |______init__.pyc
| |____commom.py
| |____commom.pyc
| |____jobutil.py
| |____jobutil.pyc
| |____mailman.py
| |____mailman.pyc
| |____mailutil.py
| |____mailutil.pyc
| |____toolutil.py
| |____toolutil.pyc
|____config
| |____commom.conf
| |____db.conf
| |____job.conf
| |____mail.conf
|____env.sh
|____History
|____Note
|____README.md
|____requirements.txt
|____scavenger.py`

#其他：

很早的一个项目设想，虽然通过Hadoop的调度器可以规避本项目处理的问题，但是还是想自己写一下玩玩。
代码写的很烂，但是我会一点点完善，欢迎各路大神留言指教 :)
项目目前私有，初版完成后会公开
GitHub有同一项目，更新慢于git@osc
部分代码仅适合笔者公司环境，使用时请修改，如kill job部分
例行执行参考，crontab方案：*/2 * * * * cd ~/git-osc/Scavenger/; . env.sh; python scavenger.py >> /tmp/sca.log 2>&1 &

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

common

common

config

config

.gitignore

.gitignore

History

History

LICENSE.md

LICENSE.md

Note

Note

README.md

README.md

env.sh

env.sh

scavenger.py

scavenger.py

Repository files navigation

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
common		common
config		config
.gitignore		.gitignore
History		History
LICENSE.md		LICENSE.md
Note		Note
README.md		README.md
env.sh		env.sh
scavenger.py		scavenger.py

License

Jerrick/Scavenger

Folders and files

Latest commit

History

Repository files navigation

About

Resources

License

Stars

Watchers

Forks

Languages