У меня есть сценарий оболочки (count.sh), который подсчитывает количество строк в файле. Этот сценарий был скопирован в hdfs, и в настоящее время я использую рабочий процесс Oozie для выполнения этого сценария.
Однако мне было интересно, есть ли способ выполнить этот сценарий оболочки из командной строки.
Ex:
В Юниксе: [myuser@myserver ~]$./count.sh
Эквивалентно этому, когда count.sh находится в расположении кластера Hadoop '/user/cloudera/myscripts/count.sh'.
Я прочитал эту команду Hadoop для запуска сценария bash в кластере hadoop, но до сих пор не понял.