Я следил за этим руководством при отправке заданий mapreduce в HDInsight из консольного приложения .NET.
Он работает нормально, но мне интересно узнать об этой строке:
var jobDefinition = new MapReduceJobCreateParameters()
{
JarFile = "wasb:///example/jars/hadoop-examples.jar",
ClassName = "wordcount"
};
«wasb: ///example/jars/hadoop-examples.jar» относится к банке в моей учетной записи хранения Azure, которая была автоматически помещена туда, когда я подключил учетную запись к моему новому кластеру HDInsight.
Выходя за рамки примеров (я хочу использовать Mahout) ... могу ли я ссылаться на банку, которую я добавил в узел кластера? Я установил mahout в каталог apps / dist по RDP. Я могу нормально запускать задания Mahout оттуда, но я не могу соединить эти два шага вместе.
Похоже, мне не нужно добавлять файлы jar в хранилище BLOB-объектов, чтобы использовать их.