Изучение инструмента высокоуровневого анализа данных Microsoft.

Вступление

В прекрасном и обширном мире науки о данных в 2020 году есть множество вариантов и подходов, которые можно использовать в аналитике и машинном обучении. Хотя большинство специалистов по обработке данных могут подойти к решению, используя популярные языки программирования, такие как Python, R, Scala или даже Julia, есть также несколько более высокоуровневых реализаций, которые могут выполнить свою работу в определенных случаях. Один действительно крутой пример - Power-Bi от Microsoft.

Power-Bi - это универсальный инструмент высокого уровня для аналитики данных в области науки о данных. Его можно рассматривать как не столько приложение типа языка программирования, сколько приложение высокого уровня, подобное чему-то вроде Microsoft Excel. Хотя иногда требуется программирование, в конце концов, большинство конечных пользователей, вероятно, могут обойтись небольшой практикой и очень небольшими обязательствами.

Использование Power-Bi

Для установки Power-Bi вам понадобится система Windows. Я сам являюсь пользователем Fedora, поэтому я загрузил новое виртуальное ядро ​​с помощью Gnome’s Boxes. Boxes - это графический интерфейс QEMU, который позволяет невероятно легко запускать несколько виртуальных систем под одной одновременно работающей операционной системой. Кроме того, вы всегда можете использовать онлайн-версию приложения. Из-за того, что я немного использовал веб-версию, я обнаружил, что функций довольно не хватает по сравнению и часто разделяются между двумя.

Имея это в виду, есть несколько уровней подписки, в которых можно принять участие. Поскольку я, конечно, не заинтересован в последовательном использовании Power-Bi (по причинам, которые я коснусь), я буду использовать бесплатную версию.

Преимущества

Бесплатно (вроде)

Конечно, отличный способ познакомиться с новыми технологиями - это сделать их доступными. На самом деле это относится к Power Bi. В то время как Power Bi имеет несколько лицензий, включенных как для корпоративных, так и для личных профессиональных пользователей, Power Bi по-прежнему бесплатен для изучения и практики для некоммерческого использования. Имейте в виду, что если вы работаете с Linux или Mac, вам в основном не повезло, когда дело доходит до использования этого инструмента.

Хотя программное обеспечение может быть бесплатным с точки зрения стоимости, с точки зрения выпуска оно, безусловно, не является бесплатным и является проприетарным. Для меня это очень важно не только из-за моей приверженности свободным программам, но и потому, что это, безусловно, может усложнить большую часть работы, когда нет отличного способа узнать, как работает приложение. Это, конечно, даже более актуально при работе с чем-то, что должно взаимодействовать с данными.

Очень удобный

Одна из самых выдающихся особенностей Power-Bi - это простота использования. По сравнению практически со всеми другими решениями, с которыми может работать специалист по данным, Power-Bi значительно упрощает базовые и даже более сложные операции с данными. Для меня это была бы главная причина обратиться к такому инструменту, как Power-Bi.

Соединители данных

Большая проблема науки о данных обычно возникает не там, где можно было бы ожидать:

машинное обучение.

Самая большая проблема - это, как правило, сбор достаточного количества данных, относящихся к определенной теме, для их фактического изучения, анализа, очистки и прогнозирования. При этом Power-Bi позволяет невероятно легко подключиться к целому ряду ресурсов данных с Microsoft и другими компаниями, поддерживающими известные конечные точки.

Визуализация данных

Последняя сильная сторона Power-Bi - это потрясающие визуализации, которые можно создать с помощью программного обеспечения. Программа загружена до краев потрясающими и красивыми шаблонами визуализации! Это, конечно, включает в себя типичные и знакомые графики, такие как графики распределения, графики разброса и ящичные графики, но также и дополнительный набор действительно интересных инструментов, таких как визуализация календаря.

Минусы

Закрытый источник

Самым большим недостатком Power-Bi является то, что это запатентованная технология с закрытым исходным кодом. Хотя в некоторых ситуациях это не такое уж серьезное препятствие, на мой взгляд, если инструмент не является открытым исходным кодом, я не могу по-настоящему понять, что он делает.

Конечно, не только я так чувствую. Вдобавок ко всему, закрытое программное обеспечение может оставить вас в затруднительном положении, если ему не хватает конкретной и необходимой реализации.

Цена

Хотя Power-Bi бесплатен для личного использования, он в основном финансируется за счет регистрации на основе подписки. Например, корпорации с меньшей вероятностью будут использовать Power-Bi только потому, что он стоит гораздо дороже, чем другие и более эффективные решения.

Слишком высокий уровень

Как специалист по данным, вы, вероятно, столкнетесь со случаями, когда вам может потребоваться выполнить определенные арифметические операции или операции с данными, которые просто невозможно сделать в чем-то вроде Power-Bi. Многие задачи, которые может потребоваться выполнить специалисту по данным, вполне могут потребовать программирования, запросов и очень прямого отношения к данным.

Для чего-то вроде этого очень вероятно, что вы захотите использовать такой язык программирования, как Python, R, MATLAB, Scala или Julia. Все эти инструменты, безусловно, не очень похожи на опыт в Power-Bi. Power-Bi настолько высокоуровневый, что любой пользователь сможет приблизиться к нему, но это удобство также лишает платформу гибкости. Проблема в том, что данные постоянно меняются - вместе с поддерживающей их языковой базой, но это не так для такого приложения, как Power-Bi.

Заключение

Возникает вопрос о гибкости и удобстве использования Power-Bi для специалистов по данным; следует ли нам использовать Power-Bi для анализа данных? Мой ответ - нет, потому что я думаю, что есть программные экосистемы, которые далеко впереди. При этом, однако, для нового ученого, который, возможно, захочет сосредоточиться на аналитике или визуализации, а не на алгоритмах, Power-Bi может стать достойной ступенькой для ознакомления с материалом. В заключение, я думаю, что Power-Bi может иметь некоторую ценность для людей, пытающихся заниматься аналитикой, но тем, у кого есть опыт (особенно в программировании), вероятно, не следует использовать это приложение.