Машинное обучение

Машинное обучение — это раздел компьютерных наук, который дает "компьютерам возможность обучаться без явного программирования".

Пакеты Python

  1. Первый пакет — Numpy — математическая библиотека для работы с n-мерными массивами.
  2. SciPy – это набор численных алгоритмов и инструментов для предметной области, включая обработку сигналов, оптимизацию, статистику и многое другое. scipy — хорошая библиотека для научных и высокопроизводительных вычислений.
  3. Matplotlib — это очень популярный пакет для построения графиков, который обеспечивает как двумерное, так и трехмерное построение графиков.
  4. Pandas — это высокоуровневая библиотека Python, предоставляющая высокопроизводительные и простые в использовании структуры данных. Он имеет множество функций для импорта данных, обработки и анализа. В частности, он предлагает структуры данных и операции для работы с числовыми таблицами и временными рядами.
  5. Scikit-learn – это набор алгоритмов и инструментов для машинного обучения. Scikit-learn — бесплатная библиотека машинного обучения для языка программирования Python. Пакет предварительной обработки scikit Learn предоставляет несколько общих служебных функций и классов преобразования для преобразования необработанных векторов признаков в подходящую форму вектора для моделирования. Вы должны разделить свой набор данных на обучающие и тестовые наборы, чтобы обучить свою модель, а затем отдельно проверить точность модели. Scikit Learn может разбивать массивы или матрицы на случайные поезда и тестировать подмножества для вас.

Алгоритмы с учителем и алгоритмы без учителя

Алгоритмы под наблюдением. Под наблюдением понимается наблюдение и управление выполнением задачи, проекта или действия. Очевидно, вместо этого мы будем контролировать модель машинного обучения, которая может создавать области классификации, как мы видим здесь.

Классификация – это процесс прогнозирования ярлыка или категории дискретного класса. Регрессия — это процесс прогнозирования непрерывного значения в отличие от прогнозирования категориального значения в классификации.

Алгоритмы без учителя . Мы не контролируем модель, но позволяем ей работать самостоятельно, чтобы обнаруживать информацию, которая может быть не видна человеческому глазу. Это означает, что неконтролируемый алгоритм обучается на наборе данных и делает выводы по НЕМЕТОКИРОВАННЫМ данным.

Кластеризация считается одним из самых популярных неконтролируемых методов машинного обучения, используемых для группировки точек данных или объектов, которые чем-то похожи. Кластеризация используется в основном для: обнаружения структуры, суммирования и обнаружения аномалий.

Разница между контролируемым и неконтролируемым обучением заключается в том, что контролируемое обучение работает с помеченными данными, а неконтролируемое обучение — с немаркированными данными. В контролируемом обучении у нас есть алгоритмы машинного обучения для классификации и регрессии. В неконтролируемом обучении у нас есть такие методы, как кластеризация. В обучении с учителем у нас есть алгоритмы машинного обучения для классификации и регрессии. В обучении без учителя у нас есть такие методы, как кластеризация.