Знаете ли вы тот факт, что вы можете создать ИИ, используя менее 20 строк кода? Представьте, как это круто — создать ИИ менее чем за 5 минут. Если вам интересно, как вообще возможно построить сложный алгоритм машинного обучения, используя менее 20 строк кода, то на помощь приходит библиотека Scikit-Learn или sklearn. Sklearn предоставляет так много встроенных алгоритмов машинного обучения (с этого момента я буду кратко называть его моделью), которые мы можем использовать для нашей задачи. Что нам нужно сделать, так это только импортировать модель, обучить ее с помощью нашего набора данных, создать прогноз и оценить производительность. Так просто, правда?

В этом посте я буду использовать набор данных для оценки студентов. Он содержит только два столбца: Часы как функция и Оценка как цель. Вы можете получить доступ к набору данных здесь. Это шаг за шагом.

1. Импортировать необходимую библиотеку

# Data processing
import pandas as pd
from sklearn.model_selection import train_test_split

# Model
from sklearn.linear_model import LinearRegression

# Evaluation
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error

2. Подготовьте набор данных

data = pd.read_csv("/kaggle/input/students-score-dataset-linear-regression/student_scores.csv")
data.head()

3. Разделение набора данных. Мы разделим набор данных на обучение и проверку. Данные обучения используются для обучения моделей, а данные проверки используются для оценки производительности модели.

feature = ['Hours']
target = ['Scores']

X_train, X_val, y_train, y_val = train_test_split(data[feature], data[target], test_size=0.2)

4. Подготовьте модели. В этом примере я использую модель LinearRegression. В sklearn есть так много других моделей регрессии, которые вы можете использовать, например, Lasso, Ridge, RandomForestRegressor и т. д.

# Initialize Model
lr = LinearRegression()

# Train model using training dataset
lr.fit(X_train, y_train)

5. Оценка

  • Создать прогноз для набора данных проверки
y_pred = lr.predict(X_val)
  • Оценка показателей
mae = mean_absolute_error(y_val, y_pred)
mse = mean_squared_error(y_val, y_pred)
rmse = mean_squared_error(y_val, y_pred, squared=False)

print(f"MAE: {mae}")
print(f"MSE: {mse}")
print(f"RMSE: {rmse}")

Полный код вы можете найти здесь.

На этом пока все, так просто построить машинное обучение. Спасибо за чтение :)