Знаете ли вы тот факт, что вы можете создать ИИ, используя менее 20 строк кода? Представьте, как это круто — создать ИИ менее чем за 5 минут. Если вам интересно, как вообще возможно построить сложный алгоритм машинного обучения, используя менее 20 строк кода, то на помощь приходит библиотека Scikit-Learn или sklearn. Sklearn предоставляет так много встроенных алгоритмов машинного обучения (с этого момента я буду кратко называть его моделью), которые мы можем использовать для нашей задачи. Что нам нужно сделать, так это только импортировать модель, обучить ее с помощью нашего набора данных, создать прогноз и оценить производительность. Так просто, правда?
В этом посте я буду использовать набор данных для оценки студентов. Он содержит только два столбца: Часы как функция и Оценка как цель. Вы можете получить доступ к набору данных здесь. Это шаг за шагом.
1. Импортировать необходимую библиотеку
# Data processing import pandas as pd from sklearn.model_selection import train_test_split # Model from sklearn.linear_model import LinearRegression # Evaluation from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squared_error
2. Подготовьте набор данных
data = pd.read_csv("/kaggle/input/students-score-dataset-linear-regression/student_scores.csv") data.head()
3. Разделение набора данных. Мы разделим набор данных на обучение и проверку. Данные обучения используются для обучения моделей, а данные проверки используются для оценки производительности модели.
feature = ['Hours'] target = ['Scores'] X_train, X_val, y_train, y_val = train_test_split(data[feature], data[target], test_size=0.2)
4. Подготовьте модели. В этом примере я использую модель LinearRegression. В sklearn есть так много других моделей регрессии, которые вы можете использовать, например, Lasso, Ridge, RandomForestRegressor и т. д.
# Initialize Model lr = LinearRegression() # Train model using training dataset lr.fit(X_train, y_train)
5. Оценка
- Создать прогноз для набора данных проверки
y_pred = lr.predict(X_val)
- Оценка показателей
mae = mean_absolute_error(y_val, y_pred) mse = mean_squared_error(y_val, y_pred) rmse = mean_squared_error(y_val, y_pred, squared=False) print(f"MAE: {mae}") print(f"MSE: {mse}") print(f"RMSE: {rmse}")
Полный код вы можете найти здесь.
На этом пока все, так просто построить машинное обучение. Спасибо за чтение :)