Вопросы по теме 'subsampling'

Как выполнить подвыборку набора данных
Я собираюсь реализовать svm (машины опорных векторов) и различные другие алгоритмы классификации. Но мой набор данных поезда имеет размер 10 ГБ. Как я могу сделать подвыборку? Это очень простой вопрос, но я новичок. Спасибо за помощь
88 просмотров
schedule 07.06.2023

Размер прямоугольного фильтра по отношению к сигме фильтра Гаусса
Чтобы оценить влияние на производительность (как с точки зрения вычислений, так и с точки зрения качества) использования ящичного фильтра / среднего фильтра по сравнению с гауссовым фильтром, мне интересно, существует ли правильная связь между...
2089 просмотров

Обнаружение сжатия подвыборки
У меня есть новое требование в моем приложении. Все изображения должны быть в формате RGB (без CMYK), а субдискретизация должна быть отключена. Мне удалось проверить проверку CMYK, но я борюсь с требованием субдискретизации. Теперь мне нужно...
158 просмотров
schedule 26.10.2022

Образец для создания равномерного распределения из неоднородных данных
Учитывая набор данных с неравномерным распределением (высоким пиком), я хочу выполнить повторную выборку, чтобы создать новый набор данных с приблизительно однородным распределением. Мой подход: Разделите данные на бины. Целевой уровень ячейки...
1422 просмотров

Как я могу выполнить подвыборку массива в соответствии с его плотностью? (Удалите частые значения, оставьте редкие)
У меня есть проблема: я хочу построить распределение данных, где некоторые значения встречаются часто, а другие довольно редко. Общее количество очков составляет около 30 000. Рендеринг такого сюжета, как png или (не дай бог) pdf, занимает вечность,...
1250 просмотров
schedule 05.04.2024

стратифицированная выборка python 1: 1 для каждой группы
Как можно выполнить стратифицированную выборку 1: 1 в python? Предположим, что кадр данных Pandas df сильно несбалансирован. Он содержит бинарную группу и несколько столбцов категориальных подгрупп. df = pd.DataFrame({'id':[1,2,3,4,5],...
1189 просмотров
schedule 15.11.2022

инициировать эффективное распределение по парам для сравнения когорт
Как я могу эффективно сравнивать совпадающие когорты в искре? В python для каждого наблюдения класса меньшинства в сильно несбалансированном наборе данных выборка k наблюдений из класса большинства может быть реализована довольно простым способом...
34 просмотров