Публикации по теме 'resampling'


Методы повторной выборки для моделирования машинного обучения
Что такое метод повторной выборки? Вообще говоря, метод повторной выборки — это инструмент, состоящий в многократном отборе выборок из набора данных и вычислении статистики и показателей по каждой из этих выборок, чтобы получить дополнительную информацию о чем-то, в настройках машинного обучения это что-то является производительностью модели. . Но в случае чисто статистического анализа это может быть дополнительным представлением о поведении какого-либо параметра. Почему мы..

Вопросы по теме 'resampling'

Как я могу убедиться, что sox не выполняет автоматический дизеринг, не зная версии?
Я использую sox для передискретизации звука перед тем, как ввести его в нашу систему обнаружения речи, но я столкнулся с проблемой в версии 14.3 sox, добавляющей автоматический дизеринг по умолчанию к операции передискретизации, чего мы не хотим....
1160 просмотров
schedule 19.03.2022

Как бы я уменьшил выборку файла .wav, а затем восстановил его с помощью nyquist? - в МАТЛАБ
Все это делается в MATLAB 2010. Моя цель - показать результаты: недостаточной выборки, скорости Найквиста / передискретизации Сначала мне нужно уменьшить размер файла .wav, чтобы получить неполный / или беспристрастный поток данных, который я...
12139 просмотров

Как я могу разделить отдельные значения фрейма данных на среднемесячные значения?
У меня есть следующие 15-минутные данные как dataframe за 3 года. Первые два столбца являются индексом. 2014-01-01 00:15:00 1269.6 2014-01-01 00:30:00 1161.6 2014-01-01 00:45:00 1466.4 2014-01-01 01:00:00 1365.6...
15477 просмотров
schedule 16.10.2022

Эффективная рациональная повторная выборка с ленивой семантикой
Чтобы изменить частоту дискретизации сигнала, нужно повысить частоту дискретизации, отфильтровать, а затем понизить. Делать это наивно означает вставлять нули во входной сигнал, коррелировать с импульсной характеристикой фильтра, а затем отбрасывать...
180 просмотров

матрица начальной загрузки/пересчета по строке в R
У меня есть матрица x с 20 строками и 10 столбцами. Мне нужно выбрать (с заменой) 5 строк за раз и рассчитать средние значения столбцов. Мне нужно повторить эту процедуру 15 раз и каждый раз сообщать значение столбца. В качестве примера я...
3165 просмотров
schedule 06.06.2022

Повторная выборка серии Python Panda TIme
Я пишу скрипты в панде, но я не смог извлечь правильный вывод, который мне нужен. вот это проблема: я могу прочитать эти данные из файла CSV. Здесь вы можете найти структуру таблицы http://postimg.org/image/ie0od7ejr/ Я хочу, чтобы этот...
164 просмотров
schedule 22.10.2022

Ошибка сегментации в программе binning/jack-knife c
Почему я получаю ошибку сегментации (дамп ядра)? Я не могу понять, где проблема. Предполагается, что программа считывает файл данных с термализованными данными, собирает данные, а затем выполняет повторную выборку с использованием метода складного...
204 просмотров

Образец 5 раз и сумма, с заменой
Пробую пробовать с заменой с небольшой закруткой. Я хочу выбрать список, вектор и т. Д. 5 раз и просуммировать это. И замените 5 значений выборки, и сделайте это 1000 раз. x<- 1:1000 samp <- matrix(NA, ncol = 1, nrow = 1000) for(i in...
511 просмотров
schedule 12.05.2022

как найти правильную частоту дискретизации для interp1 в Matlab
Я пытаюсь найти правильную частоту дискретизации для interp1 (или прореживание или повторную выборку) для построения графика количества точек по осям, полученных imfreehand.. Сначала я что-то рисую (что-то, что не является синусоидальным)...
316 просмотров
schedule 22.10.2023

Python: изменение масштаба временных рядов в pandas с помощью нецелочисленного коэффициента масштабирования
Я понятия не имею, возможно ли это в Pandas. Я думал, что df.resample может сделать эту работу, но нет. Вот моя цель: У меня есть временной ряд в DataFrame , df , который выглядит так: return 12:30:00 -0.000202 12:30:01...
1308 просмотров

Weka добавляет более одного классификатора с метафильтрацией
Как я могу добавить более 1 классификатора с метафильтрацией? Например, я хочу применить фильтр SMOTE дважды, так как мои данные имеют 3 класса с соотношением 6:3:1. Итак, чтобы сбалансировать данные, мне нужно запустить SMOTE трижды, сначала...
444 просмотров

Преобразование ежедневных данных в еженедельные в Pandas
У меня есть кадр данных, как указано ниже: Index Date Country Occurence 0 2013-12-30 US 1 1 2013-12-30 India 3 2 2014-01-10 US 1 3...
3715 просмотров

Объяснение разницы в исходном и начальном значении
У меня есть следующая функция; (1) вычислить разницу отклонений для каждой переменной, которая у меня есть, и (2) выполнить начальную загрузку для разницы отклонений, которую я рассчитал на первом шаге. set.seed(1001) xfunction <-...
87 просмотров
schedule 26.04.2023

Оптимизация точности классификации в сторону одного класса?
В моем наборе данных есть два класса. Незаинтересованные занимают 90%, а класс интереса составляет около 10%. Я уже сделал повторную выборку, причем не только один раз, но и несколько сбалансированных наборов (например, 10 наборов). И сделать...
1046 просмотров

Применить функцию или цикл в R: не числовой, возвращает NA
Я работаю с процедурой передискретизации в R (как с начальной загрузкой). У меня есть матрица ответов / независимых переменных, и я хотел бы сделать 999 выборок из этой матрицы для расчета для каждой статистики. Я работаю с их средним значением,...
513 просмотров
schedule 17.09.2022

pandas передискретизация кадра данных с определенными датами
У меня вопрос по методу ресэмплинга pandas Dataframes. У меня есть DataFrame с одним наблюдением в день: import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(0,100,size=(366, 1)), columns=list('A')) df.index =...
4265 просмотров
schedule 11.12.2022

Я создал класс для возврата доверительного интервала после начальной загрузки, но мой доверительный интервал выглядит странно узким. Что я сделал не так?
Мое намерение состоит в том, чтобы код выполнял начальную загрузку (статистику) в заданном списке с размером выборки, равным длине списка 10 000 раз, а затем вычислял доверительный интервал 95%. import numpy from random import choice class...
455 просмотров

Как вы передискретизируете LDA в r?
Я думал, что использование начальной загрузки приведет к повторной выборке моего LDA, но я не уверен. Кроме того, если начальная загрузка работает, я не уверен, как закодировать начальную загрузку в r. Вот мой код LDA: library('MASS')...
670 просмотров
schedule 11.03.2022

PYTHON Преобразовать формат EOD OHLC DataFrame в недельный OHLC и месячный формат
Python 3.6 Эксперимент должен сделать следующее У меня есть следующий код с заданными ежедневными данными о запасах EOD/OHLC, получающими их из quandl на каждый день. class YahooQuote(Quote): ''' Daily quotes from Yahoo. Date...
460 просмотров

Значения NaN при передискретизации фрейма данных pandas
У меня есть фрейм данных pandas с двумя разными столбцами: столбец индекса даты и времени; столбец, содержащий dict Если я запускаю настраиваемый ресамплер, который возвращает новый dict в качестве результата, я получаю значение NaN в...
650 просмотров
schedule 24.02.2022