Публикации по теме 'resampling'
Методы повторной выборки для моделирования машинного обучения
Что такое метод повторной выборки?
Вообще говоря, метод повторной выборки — это инструмент, состоящий в многократном отборе выборок из набора данных и вычислении статистики и показателей по каждой из этих выборок, чтобы получить дополнительную информацию о чем-то, в настройках машинного обучения это что-то является производительностью модели. . Но в случае чисто статистического анализа это может быть дополнительным представлением о поведении какого-либо параметра.
Почему мы..
Вопросы по теме 'resampling'
Как я могу убедиться, что sox не выполняет автоматический дизеринг, не зная версии?
Я использую sox для передискретизации звука перед тем, как ввести его в нашу систему обнаружения речи, но я столкнулся с проблемой в версии 14.3 sox, добавляющей автоматический дизеринг по умолчанию к операции передискретизации, чего мы не хотим....
1160 просмотров
schedule
19.03.2022
Как бы я уменьшил выборку файла .wav, а затем восстановил его с помощью nyquist? - в МАТЛАБ
Все это делается в MATLAB 2010.
Моя цель - показать результаты: недостаточной выборки, скорости Найквиста / передискретизации
Сначала мне нужно уменьшить размер файла .wav, чтобы получить неполный / или беспристрастный поток данных, который я...
12139 просмотров
schedule
11.09.2022
Как я могу разделить отдельные значения фрейма данных на среднемесячные значения?
У меня есть следующие 15-минутные данные как dataframe за 3 года. Первые два столбца являются индексом.
2014-01-01 00:15:00 1269.6
2014-01-01 00:30:00 1161.6
2014-01-01 00:45:00 1466.4
2014-01-01 01:00:00 1365.6...
15477 просмотров
schedule
16.10.2022
Эффективная рациональная повторная выборка с ленивой семантикой
Чтобы изменить частоту дискретизации сигнала, нужно повысить частоту дискретизации, отфильтровать, а затем понизить. Делать это наивно означает вставлять нули во входной сигнал, коррелировать с импульсной характеристикой фильтра, а затем отбрасывать...
180 просмотров
schedule
30.04.2022
матрица начальной загрузки/пересчета по строке в R
У меня есть матрица x с 20 строками и 10 столбцами. Мне нужно выбрать (с заменой) 5 строк за раз и рассчитать средние значения столбцов. Мне нужно повторить эту процедуру 15 раз и каждый раз сообщать значение столбца.
В качестве примера я...
3165 просмотров
schedule
06.06.2022
Повторная выборка серии Python Panda TIme
Я пишу скрипты в панде, но я не смог извлечь правильный вывод, который мне нужен. вот это проблема:
я могу прочитать эти данные из файла CSV. Здесь вы можете найти структуру таблицы
http://postimg.org/image/ie0od7ejr/
Я хочу, чтобы этот...
164 просмотров
schedule
22.10.2022
Ошибка сегментации в программе binning/jack-knife c
Почему я получаю ошибку сегментации (дамп ядра)? Я не могу понять, где проблема.
Предполагается, что программа считывает файл данных с термализованными данными, собирает данные, а затем выполняет повторную выборку с использованием метода складного...
204 просмотров
schedule
07.12.2022
Образец 5 раз и сумма, с заменой
Пробую пробовать с заменой с небольшой закруткой. Я хочу выбрать список, вектор и т. Д. 5 раз и просуммировать это. И замените 5 значений выборки, и сделайте это 1000 раз.
x<- 1:1000
samp <- matrix(NA, ncol = 1, nrow = 1000)
for(i in...
511 просмотров
schedule
12.05.2022
как найти правильную частоту дискретизации для interp1 в Matlab
Я пытаюсь найти правильную частоту дискретизации для interp1 (или прореживание или повторную выборку) для построения графика количества точек по осям, полученных imfreehand..
Сначала я что-то рисую (что-то, что не является синусоидальным)...
316 просмотров
schedule
22.10.2023
Python: изменение масштаба временных рядов в pandas с помощью нецелочисленного коэффициента масштабирования
Я понятия не имею, возможно ли это в Pandas. Я думал, что df.resample может сделать эту работу, но нет. Вот моя цель:
У меня есть временной ряд в DataFrame , df , который выглядит так:
return
12:30:00 -0.000202
12:30:01...
1308 просмотров
schedule
18.05.2023
Weka добавляет более одного классификатора с метафильтрацией
Как я могу добавить более 1 классификатора с метафильтрацией? Например, я хочу применить фильтр SMOTE дважды, так как мои данные имеют 3 класса с соотношением 6:3:1. Итак, чтобы сбалансировать данные, мне нужно запустить SMOTE трижды,
сначала...
444 просмотров
schedule
12.02.2023
Преобразование ежедневных данных в еженедельные в Pandas
У меня есть кадр данных, как указано ниже:
Index Date Country Occurence
0 2013-12-30 US 1
1 2013-12-30 India 3
2 2014-01-10 US 1
3...
3715 просмотров
schedule
01.12.2022
Объяснение разницы в исходном и начальном значении
У меня есть следующая функция; (1) вычислить разницу отклонений для каждой переменной, которая у меня есть, и (2) выполнить начальную загрузку для разницы отклонений, которую я рассчитал на первом шаге.
set.seed(1001)
xfunction <-...
87 просмотров
schedule
26.04.2023
Оптимизация точности классификации в сторону одного класса?
В моем наборе данных есть два класса. Незаинтересованные занимают 90%, а класс интереса составляет около 10%.
Я уже сделал повторную выборку, причем не только один раз, но и несколько сбалансированных наборов (например, 10 наборов). И сделать...
1046 просмотров
schedule
09.12.2022
Применить функцию или цикл в R: не числовой, возвращает NA
Я работаю с процедурой передискретизации в R (как с начальной загрузкой). У меня есть матрица ответов / независимых переменных, и я хотел бы сделать 999 выборок из этой матрицы для расчета для каждой статистики. Я работаю с их средним значением,...
513 просмотров
schedule
17.09.2022
pandas передискретизация кадра данных с определенными датами
У меня вопрос по методу ресэмплинга pandas Dataframes. У меня есть DataFrame с одним наблюдением в день:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,size=(366, 1)), columns=list('A'))
df.index =...
4265 просмотров
schedule
11.12.2022
Я создал класс для возврата доверительного интервала после начальной загрузки, но мой доверительный интервал выглядит странно узким. Что я сделал не так?
Мое намерение состоит в том, чтобы код выполнял начальную загрузку (статистику) в заданном списке с размером выборки, равным длине списка 10 000 раз, а затем вычислял доверительный интервал 95%.
import numpy
from random import choice
class...
455 просмотров
schedule
28.06.2023
Как вы передискретизируете LDA в r?
Я думал, что использование начальной загрузки приведет к повторной выборке моего LDA, но я не уверен. Кроме того, если начальная загрузка работает, я не уверен, как закодировать начальную загрузку в r. Вот мой код LDA:
library('MASS')...
670 просмотров
schedule
11.03.2022
PYTHON Преобразовать формат EOD OHLC DataFrame в недельный OHLC и месячный формат
Python 3.6 Эксперимент должен сделать следующее
У меня есть следующий код с заданными ежедневными данными о запасах EOD/OHLC, получающими их из quandl на каждый день.
class YahooQuote(Quote):
''' Daily quotes from Yahoo. Date...
460 просмотров
schedule
13.05.2023
Значения NaN при передискретизации фрейма данных pandas
У меня есть фрейм данных pandas с двумя разными столбцами:
столбец индекса даты и времени;
столбец, содержащий dict
Если я запускаю настраиваемый ресамплер, который возвращает новый dict в качестве результата, я получаю значение NaN в...
650 просмотров
schedule
24.02.2022