Публикации по теме 'data-wrangling'


Информационный бюллетень Segna — 23 декабря 2021 г.
Что мы читали Искусственный интеллект показывает, что в Сахаре на самом деле 1,8 миллиарда деревьев и кустарников Свободное мышление Анализ спутниковых снимков, сделанный ИИ, показал, что в Западной Сахаре насчитывается примерно 1,8 миллиарда деревьев и кустарников. Это примечательно тем, что деревья за пределами лесных массивов обычно не включаются в климатические модели, и мы очень мало знаем об их запасах углерода. По сути, это белое пятно на картах и ​​неизвестный компонент..

Присоединение и поиск: работа с несколькими наборами данных в движке
Работа с несколькими наборами данных необходима в любом серьезном реальном проекте машинного обучения. В частности, объединение нескольких таблиц вместе или поиск информации из других таблиц - это основные задачи в науке о данных. Вступление Из этой статьи вы узнаете, как выполнять присоединение и поиск на платформе AI & Analytics Engine . Ключевым преимуществом использования возможности обработки данных движка является то, что вы можете легко создавать действия, выбирая нужные..

3 шляпы специалиста по данным
Приключения в смене метафорического головного убора Наука о данных - странное существо, гибридное химерное детище машинного обучения и статистики. Его случаи многочисленны, но сбивают с толку, потому что они часто нечетко определены и принимают разные формы в зависимости от данных и задействованных людей. В контексте бизнес-проблем «наука» в науке о данных на самом деле сводится к простому «узнать больше» в духе Scientia - «знать». Это хорошо согласуется с моим личным стремлением..

8½ вопросов, которые нужно задать, если вы хотите, чтобы ваш проект AI/ML приносил ощутимые результаты
Вокруг искусственного интеллекта и машинного обучения было столько шумихи и шумихи, что многие компании подхватили их, думая о них как о магических заклинаниях, которые изменят их бизнес и поднимут его на невообразимые ранее высоты. Чаще всего пузырь лопается, и компании понимают, что AI/ML изначально им не подходил. Мы знаем, что легко соблазниться этими технологиями, думая, что они откроют золотой век беспрецедентного роста и процветания. Тот факт, что все говорят об этом или..

Анализ вакансий в науке о данных в США
Цель В рамках проекта анализируется набор вакансий в области науки о данных и определяется, какие навыки и технологии востребованы. В дополнение к этому анализ показывает тенденции на рынке труда в отношении требуемых навыков. Наконец, анализ с использованием прогностической модели изучает взаимосвязь между предполагаемой заработной платой и содержанием объявления о вакансии. На каких вакансиях мы особенно сосредоточились В качестве источника данных для анализа были взяты..

Вопросы по теме 'data-wrangling'

Написание функции, которая использует цикл for для замены значений отчетов одного столбца в наборе данных на основе вектора символов.
здесь я пытаюсь создать функцию, которую я мог бы запускать каждый раз, когда я хочу заменить значения отчетов в наборе данных их фактическими вариантами ответов. Гипотетически я использовал следующие варианты ответов для описания цвета...
26 просмотров
schedule 18.07.2023

Разделение одного столбца на два столбца с использованием обработки данных с помощью R
Я был бы очень признателен за вашу помощь в использовании R для обработки данных. У меня есть данные, в которых я хочу разделить один столбец (переменную) на два, когда это возможно, в зависимости от других переменных. Например, согласно...
74 просмотров
schedule 24.07.2022

Как привести в порядок набор данных, в котором столбцы являются фиктивными переменными, а значения ячеек - именами наблюдений?
У меня действительно беспорядочный набор данных, где каждый столбец (правильно) соответствует интересующей переменной. Набор данных, по сути, считает людей. Например, Var1 должен быть списком людей, для которых верно Var1. Представьте, что...
59 просмотров
schedule 06.03.2022

Обработка данных в R с использованием tidyverse?
Итак, у меня есть этот набор данных. Основной переход — поворот таблицы, поэтому имена популяций находятся в первом столбце, имена — это заголовки для каждого столбца (и они переименованы, например, Chlorophyll переименован в CHLa). Другое изменение...
44 просмотров
schedule 30.03.2024

Свести фрейм данных, объединить значения столбца в списки для заполнения отдельных ячеек
У меня есть следующий фрейм данных в r: Color Value Red 1 Red 3 Red 4 Red 7 Blue 2 Blue 5 Green 1 Green 2 Green 3 Что я хотел бы сделать, так это...
48 просмотров
schedule 25.03.2022

Обработка данных: как объединить два набора данных широкого формата в один
У меня есть два набора данных широкого формата. Оба имеют общий столбец индекса, и я хотел бы объединить оба набора данных в один набор данных широкого формата на основе этого общего столбца. Ниже представлен образец наборов данных. Пусть набор...
118 просмотров
schedule 13.11.2022

Как добавить переменные из одного идентификатора записи, но с несколькими именами в R?
У меня возник вопрос, когда я пытался упорядочить данные. У меня есть фрейм данных, как показано ниже: ID price location 1 10.2 A 2 9.0 B 2 9.0 C 3 8.5 F 3 8.5 G Для каждого уникального идентификатора все столбцы...
102 просмотров
schedule 07.07.2023

Как изменить форму или транспонировать набор данных с учетом выбранных столбцов и строк в большом наборе данных (пример Всемирного банка)
Я пытаюсь получить набор данных с веб-сайта Всемирного банка, и мне нужно изменить форму таким образом, чтобы название серии было первой строкой, а годы были структурированы по столбцу. В наборе данных есть 50 лет и более 100 индикаторов, поэтому для...
145 просмотров

Преобразуйте текстовые данные в одном столбце в числовые данные в R
У меня есть столбец в моем фрейме данных как жанр фильмов, и их много. Я хочу преобразовать его в числовые данные для построения корреляционной матрицы. Пожалуйста, помогите мне это сделать. Genre Genre_numerical Comedy 1 Action...
56 просмотров
schedule 21.11.2023

как исключить элемент (dataframe) из списка в R, если он содержит определенное слово
У меня есть датафрейм. Я делю этот фрейм данных на подфреймы по 6 строк в списке. Я хочу, если внутри этих подфреймов существует слово #ERROR, чтобы удалить все кадры данных (которые содержат даже в одной строке определенное слово) и получить список...
31 просмотров
schedule 28.02.2023

Как изменить порядок столбцов после разделения?
У меня есть фрейм данных, содержащий список стран, и он был разделен с помощью функции csplit . Код выглядит следующим образом: - df <- data.frame(country = c("India, South Africa", "United Kingdom, United States, India",...
29 просмотров
schedule 20.07.2023

Добавить определенное количество переменных из одной группы в другую
У меня есть фрейм данных pandas, в котором я разбил object одного и того же type на группы определенного числа (например, 3). Например, группа ball_1 содержит 3 уникальных объекта одного типа: soccer , basket и bouncy . Остальные объекты...
43 просмотров
schedule 13.07.2022

Как рассчитать значения до и после каждого события, появляющегося в кадре данных в R
У меня есть база данных, подобная этому примеру, и мне нужно вычислить среднее значение, сумму и стандартное отклонение за 10 минут до события, а также за 10 минут до события. Цифры в фреймах данных приведены только для иллюстрации. df =...
50 просмотров

ускорение выполнения кода в R для обеспечения подсчета всех возможных комбинаций событий, принадлежащих определенному ID
У меня есть набор данных с 3 столбцами (ID, D, AE). sample=data.frame( ID=c(1,1,1,2,2,2), D=c('a','b','c','a','c','c'), AE=c('m','x','w','y','m','f') ) Я хочу подсчитать количество идентификаторов, в которых представлены все возможные...
43 просмотров
schedule 03.06.2023

Обработка данных в R со столбцом DateTime и несколькими наблюдениями
У меня есть обычно отформатированный набор данных в CSV-файле, который я читаю в R как tibble или data.frame. Поскольку это происходит откуда-то еще, оно имеет широкий формат, подобный этому, где первая строка является заголовком фрейма данных:...
23 просмотров
schedule 10.01.2024

Словарь Python. Если ключ одинаков, создайте список соответствующих значений (строковый тип данных)
У меня есть тип данных, который выглядит так: {'name': 'brian', 'location': 'Brookings, OR'} {'name': 'brian', 'location': 'Medford, OR'} {'name': 'tommy', 'location': 'Portland, OR'} {'name': 'tommy', 'location': 'Medford, OR'} {'name': 'tommy',...
27 просмотров

Группировка по нескольким переменным и обобщение частот символов
Я пытаюсь сгруппировать свой набор данных по нескольким переменным и построить частотную таблицу, в которой указано, сколько раз появляется символьная переменная. Вот пример набора данных: Location State County Job Pet...
20 просмотров
schedule 23.07.2023

Заменить несколько столбцов в R (тидиверс)
У меня небольшая проблема с R. Я объединил 2 набора данных, и мне нужно вычислить простые отношения между ними. Наборы данных не такие уж и маленькие (18 столбцов на набор данных), и я бы хотел избежать использования простой грубой силы. Чтобы дать...
57 просмотров
schedule 14.05.2022

R Studio: Как выполнить отдельные процедуры преобразования данных для разных значений переменной в список отдельных фреймов данных?
У меня есть фрейм данных, который выглядит так: +-----------+------------+--------+------------+ | Geography | Dates | Sales | Avg_Volume | +-----------+------------+--------+------------+ | A | 2020-01-01 | | |...
37 просмотров
schedule 08.07.2023

Как фильтровать списки в списке в R итеративно или как фильтровать data.table, используя два критерия одновременно, создавая объекты во время выполнения
Я работаю над таблицей data.table, которая содержит, среди прочего, спрос на определенные продукты в определенных магазинах бизнес-франшизы. Цель состоит в том, чтобы предсказать спрос на каждый продукт в каждом магазине. Вот заголовок моего набора...
38 просмотров