Публикации по теме 'big-data'


Флинк или провал? Почему у Ele.me появляется вкус к Apache Flink
Что такого уникального в Flink и что отличает его от Storm и Spark? Эта статья является частью серии статей о Flink от Alibaba . Инженеры приложения Alibaba для доставки еды Ele.me (饿 了 吗) все больше полагаются на Apache Flink, платформу обработки потокового видео с открытым исходным кодом, выпущенную в 2018 году. Что такого уникального в Flink и что отличает его от Storm и Spark? В этой статье исследуется, как работает платформа больших данных Ele.me с точки зрения..

Введение в кластеризацию в машинном обучении
Кластеризация — это наиболее важные концепции больших данных, которые в основном используются для классификации одних и тех же категорий и выявления отдельных элементов в данных, кластеризация — это подполе машинного обучения, а глубокое обучение используется для извлечения интеллекта из больших наборов данных. методов группировки одних и тех же объектов вместе, при кластеризации нам все равно, к какой категории принадлежит определенный объект, но цель кластеризации состоит в том, чтобы..

3 лучших сервиса докеров, которые вы можете использовать
Docker  – это набор продуктов платформы как услуги (PaaS), которые используют виртуализацию на уровне ОС для доставки программного обеспечения в пакетах, называемых контейнерами. Контейнеры изолированы друг от друга и содержат собственное программное обеспечение, библиотеки и файлы конфигурации; они могут общаться друг с другом через четко определенные каналы. Все контейнеры запускаются одним ядром операционной системы и поэтому используют меньше ресурсов, чем виртуальные машины...

Что такое большие данные?
КАЖДЫЙ МОЖЕТ БЫСТРО УЗНАТЬ О ТЕХНОЛОГИЯХ БОЛЬШИХ ДАННЫХ Что такое большие данные? 1 — ИЗУЧАЙТЕ БОЛЬШИЕ ДАННЫЕ, НАУКУ О ДАННЫХ, АНАЛИТИКУ И МАШИННОЕ ОБУЧЕНИЕ Статья 1 — Что такое большие данные Большие данные вызывают любопытство. Он представлял данные в больших объемах, в таком измерении, о котором еще несколько лет назад не могли и мечтать, что в один прекрасный день их можно будет сохранить и обработать с помощью компьютеров с низкими затратами. Этот термин, по-видимому,..

Создание хранилища данных на Amazon Redshift
Подходит ли вам эта система? По мере роста организации требования к хранению, мониторингу и анализу данных также экспоненциально возрастают. Традиционные хранилища данных не всегда легко справляются с огромным ростом. Это вызвало потребность в альтернативных решениях, начиная с середины 2000-х годов. Одним из таких решений является Amazon Redshift от Amazon Web Services. Что такое Amazon Redshift? Amazon Redshift - это облачное хранилище данных, предназначенное для..

Программирование на Python для начинающих, часть 8
Десять полезных однострочников в Python Иногда вы должны быть поражены тем, как легко можно писать код на python. В этом посте я собираюсь поделиться некоторыми из моих любимых острот в программировании на Python. Вы также можете получить доступ к Блокноту Jupyter , чтобы выполнить руководство по тому же самому. Я действительно взволнован, чтобы поделиться с вами. Начнем… Python — один из самых популярных языков программирования среди начинающих, потому что это дружественный..

Ложь, которую нам рассказывают онлайн-курсы по науке о данных !!!!!!!!!!!!!
Что ж, в наши дни наука о данных уже какое-то время является ходовым товаром, но веб-сайты онлайн-курсов по науке о данных начали вводить в заблуждение ложью в своей рекламе, чтобы привлечь клиентов, и часть этой лжи доступность и легкость, с которой новичок может получить работу в области науки о данных, анализа данных и больших данных. что никакое другое предварительное понимание математики или программирования не требуется для получения работы в этой области. что их курс —..