Курсы Big Data

Курсы Big Data

«Большие данные» - это термин, который относится к решениям, предназначенным для хранения и обработки больших наборов данных Первоначально разработанные Google, эти решения для крупных данных эволюционировали и вдохновляли другие подобные проекты, многие из которых доступны как с открытым исходным кодом Некоторые примеры включают Apache Hadoop, Cassandra и Cloudera Impala Согласно сообщениям Gartner, BigData является следующим большим шагом в области ИТ сразу после Cloud Computing и станет ведущей тенденцией в ближайшие несколько лет Учебные курсы BigData на базе NobleProg начинаются с введения в элементарные концепции Big Data, а затем продвигаются к языкам программирования и методологиям, используемым для выполнения анализа данных Инструменты и инфраструктура для обеспечения возможности хранения больших объемов данных, распределенной обработки и масштабируемости обсуждаются, сравниваются и внедряются в демонстрационные сеансы Обучение BigData доступно в различных форматах, в том числе на живом тренинге на месте, а также обучение в режиме реального времени с использованием интерактивной настройки удаленного рабочего стола Местное обучение BigData может проводиться в прямом эфире на территории заказчика или в местных учебных центрах NobleProg.

Machine Translated

Отзывы

★★★★★
★★★★★

Big Data Содержание курса

Название курса
Продолжительность
Обзор
Название курса
Продолжительность
Обзор
21 часов
Обзор
Apache Accumulo - это сортированное распределенное хранилище ключей / значений, которое обеспечивает надежное масштабируемое хранение и извлечение данных Он основан на дизайне BigTable от Google и работает под управлением Apache Hadoop, Apache Zookeeper и Apache Thrift Эти курсы охватывают принципы работы Accumulo и позволяют участникам проходить разработку примера приложения Apache Accumulo Аудитория Разработчики приложений Инженер-программист Технические консультанты Формат курса Лекция по части, обсуждение частей, разработка и реализация handson, случайные тесты для оценки понимания ,.
21 часов
Обзор
Платформа KNIME Analytics - это ведущий вариант с открытым исходным кодом для инноваций, основанных на данных, которые помогут вам обнаружить потенциальные возможности, скрытые в ваших данных, мои новые знания или предсказать новые перспективы KNIME Analytics Platform - это идеальный инструментарий для любого научного сотрудника и бизнес-аналитика с более чем 1000 модулями, сотнями примеров readytorun, широким спектром интегрированных инструментов и широким выбором передовых алгоритмов Этот курс для платформы KNIME Analytics - идеальная возможность для новичков, продвинутых пользователей и экспертов KNIME, которые будут представлены в KNIME, чтобы узнать, как использовать его более эффективно, и как создавать четкие, всеобъемлющие отчеты на основе рабочих процессов KNIME ,.
21 часов
Обзор
Apache Spark is a distributed processing engine for analyzing very large data sets. It can process data in batches and real-time, as well as carry out machine learning, ad-hoc queries, and graph processing. .NET for Apache Spark is a free, open-source, and cross-platform big data analytics framework that supports applications written in C# or F#.

This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.

By the end of this training, participants will be able to:

- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
28 часов
Обзор
MonetDB - это база данных с открытым исходным кодом, которая впервые использовала подход, основанный на использовании столбцов В этом обученном, живом обучении участники узнают, как использовать MonetDB и как извлечь из него максимум пользы К концу этого тренинга участники смогут: Понимание MonetDB и его возможностей Установите и начните с MonetDB Изучите и выполните различные функции и задачи в MonetDB Ускорьте доставку своего проекта, максимизируя возможности MonetDB Аудитория Разработчики Технические эксперты Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
7 часов
Обзор
This instructor-led, live training (online or onsite) is aimed at technical persons who wish to learn how to implement a machine learning strategy while maximizing the use of big data.

By the end of this training, participants will:

- Understand the evolution and trends for machine learning.
- Know how machine learning is being used across different industries.
- Become familiar with the tools, skills and services available to implement machine learning within an organization.
- Understand how machine learning can be used to enhance data mining and analysis.
- Learn what a data middle backend is, and how it is being used by businesses.
- Understand the role that big data and intelligent applications are playing across industries.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
28 часов
Обзор
MemSQL - это система управления базами данных SQL, распределенная, SQL для облачных вычислений и onpremises Это хранилище данных в реальном времени, которое сразу же дает информацию о реальных и исторических данных В этом обученном, живом обучении участники изучат основы MemSQL для разработки и администрирования К концу этого тренинга участники смогут: Понимание ключевых понятий и характеристик MemSQL Установка, проектирование, обслуживание и эксплуатация MemSQL Оптимизация схем в MemSQL Улучшение запросов в MemSQL Производительность Benchmark в MemSQL Создание приложений с данными реального времени с использованием MemSQL Аудитория Разработчики Администраторы Операционные инженеры Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
21 часов
Обзор
MATLAB - это вычислительная среда и язык программирования, разработанный MathWorks ,.
7 часов
Обзор
В этом обученном, живом обучении участники узнают основные концепции архитектуры MapR Stream, поскольку они разрабатывают приложение для потокового воспроизведения в реальном времени К концу этого обучения участники смогут создавать приложения-производители и потребители для обработки данных потока в реальном времени Аудитория Разработчики Администраторы Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметка Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
14 часов
Обзор
Magellan - это механизм распределенного запуска с открытым исходным кодом для геопространственной аналитики больших данных Реализованный поверх Apache Spark, он расширяет Spark SQL и обеспечивает реляционную абстракцию для геопространственной аналитики В этом обученном, живом обучении представлены концепции и подходы к внедрению геопространственной аналитики и участников прогулок путем создания приложения прогнозирующего анализа с использованием Magellan on Spark К концу этого тренинга участники смогут: Эффективный запрос, анализ и объединение геопространственных наборов данных в масштабе Внедрение геопространственных данных в приложениях бизнес-аналитики и прогнозирования Использование пространственного контекста для расширения возможностей мобильных устройств, датчиков, журналов и носителей Аудитория Разработчики приложений Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
14 часов
Обзор
Apache Kylin - экстремальный, распределенный механизм анализа больших данных В этом обученном живом обучении участники узнают, как использовать Apache Kylin для создания хранилища данных в реальном времени К концу этого тренинга участники смогут: Потребляйте потоковые данные в реальном времени с помощью Kylin Используйте мощные функции Apache Kylin, в том числе поддержку схемы снежинок, богатый интерфейс SQL, искрообразование и подсекундную задержку запроса Заметка Мы используем последнюю версию Kylin (на момент написания этой статьи, Apache Kylin v20) Аудитория Большие инженеры по данным Аналитики крупных данных Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
7 часов
Обзор
Confluent KSQL is a stream processing framework built on top of Apache Kafka. It enables real-time data processing using SQL operations.

This instructor-led, live training (online or onsite) is aimed at developers who wish to implement Apache Kafka stream processing without writing code.

By the end of this training, participants will be able to:

- Install and configure Confluent KSQL.
- Set up a stream processing pipeline using only SQL commands (no Java or Python coding).
- Carry out data filtering, transformations, aggregations, joins, windowing, and sessionization entirely in SQL.
- Design and deploy interactive, continuous queries for streaming ETL and real-time analytics.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 часов
Обзор
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
21 часов
Обзор
Обнаружение знаний в базах данных (KDD) - это процесс обнаружения полезных знаний из набора данных Приложения Reallife для этой технологии интеллектуального анализа данных включают маркетинг, обнаружение мошенничества, телекоммуникации и производство В этом курсе мы вводим процессы, задействованные в KDD, и выполняем серию упражнений для практической реализации этих процессов Аудитория Аналитики данных или все, кто интересуется обучением интерпретации данных для решения проблем Формат курса После теоретического обсуждения KDD преподаватель представит случаи reallife, которые требуют применения KDD для решения проблемы Участники будут готовить, выбирать и очищать образцы данных и использовать свои предварительные знания о данных для предложения решений на основе результатов своих наблюдений ,.
7 часов
Обзор
Apache NiFi (Hortonworks DataFlow) - это интегрированная в реальном времени логистика данных и простая платформа обработки событий, которая позволяет перемещать, отслеживать и автоматизировать данные между системами Он написан с использованием потокового программирования и предоставляет веб-интерфейс пользователя для управления потоками данных в режиме реального времени В этом обученном, живом обучении участники будут изучать основы потокового программирования, поскольку они разрабатывают ряд демонстрационных расширений, компонентов и процессоров, использующих Apache NiFi К концу этого тренинга участники смогут: Понимание архитектуры и потоков данных NiFi Разработка расширений с использованием NiFi и сторонних API Пользовательский разработчик собственного процессора Apache Nifi Загружать и обрабатывать данные в реальном времени из разрозненных и необычных форматов файлов и источников данных Аудитория Разработчики Инженеры по данным Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
7 часов
Обзор
Kafka Streams - это клиентская библиотека для создания приложений и микросервисов, данные которых передаются в систему обмена сообщениями Kafka и из нее Традиционно Apache Kafka полагался на Apache Spark или Apache Storm для обработки данных между производителями сообщений и потребителями Вызывая API-интерфейс Kafka Streams внутри приложения, данные могут обрабатываться непосредственно внутри Kafka, минуя необходимость отправки данных в отдельный кластер для обработки В этом обученном, живом обучении участники узнают, как интегрировать потоки Kafka в набор примеров Java-приложений, которые передают данные в Apache Kafka и из Apache Kafka для обработки потока К концу этого тренинга участники смогут: Понимание возможностей и преимуществ Kafka Streams над другими структурами обработки потоков Данные потока процесса непосредственно в кластере Kafka Напишите приложение Java или Scala или микросервис, который интегрируется с потоками Кафки и Кафки Напишите сжатый код, который преобразует входные темы Kafka в выходные темы Kafka Сборка, упаковка и развертывание приложения Аудитория Разработчики Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
21 часов
Обзор
Обработка потоков относится к обработке в реальном времени «данных в движении», то есть выполнению вычислений по данным по мере их получения Такие данные считываются как непрерывные потоки из источников данных, таких как события датчиков, активность пользователя веб-сайта, финансовые сделки, проверки кредитных карт, потоки кликов и т Д Структуры обработки потоков способны считывать большие объемы поступающих данных и предоставлять ценную информацию почти мгновенно В этом обученном, живом обучении (на месте или удаленном) участники узнают, как настраивать и интегрировать различные платформы Stream Processing с существующими большими системами хранения данных и сопутствующими программными приложениями и микросервисами К концу этого тренинга участники смогут: Установка и настройка различных инфраструктур Stream Processing, таких как Spark Streaming и Kafka Streaming Понять и выбрать наиболее подходящую структуру для работы Процесс данных непрерывно, одновременно и в режиме записи в режиме записи Интеграция решений Stream Processing с существующими базами данных, хранилищами данных, данными озерами и т Д Интеграция наиболее подходящей библиотеки обработки потоков с корпоративными приложениями и микросервисами Аудитория Разработчики Архитекторов программного обеспечения Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
14 часов
Обзор
Этот курс предназначен для Разработчики Формат курса Лекции, практика рук, небольшие тесты на пути к оценке понимания ,.
21 часов
Обзор
Cloudera Impala - это механизм запросов SQL запросов с открытым исходным кодом (MPP) для кластеров Apache Hadoop Impala позволяет пользователям выпускать низкозависимые SQL-запросы к данным, хранящимся в распределенной файловой системе Hadoop и Apache Hbase без необходимости перемещения данных или преобразования Аудитория Этот курс предназначен для аналитиков и ученых, осуществляющих анализ данных, хранящихся в Hadoop с помощью инструментов Business Intelligence или SQL После этого курса делегаты смогут Извлеките значимую информацию из кластеров Hadoop с Impala Напишите конкретные программы для облегчения бизнес-аналитики в диалоговом диалоговом окне Impala SQL Устранение неполадок Impala ,.
7 часов
Обзор
Этот курс посвящен использованию языка языка Hive (AKA: Hive HQL, SQL on Hive, HiveQL) для людей, которые извлекают данные из Hive ,.
21 часов
Обзор
Hortonworks Data Platform - это платформа поддержки Apache Hadoop с открытым исходным кодом, которая обеспечивает стабильную основу для разработки больших решений для данных в экосистеме Apache Hadoop Это обучаемое обучение в прямом эфире представляет Hortonworks и проходит участников через развертывание решения Spark + Hadoop К концу этого тренинга участники смогут: Используйте Hortonworks для надежного запуска Hadoop в больших масштабах Унифицируйте возможности Hadoop для обеспечения безопасности, управления и операций с помощью гибких аналитических рабочих процессов Spark Используйте Hortonworks для исследования, проверки, сертификации и поддержки каждого из компонентов проекта Spark Обработать различные типы данных, включая структурированные, неструктурированные, inmotion и atrest Аудитория Администраторы Hadoop Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
21 часов
Обзор
Этот курс представляет HBase - хранилище NoSQL поверх Hadoop Курс предназначен для разработчиков, которые будут использовать HBase для разработки приложений и администраторов, которые будут управлять кластерами HBase Мы будем продвигать разработчика через архитектуру HBase и моделирование данных и разработку приложений на HBase Он также обсудит использование MapReduce с HBase и некоторые темы администрирования, связанные с оптимизацией производительности Курс очень хорош с большим количеством лабораторных упражнений Продолжительность : 3 дня Аудитория : разработчики и администраторы ,.
28 часов
Обзор
Hadoop - популярная платформа обработки больших данных Python - высокоуровневый язык программирования, известный своим четким синтаксисом и удобочитаемостью кода В этом обученном, живом обучении участники узнают, как работать с Hadoop, MapReduce, Pig и Spark с помощью Python, когда они проходят через несколько примеров и случаев использования К концу этого тренинга участники смогут: Понимать основные понятия, лежащие в основе Hadoop, MapReduce, Pig и Spark Используйте Python с распределенной файловой системой Hadoop (HDFS), MapReduce, Pig и Spark Используйте Snakebite для программного доступа к HDFS в Python Использовать mrjob для записи заданий MapReduce в Python Записывать программы Spark с помощью Python Расширьте функциональность свиней, используя UDF Python Управление заданиями MapReduce и скриптами свиней с использованием Luigi Аудитория Разработчики ИТ-специалисты Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
28 часов
Обзор
Аудитория: Этот курс предназначен для демистификации большой технологии data / hadoop и для того, чтобы показать, что это не сложно понять ,.
14 часов
Обзор
По мере того, как все больше и больше программных и ИТ-проектов переходят от локальной обработки и управления данными к распределенной обработке и большому хранению данных, руководители проектов находят потребность в обновлении своих знаний и навыков, чтобы понять концепции и методы, связанные с проектами и возможностями Big Data Этот курс знакомит менеджеров проектов с самой популярной платформой обработки больших данных: Hadoop В этом обученном обучении участники узнают основные компоненты экосистемы Hadoop и способы использования этих технологий для решения крупных проблем Изучая эти основы, участники также улучшат свою способность общаться с разработчиками и разработчиками этих систем, а также с учеными и аналитиками по данным, которые связаны со многими ИТ-проектами Аудитория Менеджеры проектов, желающие внедрить Hadoop в существующую инфраструктуру разработки или ИТ-инфраструктуры Руководители проектов, которым необходимо общаться с кросс-функциональными командами, включая крупных инженеров данных, ученых-аналитиков и бизнес-аналитиков Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
21 часов
Обзор
Apache NiFi (Hortonworks DataFlow) - это интегрированная в реальном времени логистика данных и простая платформа обработки событий, которая позволяет перемещать, отслеживать и автоматизировать данные между системами Он написан с использованием потокового программирования и предоставляет веб-интерфейс пользователя для управления потоками данных в режиме реального времени В этом обученном, живом обучении участники узнают, как развернуть и управлять Apache NiFi в живой лабораторной среде К концу этого тренинга участники смогут: Установка и настройка Apachi NiFi Источник, преобразование и управление данными из разрозненных распределенных источников данных, в том числе баз данных и больших озер данных Автоматизация потоков данных Включить поточную аналитику Применять различные подходы к проглатыванию данных Преобразование больших данных и понимание бизнеса Аудитория Системные администраторы Инженеры по данным Разработчики DevOps Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
14 часов
Обзор
Цель курса - дать участникам возможность овладеть тем, как работать с языком SQL в базе данных Oracle для извлечения данных на промежуточном уровне ,.
21 часов
Обзор
Apache Hadoop - одна из самых популярных платформ для обработки больших данных на кластерах серверов Этот курс углубляется в управление данными в HDFS, продвинутых Pig, Hive и HBase Эти передовые методы программирования будут полезны опытным разработчикам Hadoop Аудитория : разработчики Продолжительность: три дня Формат: лекции (50%) и карманные лаборатории (50%) ,.
35 часов
Обзор
MLlib - библиотека обучения по изучению аппаратов Spark (ML) Его цель - сделать практическое машинное обучение масштабируемым и легким Он состоит из общих алгоритмов обучения и утилит, включая классификацию, регрессию, кластеризацию, совместную фильтрацию, уменьшение размерности, а также примитивы оптимизации нижнего уровня и API-интерфейсы верхнего уровня Он делится на два пакета: sparkmllib содержит оригинальный API, созданный на основе RDD sparkml обеспечивает API более высокого уровня, построенный поверх DataFrames для построения ML-конвейеров Аудитория Этот курс направлен на инженеров и разработчиков, стремящихся использовать встроенную библиотеку машин для Apache Spark ,.
14 часов
Обзор
Apache Zeppelin - это веб-ноутбук для захвата, изучения, визуализации и совместного использования данных Hadoop и Spark Эта обучаемая тренировка представляет собой концепцию интерактивной аналитики данных и позволяет участникам проходить через развертывание и использование Zeppelin в среде однопользовательского или многопользовательского режима К концу этого тренинга участники смогут: Установка и настройка Zeppelin Разрабатывать, организовывать, выполнять и обмениваться данными в интерфейсе на основе браузера Визуализировать результаты без ссылки на данные командной строки или кластера Выполнять и сотрудничать с длинными рабочими процессами Работайте с любым из нескольких языков плагинов / dataprocessingbackends, таких как Scala (с Apache Spark), Python (с Apache Spark), Spark SQL, JDBC, Markdown и Shell Интеграция Zeppelin с Spark, Flink и Map Reduce Защищенные многопользовательские экземпляры Zeppelin с Apache Shiro Аудитория Инженеры по данным Аналитики данных Ученые данных Разработчики программного обеспечения Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
14 часов
Обзор
Vespa - отличная технология обработки данных и обслуживания, созданная Yahoo Он используется для ответа на запросы пользователей, предоставления рекомендаций и предоставления персонализированного контента и рекламы в режиме реального времени Эта обучаемая тренировка, предназначенная для инструкторов, знакомит с задачами предоставления обширных данных и участия участников через создание приложения, которое может вычислять ответы на запросы пользователей, в больших наборах данных в реальном времени К концу этого тренинга участники смогут: Используйте Vespa для быстрого вычисления данных (хранения, поиска, ранжирования, организации) во время обслуживания, пока пользователь ждет Внедрение Vespa в существующие приложения, включающие поиск функций, рекомендации и персонализацию Интеграция и развертывание Vespa с существующими большими системами данных, такими как Hadoop и Storm Аудитория Разработчики Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
выходные Big Data курсы, курсы Big Data выходного дня, вечерние Big Data курсы, Big Data технические учебные курсы, Big Data буткемп, Big Data буткэмп, Big Data курсы с инструктором, Big Data тренинг с инструктором, выходной Big Data тренинг, тренинг Big Data выходного дня, вечерние Big Data курсы, Big Data коачинг, Big Data тренерство, Big Data тренинг, Big Data инструктор, Big Data тренер, Big Data коач, Big Data курсы, Big Data занятия, Big Data локальные, Big Data частные занятия, Big Data частные курсы, Big Data индивидуальный тренинг, Big Data индивидуальные занятия

Скидки

В настоящее время акции не проводятся

Информационная рассылка

Мы уважаем конфиденциальность Ваших персональных данных. Мы обязуемся не передавать Ваши данные третьим лицам. Вы всегда можете изменить свои настройки конфиденциальности или полностью отказаться от подписки.

Наши клиенты

is growing fast!

We are looking for a good mixture of IT and soft skills in Russia!

As a NobleProg Trainer you will be responsible for:

  • delivering training and consultancy Worldwide
  • preparing training materials
  • creating new courses outlines
  • delivering consultancy
  • quality management

At the moment we are focusing on the following areas:

  • Statistic, Forecasting, Big Data Analysis, Data Mining, Evolution Alogrithm, Natural Language Processing, Machine Learning (recommender system, neural networks .etc...)
  • SOA, BPM, BPMN
  • Hibernate/Spring, Scala, Spark, jBPM, Drools
  • R, Python
  • Mobile Development (iOS, Android)
  • LAMP, Drupal, Mediawiki, Symfony, MEAN, jQuery
  • You need to have patience and ability to explain to non-technical people

To apply, please create your trainer-profile by going to the link below:

Apply now!

This site in other countries/regions