Местные учебные курсы, посвященные активному обучению Apache Spark, демонстрируют практическую практику, как Spark вписывается в экосистему Big Data и как использовать Spark для анализа данных Обучение Apache Spark доступно как «живое обучение на месте» или «дистанционное живое обучение» На месте живое обучение может проводиться локально в помещениях клиента в Russia или в корпоративных учебных центрах NobleProg Russia , Дистанционное обучение в реальном времени осуществляется с помощью интерактивного удаленного рабочего стола NobleProg Ваш местный провайдер обучения.
Machine Translated
Отзывы
★★★★★
★★★★★
диаграмма концепции совместного использования, а также образец для рук, грязных
Mark Yang - FMR
Курсы: Spark for Developers
Machine Translated
Применимые сценарии и случаи
zhaopeng liu - Fmr
Курсы: Spark for Developers
Machine Translated
Анализ случая 张 国栋 - F
国栋 张
Курсы: Spark for Developers
Machine Translated
все части этой сессии
Eric Han - Fmr
Курсы: Spark for Developers
Machine Translated
Мы знаем гораздо больше об окружающей среде
John Kidd
Курсы: Spark for Developers
Machine Translated
Тренер сделал класс интересным и интересным, что очень помогает во всех дневных тренировках
Ryan Speelman
Курсы: Spark for Developers
Machine Translated
Я думаю, что у тренера был отличный стиль сочетания юмора и реальных жизненных историй, чтобы подданные под рукой были очень доступными. Я бы очень рекомендовал этого профессора в будущем
Курсы: Spark for Developers
Machine Translated
Эрнесто проделал отличную работу, объясняя концепции высокого уровня использования Spark и различных модулей
Michael Nemerouf
Курсы: Spark for Developers
Machine Translated
Это один из лучших handsons с курсами программирования упражнений, которые я когда-либо делал
Laura Kahn
Курсы: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Это одно из лучших онлайн-тренингов, которые я когда-либо занимал в своей 13-летней карьере. Продолжайте в том же духе
Курсы: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Учитель адаптировал программу обучения к нашим текущим потребностям.
EduBroker Sp. z o.o.
Курсы: Python and Spark for Big Data (PySpark)
Machine Translated
Выполнение подобных упражнений различными способами действительно помогает понять, что каждый компонент ( Hadoop / Spark, автономный / кластерный) может делать самостоятельно и вместе. Это дало мне идеи о том, как я должен тестировать свое приложение на моей локальной машине, когда я разрабатываю против, когда оно развернуто в кластере.
Thomas Carcaud - IT Frankfurt GmbH
Курсы: Spark for Developers
Machine Translated
индивидуального внимания.
ARCHANA ANILKUMAR - PPL
Курсы: Python and Spark for Big Data (PySpark)
Machine Translated
Было здорово получить представление о том, что происходит под капотом Spark. Знание того, что происходит под капотом, помогает лучше понять, почему ваш код делает или не делает то, что вы ожидаете от него. Много обучения было руки, на которых всегда велика, и раздел по оптимизации был исключительно актуальным для моей нынешней работы, которая была хорошей.
Intelligent Medical Objects
Курсы: Apache Spark in the Cloud
Machine Translated
Я думаю, что у тренера был отличный стиль сочетания юмора и реальных жизненных историй, чтобы подданные под рукой были очень доступными. Я бы очень рекомендовал этого профессора в будущем
Курсы: Spark for Developers
Machine Translated
Это одно из лучших онлайн-тренингов, которые я когда-либо занимал в своей 13-летней карьере. Продолжайте в том же духе
Курсы: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
Alexio - это виртуальная распределенная система хранения с открытым исходным кодом, которая объединяет разрозненные системы хранения и позволяет приложениям взаимодействовать с данными со скоростью памяти Он используется такими компаниями, как Intel, Baidu и Alibaba В этом обученном, живом обучении участники узнают, как использовать Alexio для соединения различных вычислительных систем с системами хранения данных и эффективного управления массивами данных в масштабе всего набора, поскольку они проходят через создание приложения с помощью Alluxio К концу этого тренинга участники смогут: Разработка приложения с помощью Alluxio Соединяйте большие системы данных и приложения, сохраняя одно пространство имен Эффективно извлекайте ценность из больших данных в любом формате хранения Повысить производительность рабочей нагрузки Развертывание и управление автономным или кластеризованным Alluxio Аудитория Ученый данных разработчик Системный администратор Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
Большая аналитика данных включает в себя процесс изучения большого количества разнообразных наборов данных для выявления корреляций, скрытых шаблонов и других полезных сведений В отрасли здравоохранения имеется огромное количество сложных гетерогенных медицинских и клинических данных Применение большой аналитики данных по медицинским данным представляет огромный потенциал для получения информации о повышении качества медицинской помощи Однако огромность этих наборов данных создает большие проблемы при анализе и практическом применении в клинической среде В этом обученном, живом обучении (удаленном) участники узнают, как выполнять большую аналитику данных в области здоровья, когда они проходят через ряд упражнений для упражнений handson livelab К концу этого тренинга участники смогут: Установите и настройте инструменты большой аналитики данных, такие как Hadoop MapReduce и Spark Понять характеристики медицинских данных Применять большие методы данных для обработки медицинских данных Изучение больших систем данных и алгоритмов в контексте приложений для здоровья Аудитория Разработчики Ученые данных Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметка Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
Большое количество проблем реального мира можно описать в терминах графиков Например, веб-график, график социальной сети, график сети поездов и график языка Эти графики имеют тенденцию быть чрезвычайно большими; для их обработки требуется специализированный набор инструментов и процессов, которые эти инструменты и процессы могут называться Graph Computing (также известными как Graph Analytics) В этом обученном, живом обучении участники узнают о предлагаемых технологиях и подходах к реализации для обработки графических данных Цель состоит в том, чтобы идентифицировать объекты реального мира, их характеристики и отношения, а затем моделировать эти отношения и обрабатывать их как данные с использованием подхода графового вычисления Мы начинаем с широкого обзора и узкого подхода к конкретным инструментам, когда мы проводим серию тематических исследований, упражнений для рук и живого развертывания К концу этого тренинга участники смогут: Понять, как сохраняются и перемещаются данные графика Выберите наилучшую структуру для заданной задачи (из графических баз данных в рамки пакетной обработки) Внедрите Hadoop, Spark, GraphX и Pregel для выполнения графических вычислений на многих машинах параллельно Просмотр больших проблем с данными в реальном времени с точки зрения графиков, процессов и обходов Аудитория Разработчики Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
Hortonworks Data Platform - это платформа поддержки Apache Hadoop с открытым исходным кодом, которая обеспечивает стабильную основу для разработки больших решений для данных в экосистеме Apache Hadoop Это обучаемое обучение в прямом эфире представляет Hortonworks и проходит участников через развертывание решения Spark + Hadoop К концу этого тренинга участники смогут: Используйте Hortonworks для надежного запуска Hadoop в больших масштабах Унифицируйте возможности Hadoop для обеспечения безопасности, управления и операций с помощью гибких аналитических рабочих процессов Spark Используйте Hortonworks для исследования, проверки, сертификации и поддержки каждого из компонентов проекта Spark Обработать различные типы данных, включая структурированные, неструктурированные, inmotion и atrest Аудитория Администраторы Hadoop Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
Обработка потоков относится к обработке в реальном времени «данных в движении», то есть выполнению вычислений по данным по мере их получения Такие данные считываются как непрерывные потоки из источников данных, таких как события датчиков, активность пользователя веб-сайта, финансовые сделки, проверки кредитных карт, потоки кликов и т Д Структуры обработки потоков способны считывать большие объемы поступающих данных и предоставлять ценную информацию почти мгновенно В этом обученном, живом обучении (на месте или удаленном) участники узнают, как настраивать и интегрировать различные платформы Stream Processing с существующими большими системами хранения данных и сопутствующими программными приложениями и микросервисами К концу этого тренинга участники смогут: Установка и настройка различных инфраструктур Stream Processing, таких как Spark Streaming и Kafka Streaming Понять и выбрать наиболее подходящую структуру для работы Процесс данных непрерывно, одновременно и в режиме записи в режиме записи Интеграция решений Stream Processing с существующими базами данных, хранилищами данных, данными озерами и т Д Интеграция наиболее подходящей библиотеки обработки потоков с корпоративными приложениями и микросервисами Аудитория Разработчики Архитекторов программного обеспечения Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
Magellan - это механизм распределенного запуска с открытым исходным кодом для геопространственной аналитики больших данных Реализованный поверх Apache Spark, он расширяет Spark SQL и обеспечивает реляционную абстракцию для геопространственной аналитики В этом обученном, живом обучении представлены концепции и подходы к внедрению геопространственной аналитики и участников прогулок путем создания приложения прогнозирующего анализа с использованием Magellan on Spark К концу этого тренинга участники смогут: Эффективный запрос, анализ и объединение геопространственных наборов данных в масштабе Внедрение геопространственных данных в приложениях бизнес-аналитики и прогнозирования Использование пространственного контекста для расширения возможностей мобильных устройств, датчиков, журналов и носителей Аудитория Разработчики приложений Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
Apache Spark is a distributed processing engine for analyzing very large data sets. It can process data in batches and real-time, as well as carry out machine learning, ad-hoc queries, and graph processing. .NET for Apache Spark is a free, open-source, and cross-platform big data analytics framework that supports applications written in C# or F#.
This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.
By the end of this training, participants will be able to:
- Install and configure Apache Spark. - Understand how .NET implements Spark APIs so that they can be accessed from a .NET application. - Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes. - Develop machine learning features for a .NET application using Apache Spark capabilities. - Carry out exploratory analysis using SQL queries on big data sets.
Format of the Course
- Interactive lecture and discussion. - Lots of exercises and practice. - Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
SMACK is a collection of data platform softwares, namely Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, and Apache Kafka. Using the SMACK stack, users can create and scale data processing platforms.
This instructor-led, live training (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions.
By the end of this training, participants will be able to:
- Implement a data pipeline architecture for processing big data. - Develop a cluster infrastructure with Apache Mesos and Docker. - Analyze data with Spark and Scala. - Manage unstructured data with Apache Cassandra.
Format of the Course
- Interactive lecture and discussion. - Lots of exercises and practice. - Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Apache Spark is an analytics engine designed to distribute data across a cluster in order to process it in parallel. It contains modules for streaming, SQL, machine learning and graph processing.
This instructor-led, live training (online or onsite) is aimed at engineers who wish to deploy Apache Spark system for processing very large amounts of data.
By the end of this training, participants will be able to:
- Install and configure Apache Spark. - Understand the difference between Apache Spark and Hadoop MapReduce and when to use which. - Quickly read in and analyze very large data sets. - Integrate Apache Spark with other machine learning tools.
Format of the Course
- Interactive lecture and discussion. - Lots of exercises and practice. - Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Apache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc. Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.
ЗАДАЧА: Этот курс представит Apache Spark Студенты узнают, как Spark вписывается в экосистему Big Data и как использовать Spark для анализа данных Курс охватывает оболочку Spark для интерактивного анализа данных, внутренних компонентов Spark, Spark API, Spark SQL, Spark streaming и машинного обучения и GraphX АУДИТОРИЯ : Разработчики / аналитики данных ,.
Python - высокоуровневый язык программирования, известный своим четким синтаксисом и удобочитаемостью кода Spark - это механизм обработки данных, используемый при запросе, анализе и преобразовании больших данных PySpark позволяет пользователям взаимодействовать с Spark с Python В этом обученном, живом тренинге участники узнают, как использовать Python и Spark вместе для анализа больших данных, когда они работают над упражнениями handson К концу этого тренинга участники смогут: Узнайте, как использовать Spark с Python для анализа больших данных Работа над упражнениями, имитирующими реальные обстоятельства Используйте различные инструменты и методы для анализа больших данных с использованием PySpark Аудитория Разработчики ИТ-специалисты Ученые данных Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
Scala - это сжатая версия Java для крупномасштабного функционального и объектно-ориентированного программирования. Apache Spark Streaming - это расширенный компонент API Spark для обработки больших наборов данных в виде потоков в реальном времени. Вместе Spark Streaming и Scala обеспечивают потоковую передачу больших данных.
Это интерактивное обучение под руководством инструктора (локальное или дистанционное) предназначено для разработчиков программного обеспечения, которые хотят передавать большие объемы данных с помощью Spark Streaming и Scala .
К концу этого тренинга участники смогут:
- Создавайте приложения Spark на языке программирования Scala . - Используйте Spark Streaming для обработки непрерывных потоков данных. - Обрабатывайте потоки данных в реальном времени с помощью Spark Streaming.
Формат курса
- Интерактивная лекция и обсуждение. - Много упражнений и практики. - Практическая реализация в среде живых лабораторий.
Параметры настройки курса
- Чтобы заказать индивидуальное обучение для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться.
Spark SQL - это модуль Apache Spark для работы со структурированными и неструктурированными данными Spark SQL предоставляет информацию о структуре данных, а также о выполненном вычислении Эта информация может использоваться для выполнения оптимизации Два распространенных применения Spark SQL: для выполнения SQL-запросов для чтения данных из существующей установки Hive В этом обученном, живом обучении (на месте или удаленном) участники узнают, как анализировать различные типы наборов данных, используя Spark SQL К концу этого тренинга участники смогут: Установите и настройте Spark SQL Выполнение анализа данных с использованием Spark SQL Набор данных запроса в разных форматах Визуализируйте данные и результаты запроса Аудитория Аналитики данных Ученые данных Инженеры по данным Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
MLlib - библиотека обучения по изучению аппаратов Spark (ML) Его цель - сделать практическое машинное обучение масштабируемым и легким Он состоит из общих алгоритмов обучения и утилит, включая классификацию, регрессию, кластеризацию, совместную фильтрацию, уменьшение размерности, а также примитивы оптимизации нижнего уровня и API-интерфейсы верхнего уровня Он делится на два пакета: sparkmllib содержит оригинальный API, созданный на основе RDD sparkml обеспечивает API более высокого уровня, построенный поверх DataFrames для построения ML-конвейеров Аудитория Этот курс направлен на инженеров и разработчиков, стремящихся использовать встроенную библиотеку машин для Apache Spark ,.
We are looking for a good mixture of IT and soft skills in Russia!
As a NobleProg Trainer you will be responsible for:
delivering training and consultancy Worldwide
preparing training materials
creating new courses outlines
delivering consultancy
quality management
At the moment we are focusing on the following areas:
Statistic, Forecasting, Big Data Analysis, Data Mining, Evolution Alogrithm, Natural Language Processing, Machine Learning (recommender system, neural networks .etc...)
SOA, BPM, BPMN
Hibernate/Spring, Scala, Spark, jBPM, Drools
R, Python
Mobile Development (iOS, Android)
LAMP, Drupal, Mediawiki, Symfony, MEAN, jQuery
You need to have patience and ability to explain to non-technical people
To apply, please create your trainer-profile by going to the link below: