Big Data Scientist
Volg de Big Data Scientist training. Word jij een Certified Big Data Scientist?
Na afronding van deze training kun je onder andere:
Training: Big Data Scientist
Deze 4-daagse Big Data Scientist training is een vervolg op de training Big Data Fundamentals (BDF) en bestaat uit 4 modules. Na elke module kan men het bijbehorende examen doen. Indien alle examens positief worden afgesloten is de deelnemer Certified Big Data Scientist. De training wordt in 4 blokken van 1 dag gepland, verdeeld over ongeveer 4 weken.
De modules zijn onderdeel van het Big Data Science Certified Professional (BDSCP) curriculum van Arcitura Education. Het Big Data Science Certified Professional (BDSCP) programma van Arcitura is gericht op excellentie op het gebied van Big Data wetenschap, analyse, analytics, business intelligence, en technologie-architectuur, evenals ontwerp, ontwikkeling en governance.
BDF, Big Data Fundamentals
Deze training is bedoeld voor iedereen die na het volgen van de training Big Data Fundamentals tot de conclusie is gekomen dat zij of hij meer inzicht wil of moet verkrijgen in het vakgebied Big Data.
In deze training ligt het accent meer op kennisverbreding dan op kennisverdieping; de deelnemers worden niet opgeleid tot specialist maar tot generalist. Overzicht verkrijgen is belangrijk, want wie dat overzicht mist kan niet op een succesvolle manier deel uitmaken van een Big Data team.
Module 1: Big Data Analysis & Technology Concepts
- Big Data Analysis Lifecycle (from business case evaluation to data analysis and visualization)
- A/B Testing, Correlation
- Regression, Heat Maps
- Time Series Analysis
- Network Analysis
- Spatial Data Analysis
- Classification, Clustering
- Outlier Detection
- Filtering (including collaborative filtering & content-based filtering)
- Natural Language Processing
- Sentiment Analysis, Text Analytics
- File Systems & Distributed File Systems, NoSQL
- Distributed & Parallel Data Processing,
- Processing Workloads, Clusters
- Cloud Computing & Big Data
- Foundational Big Data Technology Mechanisms
Module 2: Fundamentals Big Data Analysis & Science
- Data Science, Data Mining & Data Modeling
- Big Data Dataset Categories
- Exploratory Data Analysis (EDA) (including numerical summaries, rules & data reduction)
- EDA analysis types (including univariate, bivariate & multivariate)
- Essential Statistics (including variable categories & relevant mathematics)
- Statistics Analysis (including descriptive, inferential, correlation, covariance & hypothesis testing)
- Data Munging & Machine Learning
- Variables & Basic Mathematical Notations
- Statistical Measures & Statistical Inference
- Distributions & Data Processing Techniques
- Data Discretization, Binning, Clustering
- Visualization Techniques & Numerical Summaries
- Correlation for Big Data
- Time Series Analysis for Big Data
Module 3: Advanced Big Data Analysis & Science
- Statistical Models, Model Evaluation Measures (including cross-validation, bias-variance, confusion matrix & f-score)
- Machine Learning Algorithms, Pattern Identification (including association rules & apriori algorithm)
- Advanced Statistical Techniques (including parametric vs. non-parametric, clustering vs. non-clustering distance-based, supervised vs. semi-supervised)
- Linear Regression & Logistic Regression for Big Data
- Decision Trees for Big Data
- Classification Rules for Big Data
- K Nearest Neighbor (kNN) for Big Data
- Naïve Bayes for Big Data
- Association Rules for Big Data
- K-means for Big Data
- Text Analytics for Big Data
- Outlier Detection for Big Data
Module 4: Big Data Analysis & Science lab
This course module covers a series of exercises and problems designed to test the participant’s ability to apply knowledge of topics covered previously in course modules 4 and 5. Completing this lab will help highlight areas that require further attention, and will further prove hands-on proficiency in Big Data analysis and science practices as they are applied and combined to solve real-world problems.
As a hands-on lab, this course incorporates a set of detailed exercises that require participants to solve various inter-related problems, with the goal of fostering a comprehensive understanding of how different data analysis techniques can be applied to solve problems in Big Data environments and used to make significant, relevant predictions that offer increased business value.
In de klas, online of beiden.
Klassikaal
Bij de klassikale lesvorm voor trainingen staat een ervaren docent voor de klas. De gecertificeerde, praktijkgerichte trainer begeleidt je door de lesstof, geeft uitleg, laat voorbeelden zien, geeft hands-on opdrachten en behandelt vragen. Alle cursisten leren in hetzelfde tempo en krijgen dezelfde lesstof. De docent bepaalt het tempo afhankelijk van de behoefte van de groep.
Incompany
Wist jij dat alle IT trainingen die we aanbieden op de website ook bij jouw bedrijf uitgevoerd kunnen worden? Zo volg je een maatwerk IT training (Incompany training) met al je collega’s. Jij kunt de training nog specifieker voor jouw bedrijf laten inrichten en het is zelfs mogelijk om een geheel maatwerk traject door ons te laten ontwerpen.
Je bespaart reiskosten en reistijd voor de deelnemers, doordat onze trainer bij jou op locatie komt. Op deze manier kun je meerdere deelnemers van jouw organisatie dezelfde training laten volgen. Dat is efficiënt en effectief! Samen heb je een gemeenschappelijke opleidingsbehoefte en daar gaan we je bij helpen.
We hebben jarenlang ervaring in het geven van maatwerk it trainingen. We kijken zorgvuldig naar de opleidingsbehoefte om volledig aan te sluiten bij je wensen. Zo formuleren we haalbare en concrete doelstellingen en deelnemers kunnen het geleerde in de praktijk toepassen. Op deze manier groeien deelnemers persoonlijk en professioneel op meerdere niveaus.