Titanic – Machine Learning From Disaster

Jak pewnie wiecie, do konferencji SQLDAY zostały już tylko okrągłe 33 dni. Pomyślałem że to najwyższa pora wziąć się za przygotowywanie warsztatów. Najpierw zacząłem wypisywać tematy o których chciałbym opowiedzieć. Jak doszedłem do trzeciej strony, uznałem że z warsztatów zrobiłby się długi i nudny wykład.

Postanowiłem więc zamienić wykład w którym tematy są ułożone mniej więcej jak rozdziały w książce serią eksperymentów w tracie których będę omawiać potrzebne w danym momencie techniki i teorię. Pierwszy z eksperymentów wygląda tak (poniżej są tytuły slajdów). A jako że został mi voucher na warsztaty chciałbym go dać tej osobie która podeśle mi najciekawszy temat kolejnego eksperymentu.

Titanic  – Machine Learning From Disaster

Background

Objectives and Techniques

Azure Machine Learning

Observations, Variables and Data Matrices

Types of Variables

Exploring Numerical Variables

Measures of Spread

Exploring Categorical Variables

Predictions in a Nutshell

Decision Trees

Attributes Selection

Information Gains

Example: Building Tree Based on Entropy

Gini Coefficient

DecisionTrees (ID3) Algorithm

Pruning Trees

Overfitting

Prediction Errors

Sampling Methods

Bootstrapping

Bootstrapping Limitations

Ensembles-Combining Classifiers

Bagging

Random Forest

Random Forest Variable Importance

Random Forests Pros and Cons

Decision Forests and Decision Jungles

Boosting

Adaboost meta-algorithm

Gradient Descent in a Nutshell

Boosted Decision Trees

Score Model

Ability to Generalize

Evaluate Model

Hypothesis Testing Framework

Hypothesis Test as a Trial

Accuracy

Accuracy isn’t always enough

Precision and Recall

ROC Plot

Lift

Summary

Share this article ...

Google Plus
Ihren LinkedIn Kontakten zeigen



This entry was posted in Azure, Business Intelligence, General, Machine Learning, R Scripts and tagged by Marcin Szeliga. Bookmark the permalink.
Marcin Szeliga

About Marcin Szeliga

Since 2006 invariably awarded Microsoft Most Valuable Professional title in the SQL category. A consultant, lecturer, authorized Microsoft trainer with 15 years’ experience, and a database systems architect. He prepared Microsoft partners for the upgrade to SQL Server 2008 and 2012 versions within the Train to Trainers program. A speaker at numerous conferences, including Microsoft Technology Summit, SQL Saturday, SQL Day, Microsoft Security Summit, Heroes Happen {Here}, as well as at user groups meetings. The author of many books and articles devoted to SQL Server.

Leave a Reply

Connect with:
  • This field its required.
  • This field its required.
    • Message is required