Алгоритмы машинного обучения: базовый курс. Тайлер Венс

Алгоритмы машинного обучения: базовый курс - Тайлер Венс


Скачать книгу
репрезентативности и качества модели. Кроме того, работа с большими объёмами данных требует понимания законов больших чисел и центральной предельной теоремы, которые объясняют поведение выборочных данных при увеличении их объёма.

      Элементы математической статистики обеспечивают инструментарий для анализа данных, выявления закономерностей и построения моделей, что делает её неотъемлемой частью машинного обучения. Знание этих основ позволяет глубже понять алгоритмы и их применение к реальным задачам.

      Список тем из математической статистики, которые рекомендуется повторить перед началом изучения машинного обучения:

      1. Описательная статистика

      – Среднее, медиана, мода.

      – Дисперсия и стандартное отклонение.

      – Квантили, процентиль, интерквартильный размах.

      2. Вероятностные распределения

      – Нормальное распределение.

      – Биномиальное и пуассоновское распределения.

      – Экспоненциальное и равномерное распределения.

      3. Теория вероятностей

      – Основы вероятности и правила вычислений.

      – Условная вероятность и независимость событий.

      – Теорема Байеса и её применение.

      4. Корреляция и ковариация

      – Коэффициент корреляции Пирсона.

      – Анализ линейной зависимости между переменными.

      – Матрица ковариации.

      5. Регрессия

      – Простая линейная регрессия.

      – Множественная регрессия.

      – Интерпретация коэффициентов регрессии.

      6. Статистические тесты

      – t-тест (для одной и двух выборок).

      – ANOVA (дисперсионный анализ).

      – χ²-тест (хи-квадрат тест).

      7. Выборка и распределение выборочных данных

      – Случайная выборка.

      – Закон больших чисел.

      – Центральная предельная теорема.

      8. Гипотезы и их проверка

      – Нулевая и альтернативная гипотезы.

      – Уровень значимости (p-value).

      – Ошибки первого и второго рода.

      9. Методы оценки параметров

      – Метод максимального правдоподобия.

      – Метод наименьших квадратов.

      10. Байесовская статистика

      – Теорема Байеса.

      – Апостериорная вероятность.

      – Байесовские подходы в машинном обучении.

      11. Работа с данными

      – Очистка и предобработка данных.

      – Обнаружение выбросов.

      – Пропущенные значения и их обработка.

      Изучение этих тем поможет лучше понимать основы анализа данных, что облегчит освоение алгоритмов машинного обучения и их применения к реальным задачам.

Python как основной инструмент для работы с данными и машинным обучением

      Python стал одним из самых популярных языков программирования для работы с данными и машинным обучением благодаря своей простоте,


Скачать книгу