🤖 Математика для Data Science: терминология и обозначения

Для успешной работы с данными необходимы глубокие математические знания. Однако, прежде чем погрузиться в изучение продвинутых тем, важно освоить базовые математические обозначения и термины. Эта статья – первая часть путеводителя по основным символам, которые помогут вам уверенно читать и понимать книги и статьи по математической базе Data Science. Мы начнем с самых основ – действительных и комплексных чисел, затем перейдем к векторам и матрицам, после рассмотрим способы компактной записи сумм и произведений с помощью сигма- и пи-нотаций, а завершим обзором логарифмов.
🤖 Математика для Data Science: терминология и обозначения

Эта статья открывает серию публикаций, в которых мы подробно разберем все математические концепции, необходимые для успешной работы в Data Science. Основными темами станут:

  • Математические обозначения и терминология.
  • Случайные величины и распределения вероятностей.
  • Матрицы и линейная алгебра.
  • Функции потерь и оптимизация.
  • Вероятностное моделирование.
  • Временные ряды и прогнозирование.
  • Проверка гипотез.
  • Сложность модели.
  • Разложение функций.
  • Анализ сетей.
  • Динамические системы.
  • Ядерные методы.
  • Теория информации.
  • Непараметрические байесовские методы.
  • Случайные матрицы.

Все эти темы очень объемны, поэтому каждая из них будет рассмотрена в 2-3 статьях.

Математические обозначения

Математика – это язык, а математические символы и обозначения – его алфавит. Чтобы понимать книги и статьи по математической базе DS, важно хорошо разбираться в этом алфавите. Ниже мы рассмотрим основные математические обозначения и термины нескольких ключевых тем:

  • Действительные и комплексные числа.
  • Линейная алгебра (векторы и матрицы).
  • Суммы и произведения.
  • Логарифмы.

В следующей статье разберем обозначения и термины дифференциального и интегрального исчисления, математического анализа и комбинаторики.

Действительные и комплексные числа

В большинстве случаев дата-сайентисты работают с действительными числами (например, 4,6, 1 или -2,7). Их можно представить на числовой прямой:

Действительные (вещественные) числа – это все числа, которые можно представить на числовой прямой
Действительные (вещественные) числа – это все числа, которые можно представить на числовой прямой

Множество всех действительных чисел обозначается символом .

Целые числа

В некоторых случаях данные могут быть ограничены только целыми числами. Целые числа (... , -2, -1, 0, 1, 2, ...) являются подмножеством действительных чисел и обозначаются символом . Как и действительных чисел, целых чисел бесконечно много.

Натуральные числа

Иногда данные ограничиваются только положительными целыми числами (например, в случае с движением товаров в онлайн-магазине). Это подмножество положительных целых чисел(1, 2, 3 и т. д.) называется натуральными числами. Натуральные числа обозначаются символом , в англоязычных источниках встречается также обозначение ℤ⁺.

Другие подмножества действительных чисел

В особых случаях возникает необходимость обратиться к другим подмножествам действительных чисел. Вы можете, например, встретить такие обозначения:

  • – множество рациональных чисел.
  • ℤ₂ – двухэлементное множество {0, 1}.

Последнее обозначение встречается при моделировании бинарных дискретных целевых переменных или при работе с бинарными признаками.

Математика в Data Science — это не абстрактные формулы, а практический инструмент для понимания алгоритмов и решения бизнес-задач. Преподаватели ВМК МГУ вместе с Proglib Academy собрали программу, которая готовит к собеседованиям в топовые компании и поступлению в ШАД.

Комплексные числа

Если действительные числа «живут» на одномерной структуре, то есть на числовой прямой, возникает вопрос, можем ли мы использовать числа, «живущие» в двумерном пространстве. Да! Комплексные числа — это как раз такие числа. Множество комплексных чисел обозначается символом .

Комплексное число z имеет две составляющие: действительную часть x и мнимую часть y, где x и y – действительные числа. Действительная и мнимая части объединяются, и комплексное число z записывается в виде z = x + iy.

Символ i имеет особое значение. Это квадратный корень из -1, то есть i² = -1. Мы можем представить пару чисел (x, y) как точку на двумерной плоскости. Эта плоскость называется комплексной плоскостью или плоскостью Аргана:

Плоскость Аргана используется для графического представления комплексных чисел
Плоскость Аргана используется для графического представления комплексных чисел

Положение комплексного числа z вдоль оси x (Re z) определяется его действительной частью, а положение вдоль оси y (Im z) — мнимой частью. Число, у которого мнимая часть y равна нулю, располагается полностью на оси x и является чисто действительным числом. Аналогично, комплексное число, у которого действительная часть x равна нулю, располагается полностью на оси y и является чисто мнимым числом.

Комплексные числа в полярных координатах

Как и в случае с другими двумерными плоскостями, точку на комплексной плоскости можно представить не только декартовыми координатами (x, y), но и полярными координатами, как показано на приведенной выше иллюстрации. Используя школьную тригонометрию, получим z = |z| × (cos θ + i sin θ). Символ |z| обозначает модуль комплексного числа z и совпадает с расстоянием от точки z до начала координат. Используя эту же иллюстрацию и теорему Пифагора, мы можем вычислить |z| следующим образом:

|z|2=x2+y2=(Rez)2+(Imz)2

Угол θ обычно измеряется против часовой стрелки и в радианах, поэтому точка на положительной оси y будет иметь θ = π/2 (помните, что 2π радиан = 360°).

С учетом формулы Эйлера e = cos θ + i sin θ, которая связывает экспоненциальную и тригонометрическую формы комплексных чисел, мы также можем записать z в следующем виде:

z=|z|eiθ

Эта последняя форма записи комплексного числа пригодится нам при изучении преобразования Фурье, которые используются для представления функций в виде суммы синусоидальных и косинусоидальных волн. Фактически, это и есть главная причина для изучения комплексных чисел в рамках курса по Data Science.

Комплексно-сопряженные числа

Важной концепцией, связанной с комплексным числом z, является его комплексно-сопряженное число. Комплексно-сопряженное число z мы обозначим как . Иногда вместо этого используется символ z*. Комплексно-сопряженное число связано с z изменением знака мнимой части z: если z = x + iy, то z̅ = x – iy. На рисунке это показано простым отражением z относительно оси x. Полезное соотношение, которое из этого следует:

zz=x2+y2=|z|2
Комплексно-сопряженные числа получаются зеркальным отражением друг друга относительно действительной оси
Комплексно-сопряженные числа получаются зеркальным отражением друг друга относительно действительной оси

Переменные и определение их типов

Все рассмотренные выше числа имеют конкретное значение, однако при описании алгоритмов или кода мы будем использовать переменные, обозначаемые символами типа x, которые могут принимать различные значения в зависимости от контекста.

При документировании алгоритма можно указать, что переменная x, к примеру, всегда будет действительным числом. Это обозначается как x ∈ ℝ, что на математическом языке означает «x принадлежит множеству действительных чисел» или, кратко, «x – действительное число».

Аналогично, если нужно указать, что x всегда является положительным целым числом, мы напишем x ∈ . Или, если x является комплексным числом, напишем x ∈ ℂ.

Линейная алгебра

Векторы

Во многих ситуациях нужно представлять набор чисел. Например, числа 7,3 и 1,2 могут быть значениями двух признаков, соответствующих одной точке данных в обучающем наборе. Обычно такие значения объединяют в скобках и записывают их как (7.3, 1.2) или [7.3, 1.2]. Поскольку эти способы записи похожи на обозначение координат в пространстве, такую совокупность чисел называют вектором.

Символически векторы иногда записывают жирным шрифтом (например, v). Чаще вместо жирного шрифта используется черточка сверху:

v

Или снизу (в англоязычных источниках):

v

Вектор может быть двухмерным, как в приведенном примере, или d-мерным, если он содержит d компонентов. Строковый d-мерный вектор выглядит так:

v=(v1,v2,,vd)

А столбцовый вектор записывают так:

v=[v1v2vd]

Транспонирование вектора

Можно преобразовывать строковые векторы в столбцовые и наоборот с помощью операции транспонирования, которая обозначается верхним индексом 𝑇:

vT=[v1v2vd]

И наоборот:

(vT)T=v

Матрицы

Матрица — это двумерный массив чисел. Например, следующая таблица чисел является матрицей:

A=[123456789101112]

Матрица обозначается заглавной буквой, иногда с двойным нижним подчеркиванием (в англоязычных источниках):

A

Поскольку матрица – это двумерная структура, ее размерность определяется двумя числами – m (число строк) и n (число столбцов). Чтобы обратиться к конкретному элементу матрицы, указывают номер его строки и столбца – Aij, т.е элементом А23 в приведенной выше матрице является 7.

Типы матриц

Элементами матрицы могут быть любые числа. При этом:

  • Если все элементы – вещественные числа, то это вещественная матрица.
  • Если хотя бы один элемент комплексный, то это комплексная матрица.

Суммы и произведения

Суммирование

Когда нам нужно сложить несколько чисел, мы используем суммирование (или сигма-нотацию), обозначаемую символом (греческая буква сигма).

Например, если мы хотим записать сумму чисел x1 + x2 + x3 + x4 + x5, можно использовать сигма-нотацию:

i=15xi

Общее выражение суммы записывается так:

i=mnxi

где:

  • i – индексная переменная;
  • m – нижний предел суммирования;
  • n – верхний предел суммирования;
  • xi – слагаемые, зависящие от i.

Эта запись означает: «Возьми все числа xi, начиная с i = m и заканчивая i = n, и сложи их». Иногда в выражении опускают верхний и нижний пределы, если из контекста понятно, какие значения принимает индекс:

xi

Суммирование значений функций

Сигма-нотацию можно использовать не только для сложения самих элементов xi​, но и для сложения значений функции f(xi). В общем виде формула выглядит так:

i=mnf(xi)

Например, если у нас есть пять чисел x1, x2, x3, x4 и x5, и мы хотим сложить их синусы, то запишем:

i=15sin(xi)

Суммы с индексной переменной

Сигма-нотацию можно применять и к выражениям, зависящим от индекса i, а не только от заранее заданных чисел. Например, сумма первых 100 квадратов (12 + 22 + 32 + ⋯ + 1002) записывается так:

i=1100i2

Произведение

Для компактной записи произведения нескольких чисел используется символ (заглавная буква пи):

  • Произведение чисел x1, x2, ..., x5:
i=15xi=x1×x2×x3×x4×x5
  • Произведение чисел x1​, x2​, ..., xN​:
i=1Nxi=x1×x2×...×xN
  • Произведение значений функции f(xi):
i=1Nf(xi)=f(x1)×f(x2)×...×f(xN)

Логарифмы

Логарифмы помогают понять, как быстро растет величина или функция, поскольку показывают, в какую степень нужно возвести основание, чтобы получить заданное число. Математически это записывается как loga(ax) = x. Например, log2(8) = 3, так как 23 = 8.

Чаще всего используются логарифмы с тремя основаниями:

  • 10 (десятичный логарифм);
  • 2 (двоичный логарифм);
  • e (натуральный логарифм, где e ≈ 2,718.

Из них натуральный логарифм с основанием e встречается настолько часто, что для него введено специальное обозначение ln, то есть ln x равнозначно logex.

В математике и в большинстве языков программирования, если используется просто log x без указания основания, то обычно подразумевается натуральный логарифм ln x. К примеру, функция numpy.log(y) в NumPy возвращает натуральный логарифм y. Однако в некоторых областях, например в инженерии, log x может означать десятичный логарифм log10x, поэтому важно учитывать контекст.

Логарифмирование «уменьшает» число. Например, логарифм 1 000 000 по основанию 10 равен 6, потому что 106 = 1 000 000. Это позволяет работать с очень большими числами. Более того, это также означает, что функция логарифма является монотонной, так что log(x) увеличивается с увеличением x:

Чем больше число x, тем больше его логарифм
Чем больше число x, тем больше его логарифм

Важное следствие монотонного возрастания логарифмической функции заключается в том, что максимумы функции и ее логарифма достигаются в одной и той же точке. Математически этот факт можно записать так:

Если f(x)f(x) при xx, то logf(x)logf(x) при xx

Это свойство логарифма часто используется в математике и статистике для упрощения задач оптимизации — иногда проще найти максимум логарифма функции, чем максимум самой функции. Например, такой подход применяется в методе максимального правдоподобия для оценки параметров статистических моделей.

Основные действия с логарифмами

Эти правила справедливы для логарифмов с любым основанием:

  • Логарифм обратной величины равен отрицательному логарифму исходной величины:
loga(1y)=loga(y)
  • Логарифм произведения двух чисел равен сумме логарифмов этих чисел:
loga(xy)=loga(x)+loga(y)
  • Логарифм отношения двух чисел равен разности логарифмов этих чисел. Это правило выводится из предыдущих двух правил:
loga(xy)=loga(x)+loga(1y)=loga(x)loga(y)
  • Логарифм произведения N чисел равен сумме логарифмов этих чисел. Этот факт пригодится в дальнейшем, когда мы начнем использовать понятие максимального правдоподобия для построения вероятностных моделей:
loga(i=1Nxi)=loga(x1x2xN)=loga(x1)+loga(x2)++loga(xN)=i=1Nloga(xi)

Подведем итоги

В этой статье мы рассмотрели четыре ключевых раздела математической нотации: теорию чисел, линейную алгебру, обозначения для сумм, произведений и логарифмов. В следующей статье мы продолжим наше путешествие в мир математического языка и разберем обозначения из области дифференциального и интегрального исчисления, математического анализа и комбинаторики – разделов, критически важных для понимания многих алгоритмов машинного обучения.

🤖 Библиотека Дата Сайентиста
Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека Дата Сайентиста»

Комментарии

 
 

ВАКАНСИИ

Добавить вакансию
Backend developer (PHP / Go)
Москва, по итогам собеседования
Go-разработчик
по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ

LIVE >

Подпишись

на push-уведомления