yuliianikolaenko 26 апреля 2021

📊 Где изучать Data Science в 2024 году?

Занимаясь наукой о данных, приходится постоянно учиться. Предлагаем вашему вниманию актуальный обзор из 25 новых книг, курсов, видеолекций и блогов для оттачивания мастерства в Data Science.
📊 Где изучать Data Science в 2024 году?
Data Science – стремительно развивающаяся область, которая требует от специалистов постоянного следования за новыми трендами. В очередном обзоре мы предлагаем читателям подборку книг, курсов и блогов 2024 года, актуальных в 2024 году. Здесь вы найдете новости, а также информацию о последних разработках в сфере машинного обучения, больших данных и искусственного интеллекта.

Книги по Data Science

Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт

Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт, Алекс Дж. Гатман, Джордан Голдмейер
Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт, Алекс Дж. Гатман, Джордан Голдмейер

Авторы: Алекс Дж. Гатман, Джордан Голдмейер

Эта книга научит вас:

  • Мыслить как дата-сайентист и понимать роль статистики и аналитики в вашей деятельности.
  • Говорить на языке Data Science и задавать правильные вопросы, связанные с анализом данных.
  • Ориентироваться в таких областях, как машинное обучение, анализ текстов, глубокое обучение и искусственный интеллект.
  • Избегать типичных ошибок при работе с данными и их интерпретации.

Достоинства

  • Дает общее представление о Data Science и аналитике данных, хотя и содержит некоторые противоречия. Материал изложен увлекательно, хоть и может показаться сложным для чтения.
  • Отличное введение в Data Science. Книга увлекательна, а авторы смогли разъяснить суть Data Science без использования сложного математического аппарата. Особенно ценно наличие плана дальнейшего изучения методов машинного обучения.
  • Подробно разбираются важные тонкости и нюансы.
  • Изложение простое и доступное, кажется, что читаешь легкую беллетристику. Однако в сочетании с другой литературой по аналитике данных материал обретает новые грани и смыслы.

Недостатки

  • Присутствует излишнее многословие, много отвлеченных рассуждений авторов.

Вывод

Книга представляет собой удачное введение в Data Science и аналитику данных для начинающих. Простой и увлекательный стиль изложения в сочетании с разбором важных тонкостей и наличием плана дальнейшего обучения делают ее ценным ресурсом. Однако следует учитывать наличие некоторых противоречий и излишнего многословия в некоторых местах.

Глубокое обучение на Python. 2-е межд. издание

Глубокое обучение на Python. 2-е межд. издание, Шолле Франсуа
Глубокое обучение на Python. 2-е межд. издание, Шолле Франсуа

Автор: Шолле Франсуа

Вас ждет увлекательное погружение в мир глубокого обучения на языке Python под руководством ведущего эксперта в этой области.

В книге вы найдете:

  • Основы глубокого обучения, изложенные доступным и понятным языком.
  • Детальное рассмотрение задач классификации и сегментации изображений с применением современных методов.
  • Методы прогнозирования временных рядов с использованием глубоких нейронных сетей.
  • Передовые техники генерации текста, переноса стилей в изображениях и генерации изображений с помощью нейросетей.

Достоинства

  • Качественное издание с мягкой обложкой и отличной печатью.
  • Автор излагает материал ясно и доступно, не требуя от читателя глубоких предварительных знаний. Примеры кода не перегружены лишней информацией.
  • Отличная подача материала, широкий охват современных тем. Качество издания соответствует стоимости с учетом сложности материала и объема книги.
  • Увлекательная подача материала, удобные отступы. Книга написана создателем Keras, что делает ее уникальной.

Недостатки

  • Иллюстрации черно-белые, и не всегда понятно, что на них изображено. Однако наличие QR-кодов частично решает эту проблему.

Вывод

Книга охватывает широкий круг актуальных тем. Структурированная подача информации, увлекательный стиль автора и уникальность книги, написанной создателем Keras, делают ее ценным ресурсом. Единственным недостатком можно считать черно-белые иллюстрации, но наличие QR-кодов позволяет частично решить эту проблему.

🤖📖 Книги для дата сайентистов
Больше полезных книг вы найдете на нашем телеграм-канале «Книги для дата сайентистов»

Математика в машинном обучении

Математика в машинном обучении, Айзенрот Марк Питер, Фейзал А. Альдо, Он Чен Сунь
Математика в машинном обучении, Айзенрот Марк Питер, Фейзал А. Альдо, Он Чен Сунь

Авторы: Дайзенрот Марк Питер, Фейзал А. Альдо, Он Чен Сунь

Книга самодостаточна – читатель сначала знакомится с базовыми математическими концепциями, а затем переходит к четырем основным методам машинного обучения: линейной регрессии, методу главных компонент, гауссову моделированию и методу опорных векторов. Такой подход позволяет развить интуицию и получить практический опыт применения математики для новичков, а для читателей с базовым математическим образованием книга послужит отправной точкой для более глубокого изучения машинного обучения.

Достоинства

  • Великолепная книга для тех, кто хочет погрузиться в математические основы машинного обучения. Обязательный ресурс для изучения перед непосредственным освоением машинного обучения, особенно для читателей без глубокого высшего математического образования.
  • Отличное пособие для повторения и закрепления математического материала, необходимого для машинного обучения.
  • Подходит для освежения знаний, полученных в университете, и их адаптации к требованиям машинного обучения.

Недостатки

  • В книге присутствует значительное количество ошибок в формулах и опечаток, что требует сверки с оригинальным изданием. Иллюстрации переведены в черно-белый формат, из-за чего некоторые из них становятся менее понятными.
  • Незначительное просвечивание рисунков с оборотной стороны страницы, но это не является критичным недостатком.

Вывод

Книга подходит как для первоначального освоения материала, так и для повторения и закрепления знаний. Единственным существенным недостатком является наличие ошибок и низкое качество иллюстраций в данном издании.

Грокаем машинное обучение

Грокаем машинное обучение
Грокаем машинное обучение

Автор: Серрано Луис

Данная уникальная книга объясняет базовые концепции машинного обучения на доступных примерах, увлекательных упражнениях и наглядных иллюстрациях. Изложение ведется понятным языком без излишнего академического жаргона – для понимания достаточно знаний алгебры школьного уровня. В процессе чтения вы создадите модели для идентификации спама, распознавания изображений и других интересных проектов на Python.

Достоинства

  • Познавательная и практичная книга, материал которой можно использовать при курсовом и дипломном проектировании.
  • Материал изложен интересным и доступным образом, без использования сверхсложной терминологии и алгебры.
  • Превосходная обзорная книга по машинному обучению для начинающих или тех, кто хочет освежить знания. Сложные формулы объясняются пошагово на наглядных примерах, без углубления в сложные математические выкладки.

Недостатки

  • Не выявлены.

Вывод

Материал преподносится интересным образом, без чрезмерного усложнения терминологией и сложными математическими выкладками. Книга заслуживает самых высоких рекомендаций как для начинающих, так и для тех, кто хочет освежить свои знания в этой области.

Грокаем глубокое обучение

Грокаем глубокое обучение, Траск Эндрю
Грокаем глубокое обучение, Траск Эндрю

Автор: Траск Эндрю

Книга «Грокаем глубокое обучение» научит создавать нейронные сети с нуля! Эндрю Траск детально рассматривает все нюансы этой сложной задачи. С помощью Python и NumPy вы сможете обучить свои нейросети распознавать изображения, переводить тексты на любые языки и даже генерировать текст наравне с Шекспиром.

В книге вы найдете:

  1. Теоретические основы глубокого обучения
  2. Создание и обучение нейронных сетей
  3. Работу с естественным языком
  4. Федеративное обучение и конфиденциальные данные

Для освоения материала достаточно школьных знаний математики и базовых навыков программирования.

Достоинства

  • Максимально сведено к минимуму излишнее погружение в математические детали.
  • Книга неплохая, читается легко и является отличной отправной точкой для начинающих, желающих изучать искусственный интеллект и глубокое обучение.
  • Материал излагается доступным образом, объясняется методично и не требует глубоких предварительных знаний. Повторение основных идей, которое некоторые считают недостатком, на самом деле является плюсом, позволяющим лучше усвоить объем материала.
  • Подача материала превосходна, книгу интересно читать.

Недостатки

  • Излишне упрощенная подача материала, отсутствие математических разделов, присутствие которых ожидалось.

Вывод

Главными достоинствами книги являются доступность изложения, отсутствие необходимости глубоких предварительных знаний и увлекательная подача материала. Единственным существенным недостатком можно считать недостаток математических разделов для более глубокого погружения в тему.

🤖 Библиотека data scientist’а
Больше полезных материалов вы найдете на нашем телеграм-канале «Библиотека Data scientist’а»
🤖🎓 Библиотека Data Science для собеса
Подтянуть свои знания по DS вы можете на нашем телеграм-канале «Библиотека Data Science для собеса»
🤖🧩 Библиотека задач по Data Science
Интересные задачи по DS для практики можно найти на нашем телеграм-канале «Библиотека задач по Data Science»

Курсы

Confetti AI

Confetti AI предназначен для начинающих осваивать машинное обучение инженеров. Этот ресурс подготовит вас к тестовым вопросам по теории, включая математику, метрики и Deep Learning. Если вы ищете новую работу или просто хотите освежить знания, Confetti AI предлагает интересный и интерактивный способ это сделать.

Elements of AI

The Elements of AI серия бесплатных онлайн-курсов от Reaktor и Университета Хельсинки. Курс предназначен для широкой публики и людей, которые хотят узнать, что такое искусственный интеллект простыми словами. Программа сочетает теорию с практическими упражнениями и включает множество примеров с иллюстрациями.

Collaborative Working in a Remote Team

Двухнедельный курс, с помощью которого вы узнаете об использовании технологий и инструментов для эффективного общения с командой во время удаленной работы. Программа включает стратегии планирования проектов, а также способы, которые помогут вам успешно настроить удаленное рабочее пространство.

Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?

Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:

  • подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
  • углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
  • узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
  • освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.

Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.

Видеолекции

Learn Data Science Tutorial – Full Course for Beginners

Вас познакомят с принципами, практиками и инструментами, которые делают Data Science мощным средством для получения ценных знаний в бизнесе и исследованиях. Вы получите прочную основу для дальнейшего обучения и применения полученных знаний в своей работе.

Intro to Deep Learning (ML Tech Talks)

Структурированный обзор глубокого обучения от разработчика Google ML. Эксперт проводит разбор обучения признакам, рассказывает о семействе нейронных сетей и их приложениях, а также приводит множество примеров кода и концепций из TensorFlow.

Introduction | Deep Learning Tutorial

Этот плейлист представляет собой полный курс по глубокому обучению для начинающих. Все, что вам нужно знать – это Python, Pandas.

Data Professor

YouTube-канал Чанин Нантасенамата, профессора биоинформатики в Исследовательском университете, где он также возглавляет лабораторию, занимающаяся разработками в области больших данных в медицине. Чанин имеет многолетний опыт работы в области науки о данных. На своем канале с помощью видеолекций и практических тьюториалов он помогает студентам и энтузиастам Data Science освоить машинное обучение, построение нейронных сетей, веб-скрейпинг и многое другое.

Data Science vs Machine Learning vs Artificial Intelligence vs Big Data

Канал Александра Кондуфорова, руководителя направления Data Science Competence в компании AltexSoft. Здесь обсуждаются различия между Data science, машинным обучением, искусственным интеллектом и большими данными.

Deepfake Tutorial | How to Create Deepfake using AI

Из этого туториала для начинающих вы узнаете, как с помощью искусственного интеллекта создать Deepfake с нуля. В урок также включено демо с примером кода.

DeepMind x UCL | Deep Learning Lectures | 7/12 | Deep Learning for Natural Language Processing

В лекции ученого-исследователя DeepMind Феликса Хилла обсуждается мотивация моделирования языка с помощью нейронных сетей. Рассматриваются такие концепции, как Elman's Finding Structure во времени и в простых рекуррентных сетях, важность контекста и трансформаторов, а также неконтролируемое и репрезентативное обучение языку от Word2Vec до BERT.

Блоги

📊 Где изучать Data Science в 2024 году?

Inside Big Data

Блог посвящен аспектам машинного обучения в области науки о данных и больших данных в ИТ и бизнесе. Особо интересны в нем интервью с выдающимися специалистами, которые делятся опытом работы в индустрии. В этом блоге есть специальные разделы, охватывающие Hadoop, Spark, Developers, Data Science 101, а также публикуются вакансии.

Dataconomy

Блог с множеством ресурсов для начинающих специалистов по Data Science. Здесь можно найти подборки и руководства для новичков, а также бесплатные библиотеки ИТ-исследований.

Simply Statistics

Этот блог ведут три профессора биостатистики: здесь есть статьи по основам статистики для новичков, а также раздел интервью с опытными младшими специалистами по обработке данных и старшими преподавателями. Основатели блога также являются авторами курсов Data analysis for life sciences и Data Science Specialization on Coursera.

Datafloq

Научный блог, созданный Марком Ван Рейменамом – востребованным международным спикером и стратегом в области больших данных, блокчейна и искусственного интеллекта, а также автором трех книг по менеджменту.

Information is beautiful

Дэвид Маккэндлесс из Information is Beautiful использует свой блог, чтобы представить проекты в области анализа данных и показать варианты эффективной визуализации. Это отличный пример симбиотической связи между данными и дизайном: цвета, формы и размеры передают массу информации, не занимая много места и увлекая читателя.

Storytelling with data

Блог Коул Нуссбаумер Кнафлик автора одноименной книги, которая использует глубокий, основанный на сторителлинге подход к визуализации данных. Команда SWD привлекает пользователей регулярными статьями, популярным подкастом и развитым пользовательским сообществом.

Flowing Data

Основатель блога, статистик Натан Яу, помогает читателям превратить визуализацию данных в непрерывный диалог между читателем и создателем. Его проекты являются блестящими примерами визуализации даже случайной информации.

The Pudding

С помощью различных данных Pudding создает ориентированные на взаимодействие с читателем визуальные эссе. Сочетая журналистику данных, визуализацию и веб-инжиниринг, команда Pudding использует экспериментальный и очень индивидуальный подход к визуализации. На сайте вы сможете найти инструменты, примеры кода и туториалы.

Заключение

Даже опытные специалисты по Data Science не перестают учится, продолжая искать новые ресурсы и осваивать актуальные знания. Чтобы постоянно следить за обновлениями и новостями отрасли, нужно использовать всевозможные источники – от книг и блогов до подкастов и обзоров конференций.

Комментарии

ВАКАНСИИ

Добавить вакансию
ML- инженер
Москва, по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ