DataScience Digest — 31.08.21

Приветствую всех!

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning подготовленный командой Data Phoenix и не забывайте подписываться на наш Telegram-канал.

Также хочу пригласить всех на сентябрьские вебинары, которые мы проводим в рамках серии «The A-Z of Data» :

Буду рад видеть всех на наших трансляциях, присоединяйтесь!

Статьи

Containerizing Apache Hadoop Infrastructure at Uber — контайнеризация инфраструктуры Apache Hadoop в Uber.

Learning from Evolution: Using AI Language Models to Design Functional Artificial Proteins — использование ИИ для разработки искусственных белков.

Geometric Foundations of Deep Learning — основы геометрии для глубокого обучения.

GitHub Copilot Open Source Alternatives — обзор 4 альтернатив GitHub Copilot.

All Probability Distributions Explained in Six Minutesо распределении вероятностей за 6 минут.

Make Money Using NFT + AI | GAN Image Generation — как заработать на NFT и AI.

Using Sentiment Score to Assess Customer Service Quality — вычисление NPS в Airbnb с помощью машинного обучения.

Feature Store: Data Platform for Machine Learning — основы Feature Store для машинного обучения.

GPU-Powered Data Science (NOT Deep Learning) with RAPIDS — варианты использования GPU не для глубого обучения.

MLOps Best Practices for Data Scientists — лучшие практики и методы MLOps для Data Science.

Create Amazon SageMaker Projects Using Third-Party Source Control and Jenkins — про интеграцию SageMaker и Jenkins для построения CI/CD пайплайна.

6 Trends in Data and Artificial Intelligence for 2021 and Beyond — шесть трендов в данных и ИИ на 2021 год.

Optimize Personalized Recommendations for a Business Metric of Your Choice with Amazon Personalize — оптимизация персонализированных рекомендаций в Amazon Personalize.

Научные статьи

Internal Video Inpainting by Implicit Long-range Propagation — новый метод ретуширования дефектов в видео.

SDEdit: Image Synthesis and Editing with Stochastic Differential Equationsновый фреймворк для редактирования и синтеза изображений.

Semi-Supervising Learning, Transfer Learning, and Knowledge Distillation with SimCLR — различные виды обучения с помощью SimCLR.

How to Avoid Machine Learning Pitfalls: A Guide for Academic Researchers — сборник советов для студенотов о том, как избежать типичных ошибок в МЛ.

Program Synthesis with Large Language Models — в статье исследуются ограничения текущего поколения больших языковых моделей для синтеза программ на языках программирования общего назначения.

Image2Lego: Customized LEGO Set Generation from Images — обзор Image2Lego, который позволяет создать индивидуальный набор LEGO из изображения.

ARCH++: Animation-Ready Clothed Human Reconstruction Revisited — работа про ARCH++, основанный на изображениях метод восстановления трехмерных аватаров с произвольным стилем одежды.

Курсы

AutoML — Automated Machine Learning — курс по AutoML от AI Campus.

Machine Learning Zoomcamp — основы машинного обучения от Data.Talks Club.

The A-Z of Data — серия вебинаров от команды Data Phoenix Events, в рамках которых вы сможете систематизировать и расширить свои знания работы с данными.

Видео

Tesla AI Day — основная часть Tesla AI Day.

Introduction to MLOps — видеозапись вебинара про то, что такое MLOps, основные принципы и практики, лучшие инструменты и возможные архитектуры.

Monitoring ML Models in Production — видеозапись вебинара про мониторинг ML моделей в продакшене.

Running from Complexity [DataTalks.Club] — обсуждение основных сложностей в разработке AI-систем.


Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя что-то полезное. Буду благодарен за любые предложения для следующего дайджеста.

Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: Twitter, Facebook, а также подписывайтесь на нашу еженедельную рассылку.

Предыдущий выпуск



Источник 📢