Microsoft открыла код среды для машинного обучения
16.11.2015, ПН, 11:40, Мск,
Текст: Сергей Попсулин
Microsoft открыла исходный код платформы для машинного обучения. Ранее в ноябре 2015 г. то же самое со своей платформой сделала Google.
Открытие кода DMLT
Microsoft открыла код платформы Microsoft Distributed Machine Learning Toolkit, разместив его на сайте GitHub. Со временем Microsoft планирует добавлять в DMLT новые возможности, которые тоже будут открытыми.
Назначение DMLT
Платформа Microsoft Distributed Machine Learning Toolkit (DMLT) предназначена для децентрализованного машинного обучения — одновременного использования множества компьютеров с целью решения ресурсоемких вычислительных задач.
Состав платформы
DMLT включает три элемента: программный каркас DMTK, алгоритм LightLDA для обучения моделей и алгоритмы для обработки естественных языковых запросов (определения взаимосвязей между словами) Distributed Word Embedding и Distributed Multisense Word Embedding.
Базовым элементом DMLT является C++ SDK для клиент-серверной архитектуры. «Несколько виртуальных серверов могут быть запущены на нескольких машин для обслуживания параметров глобальной модели», — говорится в документации к DMLT.
Преимущества
Благодаря широкому разнообразию интерфейсов программирования (API) платформа позволяет исследователям и разработчикам сфокусироваться на ключевых элементах машинного обучения, таких как данные, модели и обучение. С платформой DMLT разработчики получают возможность быстрее решать задачи по обработки больших объемов информации, чем прежде, уверяют в Microsoft.
Microsoft открыла код платформы для машинного обучения
В корпорации рассчитывают, что DMLT позволит исследователям сократить время обучения моделей на различных вычислительных узлах без необходимости беспокоиться за управление и распределение потоками и нагрузкой. Кроме того, платформа упрощает внутренний обмен данными, так как включает две различные библиотеки для этой цели (MPI и ZMQ).
Пример реализации
На днях Microsoft представила технологию распознавания эмоционального состояния человека по анализу его лица на фотографии. Это один из примеров реализации машинного обучения. Помимо этого, исследователи Microsoft занимаются разработкой алгоритмов интерпретации слов, звуков и изображений.
Аналогичная платформа Google
Ранее в ноябре собственную платформу машинного обучения, под названием TensorFlow, открыла корпорация Google. «Мы надеемся, что открытие этого движка позволит участникам сообщества машинного обучения — от университетских исследователей, до инженеров и любителей — намного быстрее обмениваться идеями, так как они смогут делать это прямо в коде, а не в докладах. В свою очередь, это приведет к ускоренным темпам развития машинного обучения и поможет сделать эту технологию полезнее для каждого», — пояснили в Google.