Исследователи Microsoft выложили на GitHub исходники инструментария CNTK (Computational Network Toolkit) с реализацией алгоритмов глубокого машинного обучения, который предназначен для ускорения работ в сфере искусственного интеллекта, сообщает официальный блог компании.
На практике инструментарий используется в сервисах, обеспечивающих распознавание произвольной речи, таких как Windows Cortana, Skype Translator и Project Oxford Speech API. CNTK также может использоваться для решения задач автоматизированного перевода, распознавания изображений и разбора вопросов на естественном языке. Код написан на языке С++ и распространяется https://github.com/Microsoft/CNTK под лицензией MIT, пишет OpenNet.
CNTK позволяет создавать распределённые нейронные сети, оформленные в виде ориентированного графа, вершины в котором представляют входные значения или параметры нейронной сети, а промежуточные узлы отождествлены с матричными операциями с этими параметрами. CNTK поддерживает различные модели нейронных сетей, включая DNN c прямой связью (feed-forward), свёрточные (CNN) и рекуррентные нейронные сети (RNN/LSTM), а также их комбинации. CNTK ориентирован на использование GPU для вычислений и обеспечивает близкую к линейной масштабируемость при увеличении числа GPU. Поддерживается автоматическое разделение и распараллеливание вычислений с привлечением кластерных конфигураций, включающих большое число GPU.
По заявлению Microsoft, CNTK заметно опережает другие аналогичныеинструменты по производительности обработки данных. Например, при развёртывании четырёхуровневой тестовой нейронной сети на Linux-сервере с 4 GPU NVIDIA K40 CNTK быстрее Google TensorFlow в 4 раза, а Torch и Caffe — почти в два раза. При задействовании двух аналогичных узлов в Azure GPU Lab (в сумме 8 GPU) производительность CNTK увеличилась на 75%. На системах с одним GPU CNTK немного отстаёт от Torch и Caffe.
Крупнейшие ИT-компании мира и исследовательские лаборатории ведут активные разработки в области искусственного интеллекта и машинного обучения. Неделей ранее Yahoo открыла для всех желающих крупнейший массив данных в области машинного обучения. В 2015-м Google сделала свою систему машинного обучения TensorFlow открытой для всех желающих. Microsoft также открыла код среды для машинного обучения.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.