微软放大招-MMdnn开源了

admin6个月前笔记58

image.pngMMdnn 是一个用于转换、可视化和诊断深度神经网络模型的综合性、跨框架的解决方案。MMdnn 中的「MM」代表模型管理,「dnn」是「deep neural network」(深度神经网络)的缩写。

MMdnn 可将一个框架训练的 DNN 模型转换到其他框架可用。其主要特征包括:
模型文件转换器,转换 DNN 模型使之适合不同框架;
模型代码块生成器,生成适合不同框架的训练或推断代码块;
模型可视化,针对不同框架可视化 DNN 网络架构和参数;
模型兼容性测试(正在进行)。

安装

通过以下命令行获取稳定版的 MMdnn:

pip install https://github.com/Microsoft/MMdnn/releases/download/0.1.3/mmdnn-0.1.3-py2.py3-none-any.whl

或者通过以下命令尝试最新版本:

pip install -U git+https://github.com/Microsoft/MMdnn.git@master
模型转换

业界和学界存在大量现有框架,适合开发者和研究者来设计模型,每个框架具备自己的网络结构定义和模型保存格式。框架之间的差距阻碍了模型的交互操作。

image.png

我们提供一个模型转换器,帮助开发者通过中间表征格式转换模型,以适合不同框架。

支持框架

每个支持的框架都有详细的 README 文档,它们可以在以下conversion件夹找到。

地址:https://github.com/Microsoft/MMdnn/tree/master/mmdnn/conversion
Caffe
Keras
MXNet
TensorFlow(实验阶段,强烈建议先阅读 README)
Microsoft Cognitive Toolkit (CNTK)
PyTorch
CoreML(实验阶段)

测试模型

我们在部分 ImageNet 模型上对当前支持的框架间模型转换功能进行了测试。

image.png

正在测试的框架:
PyTorch
CNTK
Caffe2
ONNX
正在测试的模型:
RNN
图像风格迁移
目标检测

模型可视化

你可以使用 MMdnn 模型可视化工具(http://vis.mmdnn.com/),提交自己的 IR json 文件进行模型可视化。为了运行下面的命令行,你需要使用喜欢的包管理器安装 requests、Keras、TensorFlow。

使用 Keras inception_v3 模型作为示例。

1. 下载预训练模型:

python -m mmdnn.conversion.examples.keras.extract_model -n inception_v3

2. 将预训练模型文件转换成中间表征格式:

python3 -m mmdnn.conversion._.convertToIR -f keras -d keras_inception_v3 -n imagenet_inception_v3.json

3. 打开 MMdnn 模型可视化工具地址(http://mmdnn.eastasia.cloudapp.azure.com:8080/),选择文件 keras_inception_v3.json。

image.png

社区支持

本项目仍在继续开发与探索,它需要各位读者完善中间表征与支持的框架。因此,该项目的作者表示他非常希望有开发者能提供新的运算或扩展。

中间表征:中间表征在 protobuf 二进制文件中储存网络架构,在 NumPynative 格式中储存预训练权重。此外,目前 IR 权重数据使用的是 NHWC 格式。中间表征的细节请查看 ops.txt 和 graph.proto 文件。
框架:我们正在扩展到其它框架版本和可视化工具,例如 Caffe2、PyTorch 和 CoreML 等。此外,本项目也在积极开发 RNN 相关的操作方法。

使用案例

以下是该项目实现框架转换的基本案例,其中包括官方的教程和用户提供的各种案例,机器之心简要介绍了官方 Keras 到 CNTK 的转换教程。
官方教程:

Keras "inception_v3" to CNTK
用户案例:

MXNet "resnet 152 11k" to PyTorch
MXNet "resnext" to Keras
Tensorflow "resnet 101" to PyTorch
Tensorflow "mnist mlp model" to CNTK
Tensorflow "Inception_v3" to MXNet
Caffe "AlexNet" to Tensorflow
Caffe "inception_v4" to Tensorflow
Caffe "VGG16_SOD" to Tensorflow
Caffe "Squeezenet v1.1" to CNTK

Keras「inception_v3」模型到 CNTK 的转换
1. 安装 Keras 和 CNTK


pip install keras
pip install https://cntk.ai/PythonWheel/CPU-Only/cntk-2.3-cp27-cp27mu-linux_x86_64.whl

or

pip install
https://cntk.ai/PythonWheel/CPU-Only/cntk-2.3-cp35-cp35m-linux_x86_64.whl


2. 准备 Keras 模型

以下示例将首先下载预训练模型,然后使用简单的模型抽取器从 Keras 应用中获取模型,抽取器将抽取 Keras 模型架构和权重。

$ python -m mmdnn.conversion.examples.keras.extract_model -n inception_v3

Using TensorFlow backend.

Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels.h5

96075776/96112376 [============================>.] - ETA: 0s

.

.

.

Network structure is saved as [imagenet_inception_v3.json].

Network weights are saved as [imagenet_inception_v3.h5].

架构文件 imagenet_inception_v3.json 和权重文件 imagenet_inception_v3.h5 会下载至当前工作目录。

3. 将预训练模型文件转换为中间表征


$ python -m mmdnn.conversion._.convertToIR -f keras -d converted -n imagenet_inception_v3.json -w imagenet_inception_v3.h5

Using TensorFlow backend.

.

.

.

Network file [imagenet_inception_v3.json] is loaded successfully.

IR network structure is saved as [converted.json].

IR network structure is saved as [converted.pb].

IR weights are saved as [converted.npy].

以上的命令会将 imagenet_inception_v3.json 作为神经网络架构的描述文件,imagenet_inception_v3.h5 作为预训练权重。然后计算出中间表征文件 converted.json 用于可视化,计算出 converted.proto 和 converted.npy 以进一步转换为其它框架。

4. 转换 IR 文件为 CNTK 模型


$ python -m mmdnn.conversion._.IRToCode -f cntk -d converted_cntk.py -n converted.pb -w converted.npy

Parse file [converted.pb] with binary format successfully.

Target network code snippet is saved as [converted_cntk.py].

你将得到文件 converted_cntk.py,包括构建 Inception V3 网络的原始 CNTK 代码。

经过这三步,你已经将预训练 Keras Inception_v3 模型转换成 CNTK 网络文件 converted_cntk.py 和权重文件 converted.npy。你可以用这两个文件调整训练或推断。

5. 转存原始 CNTK 模型


$ python -m mmdnn.conversion.examples.cntk.imagenet_test -n converted_cntk -w converted.npy --dump cntk_inception_v3.dnn

.

.

.

CNTK model file is saved as [cntk_inception_v3.dnn], generated by [converted_cntk.py] and [converted.npy].


相关文章

触发式文件同步在Sersync+Rsync中实现

背景通常我们在服务器上使用rsync加上crontab来定时地完成一些同步、备份文件的任务。随着业务和应用需求的不断扩大、实时性要求越来越高。一般rsync是通过校验所有文件后,进行差量同步,如果文件...

如何在服务器上添加虚拟IP

如何在服务器上添加虚拟IP

最近,有位小伙伴为了实现Nginx的高可用,在自己的服务器上搭建了一套Nginx集群,Nginx节点的服务器总共有3台。那么问题来了:如何对外只使用一个IP地址,通过某种策略来访问三个服务器节点上的N...

grep 命令的 12 个实例

grep 命令的 12 个实例

你是否遇到过需要在文件中查找一个特定的字符串或者样式,但是不知道从哪儿开始?那么,就请grep来帮你吧。grep是每个Linux发行版都预装的一个强有力的文件模式搜索工具。无论何种原因,如果你的系统没...

ThreadLocal 父子线程之间如何传递数据

ThreadLocal 父子线程之间如何传递数据

ThreadLocal 的具体原理这篇文章就不解释了,能干啥大伙儿都倒背如流,其实就两点:链路透传(通俗来说就是方便做参数传递,不用在调用方法时携带一堆请求参数)线程隔离每个线程都有自己的一个 Thr...

怎样在 Linux 命令行中切换用户

怎样在 Linux 命令行中切换用户

Linux 系统有不同类型的用户,用户有不同类型的权限。并非所有用户都可以执行所有命令,也不是所有用户都可以切换到其他用户。我们今天要介绍的内容就是如何在命令行中切换到其他用户。要切换用户,...

将Web应用性能提高十倍的10条建议

将Web应用性能提高十倍的10条建议

举一个例子,一份亚马逊十年前做过的研究可以证明,甚至在那个时候,网页加载时间每减少100毫秒,收入就会增加1%。另一个最近的研究特别强调一个事实,即超过一半的网站拥有者在调查中承认它们会因为应用程序性...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。