MXNet Python Data Loading API

Introduction

MXNet use iterator to provide data to the neural network. Iterators do some preprocessing and generate batch for the neural network.

现在已经提供了针对MNIST图像和RecordIO图像的基础迭代器。

数据迭代器 参数

创建一个迭代器,5类参数是必不可少的:

数据集参数:比如文件路径、input shape.

batch参数:比如batch size.

Augmentation参数:指明需要对输入图像做哪些augmentation操作(crop、mirror).

backend参数:controls the behavior of the backend threads to hide data loading cost.

辅助参数:provides options to help checking and debugging.

其中,数据集参数和batch参数是必须提供的,其他参数根据具体问题另议。详情见example.

创建一个迭代器

使用IO API可以轻松创建一个迭代器。