人工知能学習者向けに無料で配布されている、機械学習に特化したデータセット。 60,000枚の訓練用画像と10,000枚の評価用画像が含まれる。
http://yann.lecun.com/exdb/mnist/
公式サイトは上記であるが、上記サイトからはダウンロード不可となっている。 (一時期認証画面が表示されていたが、現在は、ファイルが削除されている模様。)
以下に、ファイルを置いておく。
python で利用する場合は、下記の Numpy の ndarray バイナリファイルをダウンロードするのが良いかと思います。
ロード方法は以下。
import numpy as np
npz = np.load("mnist.npz")
print(f"学習用 画像データ: {npz['x_train'].shape}")
print(f"学習用 正解の数値: {npz['y_train'].shape}")
print(f"テスト用 画像データ: {npz['x_test'].shape}")
print(f"テスト用 正解の数値: {npz['y_test'].shape}")