翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
トレーニング
混合精度トレーニングでは、メモリの量が同じでより大規模なネットワークをデプロイしたり、単精度または倍精度ネットワークと比較してメモリの使用量を減らしたりすることができます。これにより、コンピューティングパフォーマンスが向上します。また、複数ノードに分散したトレーニングでは重要な要素である、少量かつ高速なデータ転送というメリットも得られます。混合精度トレーニングを利用するには、データキャスティングと損失スケーリングを調整する必要があります。混合精度をサポートするフレームワークでこれを行う方法について説明しているガイドを以下に示します。
-
NVIDIA Deep Learning SDK
- MXNet、PyTorch、および TensorFlow の混合精度実装について説明している NVIDIA ウェブサイト上のドキュメント。
ヒント
必ず、ウェブサイトで選択したフレームワークを確認し、「混合精度」または「fp16」を検索して最新の最適化手法を参照してください。以下の混合精度ガイドが役に立つ可能性があります。
-
Mixed-precision training with TensorFlow (ビデオ)
- NVIDIA ブログサイト上。 -
Mixed-precision training using float16 with MXNet
- MXNet ウェブサイト上のよくある質問記事。 -
NVIDIA Apex: a tool for easy mixed-precision training with PyTorch
- NVIDIA ウェブサイトのブログ記事。
必要に応じて、GPU モニタリングおよび最適化に関する他のトピックも参照できます。