深層学習システムの不確実性の定量化 - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

深層学習システムの不確実性の定量化

Josiah Davis、Jason Zhu、および Jeremy Oldfather、Amazon Web Services (AWS)

Samual MacDonald、Maciej Trzaskowski、Max Kelsen

2020 年 8 月 ( ドキュメント履歴 )

機械学習 (ML) ソリューションを本番環境に提供することは困難です。どこから始めればよいのか、どのツールやテクニックを使うべきか、そしてそれが正しく行われているかどうかを知るのは簡単ではありません。ML の専門家は、個々の経験に基づいて異なる手法を使用するか、社内で開発された所定のツールを使用します。いずれにしても、何をすべきかを決め、ソリューションを実装し、維持するには、時間とリソースに多額の投資が必要です。既存の ML 手法はプロセスの一部をスピードアップするのに役立ちますが、これらの手法を統合して堅牢なソリューションを実現するには、数か月の作業が必要です。このガイドは、機械学習に焦点を当てたコンテンツシリーズの第 1 部であり、すぐに使い始める方法の例を紹介しています。このシリーズの目標は、ML アプローチの標準化、設計上の意思決定、ML ソリューションの効率的な提供を支援することです。今後数か月以内に追加の ML ガイドを公開する予定ですので、最新情報については、「 AWS 規範的ガイダンス」のウェブサイトをご確認ください。

このガイドでは、ML ソリューションにおける予測モデリングを改善するために、深層学習システムの不確実性を定量化および管理するための現在の手法について説明します。このコンテンツは、高品質で本番環境に対応した ML ソリューションを効率的かつ大規模に提供したいと考えているデータサイエンティスト、データエンジニア、ソフトウェアエンジニア、データサイエンスのリーダーを対象としています。この情報は、クラウド環境や、使用している、または使用する予定の Amazon Web Services (AWS) サービスに関係なく、データサイエンティストにとって重要です。

このガイドは、確率と深層学習の入門概念に精通していることを前提としています。組織での機械学習コンピテンシーの構築に関する提案については、Coursera ウェブサイトの「深層学習スペシャライゼーション」を参照するか、「 AWS トレーニングと認定」ウェブサイトの「機械学習: データサイエンティスト」ページのリソースをご覧ください。

序章

データサイエンスの成功がモデルの予測性能によって決まるとすれば、深層学習は間違いなく強力なツールです。これは特に、非常に大規模なデータセットからの非線形の高次元パターンを使用するソリューションに当てはまります。ただし、不確実性を考慮して推論し、本番環境で障害を検出できることが成功の鍵となるのであれば、深層学習の有効性には疑問が生じます。不確実性を最もよく定量化するにはどうすればいいですか? こうした不確実性を利用してリスクを管理するにはどうすればいいですか? 製品の信頼性、ひいては安全性を脅かす不確実性の弊害は何ですか? そして、どうすればこのような課題を克服できるのでしょうか?

本ガイド:

  • 深層学習システムの不確実性を定量化する動機を紹介します。

  • 深層学習に関連する確率の重要な概念について説明します。

  • 深層学習システムの不確実性を定量化する現在の最先端の手法を示し、関連する利点と限界に焦点を当てています。

  • 自然言語処理 (NLP) の転移学習設定におけるこれらの手法について説明します。

  • 似たような設定で行われたプロジェクトから着想を得たケーススタディを掲載しています。

このガイドで説明したように、深層学習の不確実性を定量化する場合の経験則は、ディープアンサンブルで温度スケールを使用することです。

  • データを分布と見なすことができる場合、温度スケールは不確実性の推定値を解釈するのに理想的なツールです (Guo その他、2017 年 )。

  • ディープアンサンブルは、データが分布から外れる時期の不確実性を最新の推定値として提供します (Ovadia その他、 2019 年 )。

ホストモデルのメモリフットプリントが気になる場合は、ディープアンサンブルの代わりにモンテカルロ (MC) ドロップアウトを使用できます。転移学習の場合は、MC ドロップアウトを使用するか、MC ドロップアウト付きのディープアンサンブルを使用することを検討してください。