AutoML

847362_R

AutoML

AutoMLはAuto Machine Learningのことで、Googleが研究を進める新しい機械学習モデルの設計を自動化するアプローチです。AutoMLは、人工知能に機械学習のコードやアルゴリズムを生成させるもので、人間の専門家が設計したニューラルネットワークと同等の小さなニューラルネットワークを設計できるとのことです。 2017年5月にGoogle Brainの研究者らがAutoMLについて発表しましたが、その後、2017年10月に「Learning Transferable Architectures for Scalable Image Recognition」という論文が発表され、画像認識分野では、AutoMLを使用した設計が専門家に匹敵するレベルとなり、言語翻訳では専門家を完全に凌駕するパフォーマンスを見せているそうです。

NASNet

NASNetは、コンピューターによる視覚システムとしてAutoMLより生み出されたいわばAIが創り出した「チャイルドAI」 です。 NASNetをテストするために、GoogleはそれをImageNet(※1)画像分類とCOCO(※2)オブジェクト検出データセットに適用しました。 ImageNetでは、NASNetは予測精度をトップ1で82.7%、トップ5で96.2%を達成し、人間が発明した最高のアーキテクチャよりもトップ1(※3)の精度で1.2%優れていたとしています。さらに、従来の最先端モデルより計算量が28%削減され、90億個のFLOPS(※4)を削減したとあります。

automl_002_R(Learning Transferable Architectures for Scalable Image Recognition  https://arxiv.org/pdf/1707.07012.pdf より)

ImageNet分類から学んだ機能をFaster-RCNN(※5)フレームワークと組み合わせCOCOオブジェクト検出データセットでテストすると、NASNetは43.1%のmAP(Mean average precision)(※6)を達成し、これは、これまでに発表された最先端のオブジェクト検出タスクの予測パフォーマンスよりも4%優れているとしています。

automl_001_R(Learning Transferable Architectures for Scalable Image Recognition  https://arxiv.org/pdf/1707.07012.pdf より)

こうした研究結果については、シンギュラリティと結び付ける論調もありますし、特別な知識がなくともソフトウェアを簡単にオーダーメイドできるようになるかもしれないという期待する論調もあります。 (※1)ImageNetとはスタンフォード大学がインターネット上から画像を集め分類したデータセットです。ImageNetを利用した「The ImageNet Large Scale Visual Recognition Challenge(ILSVRC)」という画像認識のコンテストが知られています。 (※2)COCOは、大規模なオブジェクト検出、セグメンテーション、およびキャプションのデータセットです。 (※3)Top1は一番スコアが高かった答えが正解であるパーセンテージ、Top5はスコアが上位5位までの中に正解が含まれているパーセンテージです。 (※4)FLOPSとは、コンピュータの処理速度をあらわす単位の一つで、1秒間に実行できる浮動小数点数演算の回数です。 (※5)Faster R-CNNは、R-CNNとFast R-CNNの各オブジェクト検出手法を拡張したもので、ディープラーニングを用いた複数物体検出の技術です。いずれも畳み込みニューラルネットワーク (CNN) が使用されます。R-CNNとFast R-CNNは「物体候補領域の検出」という処理において膨大な演算量が処理のボトルネックとなり、その解決する手法としてFaster R-CNNがあります。 (※6)mAP(mean average precision)は情報検索(IR)や機械学習の分野で使われる評価尺度で、平均適合率の平均です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です