総務省トップ > 政策 > 白書 > 令和元年版 > 進む「AIの民主化」
第1部 特集 進化するデジタル経済とその先にあるSociety 5.0
第3節 ICTの新たな潮流

(2)進む「AIの民主化」

「AIの民主化」とは何か

AIが注目され、様々な分野での活用が進んでいく中で、「AIの民主化」という概念が広まっている。これは、2017年3月に、米国スタンフォード大学教授からGoogleに転じていたAI研究者のフェイ・フェイ・リー35が初めて示した概念とされる。具体的には、AIを誰もが使えるようにするというものである。その後、Googleのみならず、様々なICT企業がこの概念を掲げるようになっている。

この「AIの民主化」とは、より具体的にはどのようなことを指すのだろうか。この点を理解するためには、機械学習を巡る構造を把握しておく必要がある。

機械学習におけるレイヤー構造

通常、機械学習を利用する場合、画像認識、音声認識、機械翻訳、チャットボットといった具体的なアプリケーションを利用することとなる。このようなアプリケーションは、どのようにして開発されているのだろうか。アプリケーションの開発の基盤をレイヤーとして捉えると、プロセッサー、フレームワーク、プラットフォームという要素に大別される(図表1-3-2-6)。

図表1-3-2-6 機械学習におけるレイヤー構造
(出典)総務省「AIネットワーク社会推進会議AI経済検討会」資料を基に作成

まず、プロセッサーとは、プログラムに従った計算等の処理を行うためのハードウェアである。元々は3Dのコンピューターゲーム用を中心に発展してきたGPU(Graphics Processing Unit)が、現在機械学習におけるプロセッサーとして広く使われている36。他方、もともとGPUは機械学習のために設計されているものではないため、機械学習における様々な処理に当たっての電力消費が大きいとされており、特定の用途に特化したASIC(Application Specific Integrated Circuit)として、機械学習に特化したプロセッサーも使われるようになっている。機械学習用のASICの代表的なものとしては、Googleが開発したTPU(Tensor Processing Unit)がある。また、製造後に回路の書換えが可能なFPGA(field-programmable gate array)が使われるケースも出てきている。

次に、フレームワーク37とは、機械学習のための機能やアルゴリズム38を提供するものであり、その中から必要なものを組み合わせてプログラムを作成する39ことで、アプリケーションを開発することができる。フレームワークは様々なICT企業等からオープンソースで提供されており、無料で利用することが可能である。代表的なものとして、TensorFlow、Caffe、Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet、Pytorch等があり、それぞれ特徴や得意分野がある。

そして、プロセッサーによる計算能力とフレームワーク等をセットにしてアプリケーションを開発する環境を提供するものが、プラットフォームである。プラットフォームは、通常クラウドサービスの形で提供されている。単にフレームワークを使ってアプリケーションを開発する場合と比べ、クラウドの利用料が必要となるものの、クラウド経由で提供事業者の計算能力が活用できる点でメリットがある。また、計算能力やフレームワークのみならず、学習済みモデルについてもAPI経由で提供しているものがある40。この場合、そのままアプリケーションとして利用できるほか、自らがアプリケーションを開発する際に利用することも可能である。更に、自ら用意した学習用データを使って学習させることができるものも出てきている41

このように、フレームワークやプラットフォームを利用することにより、アプリケーションの開発が可能となる。現在、スタートアップ企業を含め、様々な事業者がAIのアプリケーションを提供している前提となっているのは、各種のフレームワークやプラットフォームがオープンになっていることによるところが大きいといえよう。

AIを利用することのハードルは下がり、様々なリソースが広く使えるようになっている

以上から、機械学習を利用する方法については、①アプリケーションを利用する、②プラットフォームを利用した上で、アプリケーションを開発して利用する、③フレームワークを利用した上で、アプリケーションを開発して利用する、の3つがある。

①から③に行くに従って、独自の開発の余地が大きくなる反面、より高度な知識が必要となるが、③であっても、オープンソースのフレームワークを利用することで、開発のハードルは下がっている。②の場合は、①に加えて大手クラウド事業者の計算能力を利用することができる。これらにより、他者に提供するための様々なアプリケーションを開発することができるほか、自らが利用するために開発することも可能である。また、①のアプリケーションの利用においても、単に既存の学習済みモデルを利用するだけではなく、自ら用意した学習用データを使って学習させることにより、従来であれば②や③が必要であったような方法での機械学習の利用が可能となっている。

更に、機械学習に関する様々なプログラムのソースコードはGitHub42上で日々公開・共有され続けており、最新の研究結果は迅速にarXiv43上で公開・共有されるようになっている。

このように、様々なリソースが広く使えるようになってきていることにより、AIを利用することのハードルが下がって来ていることが、「AIの民主化」であるといえよう。「AIの民主化」の中で、例えば自社の競争力の源泉となるものについては、自ら開発する、あるいは自らデータを用意して学習させる形でAIを利用し、そうでないものについては、既存の学習済みモデルを利用するといった使い分けの判断が必要となってくるだろう。他方、この「AIの民主化」を支える基盤の多くは、大手デジタル・プラットフォーマーが提供しており、AIを巡るエコシステムがこのようなデジタル・プラットフォーマーに大きく依存する姿が、どのような影響を及ぼしていくのかは、注視が必要といえよう。



35 リーは、サバティカルとよばれる長期休暇を利用してGoogleで働いており、休暇が終了した2018年秋にスタンフォード大学教授に復帰している。

36 GPUは、CPUと比べた場合、行列演算に特化しているため、機械学習の処理を高速で行うことが可能となっている。

37 厳密には「フレームワーク」と意味が異なる概念であるが、「ライブラリ」と呼ばれる場合もある。

38 計算方法や学習方法を数学的に表現した手順であり、サポート・ベクタ・マシーン、決定木等の様々なアルゴリズムがある。

39 機械学習のプログラムの作成に当たっては、PythonやC++等のプログラミング言語が用いられることが多い。

40 例として、Googleが画像認識用に提供しているCloud Vision APIやCloud AutoML Visionがある。

41 例えば、Cloud Vision APIは既存の学習済みモデルを利用するのみであるが、Cloud AutoML Visionにおいては、学習させることも可能となっている。

42 GitHub(ギットハブ)は、ソフトウェア開発者のためのプラットフォームであり、オープンソースのソースコードが多数掲載されている。GitHub運営会社は、2018年にマイクロソフトが買収している。

43 arXiv(アーカイブ)は、数学、コンピューターサイエンス、統計学等の様々な論文を収録して公表しているウェブサイトであり、米国コーネル大学の図書館が運営している。論文原稿が完成した後、査読プロセスを経る前に論文を掲載することが通例となっており、長期間を要する査読プロセスによるタイムラグなく迅速な成果発表・共有が可能となっている。AIに関する研究成果が多数掲載されており、AIの発展を支えるインフラとなっているともいわれる。

テキスト形式のファイルはこちら

ページトップへ戻る