人工知能(AI:エーアイ)のしくみ

AIと機械学習・深層学習の関係

「人工知能(AI:Artificial Intelligence:アーティフィシャル・インテリジェンス)」という言葉は、1956年に米国の計算機科学研究者ジョン・マッカーシーが初めて使った言葉です。最近AIは目覚ましい研究結果を出すようになってきていて、ブームとなっています。
AI」とは、人間の思考プロセスと同じような形で動作するプログラム、あるいは人間が知的と感じる情報(じょうほう)処理(しょり)・技術(ぎじゅつ)とされています。「AI」という言葉だけではなく、最近では「機械学習」、「深層(しんそう)学習(ディープラーニング)」といった言葉もよく使われていますが、この3つの言葉は下の図のような関係になっています。

機械学習・深層学習の関係
図1:機械学習・深層学習の関係

機械学習の手法の一つに、「深層学習」があります。深層学習とは、多数の層からなるニューラルネットワーク(人間の脳(のう)の仕組みをコンピューター上でまねた仕組み)を使って行う機械学習のことです。深層学習により、何に着目するかをあらかじめ人が設定していない場合でも識別(しきべつ)などができるようになりました。
たとえば、前述(ぜんじゅつ)の機械学習の例では、あらかじめ人間がコンピューターに「色に着目する」という指示(しじ)をあたえることで、よりスムーズにニンジンとジャガイモが区別できるようになります。深層学習では、この「色に着目する」とうまくいくということ自体もコンピューターが自動で学びます。深層学習は、機械学習の手法の一つですが、このように人間が指示することなく対象にどのような特ちょうがあるのかを自ら発見できる点が大きな進歩となっています。
ただ、深層学習では、AIがどのような理由でそのような判断を行ったかを人間が理解(りかい)することが難(むずか)しくなっているという問題があります。

機械学習ではどのようにデータを活用するのか

機械学習では、データが重要であるといわれます。それでは、データは具体的にどのような手順(プロセス)で、どのように活用されるのでしょうか。この点を理解する上では、次のことが重要となります。
まず、機械学習には大きく分けて「学習」と「推論(すいろん)」の2つのプロセスがあり、基本的(きほんてき)にそれぞれのプロセスで別々のデータを使います。
学習とは、入力されたデータを分せきしてコンピューターが区別などを行うためのパターンを確立(かくりつ)するプロセスです。この確立されたパターンを、「学習済(がくしゅうず)みモデル」といいます。
推論とは、学習のプロセスを経(へ)てできあがった学習済みモデルにデータを入力し、確立されたパターンに従(したが)い、実際(じっさい)にそのデータの区別などを行うプロセスです。

このように、機械学習で活用するデータには、学習のプロセスで使うものと、推論のプロセスで使うものの2種類があります。ここでは前者を「学習用データ」、後者を「推論用データ」と呼(よ)びます。
学習用データと推論用データは、学習・推論に合った形とする必要があります。たとえば、ニンジンの画像(がぞう)を学習させようとしているときに、画像にミカンも写りこんでいると、望むような学習や推論ができない可能性(かのうせい)があります。このため、ミカンを画像から除(のぞ)く必要があります。
これらを学習用・推論用データの加工あるいは前処理(まえしょり)といいますが、この部分が機械学習にデータを活用する際のハードルとなることがあります。なぜなら機械学習に使用するためには、単にデータを収集すれば良いのではなく、「使えるデータ」を用意することが必要だからです。

機械学習におけるデータ活用のプロセス
図1:機械学習におけるデータ活用のプロセス

機械学習の3つの学習法-「教師あり学習」「教師なし学習」「強化学習」

たとえば、学習用データとして使ったネコの画像に、「これはネコである」という情報をあたえなくても、ネコとそれ以外を区別することができたとします。このような学習法を、「教師(きょうし)なし学習」といいます。
機械学習の学習法には、大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3つがあります。

「教師あり学習」では、正解(せいかい)のラベルを付けた学習用データが使われます。つまり、ネコの画像に「これはネコである」というラベルを付けた上でデータを入力し、学習させるのです。これにより、学習済みモデルは、推論用データとして動物の画像を入力されたとき、それがネコであるかどうかを判別できます。
「教師なし学習」では、正解のラベルを付けない学習用データが使われます。つまり、それがネコであるという情報はあたえずネコの画像のデータを入力して学習させるのです。学習済みモデルは、推論用データとして動物の画像を入力されたとき、それがネコかどうかは判(はん)別できないものの、ネコと他の生き物とを区別できます。
「強化学習」では、コンピューターが一定の環きょうの中で試行さくごを行うことが学習用データとなり、望ましい行動をよいと評価する(行動に報しゅうをあたえる)プロセスをくり返すことで、何が長期的に良い行動なのかを学習させます。たとえば、二足歩行ロボットが歩く速度や足の曲げ方について試行さくごを行い、長い距りを歩いた場合に報しゅうをあたえることをくり返すことで最も良い歩き方を学習し、最終的にはたおれずにスムーズに歩行できるようになります。