私の仕事がなくなるとき|仕事の価値、本質、業界の未来像を浮き彫りにするメディア

仕事の価値、本質、業界の未来像を浮き彫りにするメディア

仕事の価値、本質、業界の未来像を浮き彫りにするメディア

ディープラーニングが解決した「特徴量抽出の壁」

ディープラーニングが解決した「特徴量抽出の壁」

人工知能は、いかにして世界をコンピュータに認識させるかという問題に関連しています。
それは、とりもなおさず、人間自身が世界をどのようにして認識しているかという問題にかかわっています。
人工知能には「弱いAI」「強いAI」という分類があり、「弱いAI」とは、ある枠の範囲でのみ考えることができる人工知能(あらかじめプログラムされたこと以外はできない)、「強いAI」とは、人間のようにものを考え、理解し、推論・価値判断のもとに実行をすることができます(意思決定できる)。
強いAIが実現するためには何が必要になるのでしょうか。今回は、そこでのキーワードである「特徴量」というものについてご紹介します。

人工知能にはレベルがある

まず、最も単純な働きをする人工知能は、単なる制御プログラムであると言えます。たとえば、温度の変化に応じて機能するエアコンや冷蔵庫に組み込まれているプロセッサがそうです(これらの製品にはよく「人工知能搭載」といったコピーが謳われていますよね)。

次に、対応パターンがより多くなった人工知能があります。単純な作業だけでなく、様々な局面に対して対応できます。将棋のプログラムやお掃除ロボットなどがこれに該当します。より多くの知識をインプットしてあるので、領域が広くなっているわけです。ここではまだ新しい知識を学習するようなことはできません。

そして、対応パターンを自動的に学習する人工知能があります。ある程度のサンプルデータからルールを設定・学習して、より精度の高い判断を下すことができます。Googleの検索エンジンなどがこれに当たります。検索キーワードと似たワードを自動表示したり、誤字があると自動的に修正したキーワードに置き換えてくれたりしますよね。あれは「AはBである」という構造をすべて理解しているわけではないものの、ある程度のパターンから推察して、最も近いと思われる選択肢を抽出しているのです。

こうして、さらに発展した人工知能として、対応パターンの学習に使う「特徴量」を自力で獲得する人工知能というものが登場することになります。パターンとルールさえも、人工知能が自ら学んで知識データとして積み重ねていくのです。
2045年より前に始まると言われるシンギュラリティの世界とはという記事で紹介しているような人工知能はこうしたものになります。人工知能が人間の手を離れたところで学習能力を身につけ、勝手に発展していくわけです。

急に知らない言葉が出てきたので戸惑われたかもしれません。
「特徴量」とは何でしょうか。

壁になるのは「特徴量」の抽出

上で述べたように、自動的に対応パターンを学習する人工知能は、ある程度のサンプルさえあれば、ルールを自ら発見・習得できます。それにより、未知のものに対して判断したり、識別したり、あるいは予測をすることができるようになるわけです。
しかし、そのパターンをどのように発見するかということは、いちいち人間が決めなければなりません。
「特徴量」とは、いわば、人間が世界を認識するための要素であると言えます。
私たちは、無意識のうちに、コップとはどんなものなのかということを認識しています。形や色、材質が様々に異なっていても、そのひとつひとつがコップであるかどうかということは、瞬時に判断できます。これは、コップの「特徴量」というものを認識しているからです。
特徴量は、難しくいうと、対象とする事物の特徴を定量的に表した変数です。人間はもっとアナログに処理していますが、人工知能にとっては、対象となるデータを端的に表現できるような特徴を見つけ出すための変数なのです。
特徴量という物差しを与えることで、人工知能がパターンを学習することができるようになります。何を特徴量として選ぶかということによって、結果の精度は大きく変化します。
この特徴量を抽出するのはデータ分析の技術者の仕事ですが、きわめて専門的な仕事であり、一種の職人芸ともいえるものです。これが人工知能の実用化がなかなか進まない理由のひとつになっていました。

たとえば、これをお読みの皆さんも体感しているように、気温が高くなるとビールがおいしくなり、ビールの売上が伸びます。そこで、お店やビールメーカーでは、売上予測を行うために気温を判断材料しているわけです。
これは、気温を特徴量として抽出していることになります。しかし、「ビールの売上には気温が影響している」というのは、あくまでも経験則であり、仮説に過ぎません。それを特徴量として抽出するためには、データ分析技術者が売上と気温データからそのような関係性を発見しなければならないのです。

例えば、人の幸せの度合いを数値化する人工知能があったとします。
この場合、特徴量としては、年収・家族構成・職業・年齢・住居などが考えられます。どの特徴量を選ぶかを決めなければなりません。候補の中から、「年収」と「職業」を特徴量とすることもできますし、「家族構成」「年齢」「奥さんの年齢」などを特徴量にすることもできます。どの特徴量が「人の幸せ」に結びついているかということがわからないので、精度としては低いものになってしまいます。

さらに、人工知能が「人の顔」を認識するために、顔の各パーツの相対位置・大きさ・形…といったものを特徴量とする場合、それらすべてを計測し、そのデータを分類器に入力するといった手間がかかります。「人の顔」ではなく「自動車」なら同じような手間をかけなければなりませんし、「人の声」であれば、また異なる特徴量が必要になるのです。

特徴量の抽出が不要になる

こうした特徴量設計の困難を解決するとされているのが、ディープラーニングです。
ディープラーニングでは、ニューラルネットワークを多階層化してデータを処理することによって、コンピュータが自動的に特徴量を抽出できるようになります。データそのものを教師として学習し、データに内在する特徴量を抽出するのです。
膨大なデータを繰り返し学習することで、そのデータの中にあるパターンや経験則を特徴量として認識し、新たな未知のデータに対して、自律的に認識したパターンや経験則を当てはめて答えを導き出すわけです。
ディープラーニングによって人工知能が特徴を自動的に抽出することを表現学習と呼びます。ニュースなどでディープラーニングが画期的だと言われるのは、それにより、従来の手法とは一線を画すような高い精度の結果を導き出せるようになったからなのです。
「機械学習」で一気に実用化に向かう人工知能の最前線」という記事もぜひお読みください。

特徴量の自動抽出によって何が起こるか

ディープラーニングによる特徴量の自動抽出によって、人工知能はまた一歩、シンギュラリティの世界に近づいたと言えます。
株価や天気、さらには病気まで、人間の未来を予測すること。設備の不良からスパムメールまで、あらゆる異常を検知し、お知らせしてくれること。召使いに命じるように人の声で様々な機器を操作できるようになること。ネットショッピングなどで最適な商品をお勧めしてくれること。
現在わたしたちが享受している人工知能の世界が、さらにもう一歩前進したら、どのようなことが起こり、わたしたちの仕事や生活は、どのように変わっていくことになるのでしょうか。