ディープラーニングとは何か?

 ディープラーニングといえば、コンピューターが人間のように多角的に判断をするシステムのことを言う。人間の脳をモデルにしたニューラルネットワークと呼ばれる技術を基にしており、ニューラルネットワーク技術を何層にも重ねた構造を持つことによって、これまで実現できなかった抽象的なデータを認識できる点が、大きな特徴である。

 例えば、コンピューターがネコの画像をネコであると認識する場合、画像からなんらかの特徴を抽出し、あらかじめ記憶させたネコの基準となる特徴と照らし合わせる必要がある。ディープラーニングの登場以前には、研究者や技術者がネコの基準となる特徴をあらかじめ数量化した特徴量を設定したが、ディープラーニングにおいては、ネコの属性をもつさまざまなものを大量に機械学習させることで、人が直接関与することなく、ネコの特徴をコンピューターが自動的に学んでいく。

 近年のインターネットの高速化や、画像データの高精度化によって、コンピューターは、より人間に近い考え方ができるようになった。人間が他人や動物を識別する場合、視覚や聴覚などを駆使して、対象物の体格などの全体を見た後に、目、耳、口などの顔のパーツなどを認識したり、あるいはその逆で、パーツから全体を認識したりするような階層的な過程を経る。

 従来コンピューターにはこのような過程を経た認識をさせることは困難とされ、対象物の特徴を計算するプログラムによって識別を行っていた。しかしディープラーニングでは、人間の認識過程と同じ過程を踏み、写真に写っている人の顔や動物等をコンピューターに認識させることが可能になった。

 2016年3月、ディープラーニングを用いた「アルファ碁」と呼ばれるコンピュータープログラムが、囲碁の対戦で、世界最強の1人といわれるプロの棋士に勝利した。囲碁は、終局までの手順が10の360乗通りにも及ぶと言われていることから、チェスや将棋よりも次の手を読む作業が複雑であり、コンピューターが人間に勝てない唯一のゲームと言われていた。

 「アルファ碁」は、人工知能の研究を続けるグーグルの系列会社「グーグル・ディープマインド」社が開発したもので、ディープラーニングによって、過去のプロ棋士の対局の記録を基に「アルファ碁」自身を相手にした対局を何千万回も繰り返したことで知識を深め、人間の直観に相当する力を磨き、勝利を得た。

ディープラーニングの先駆的研究と実用化に貢献したヒントン博士

 本田財団(石田寛人理事長)は18日、人工知能(AI)の機械学習手法の一つであるディープラーニング(深層学習)の先駆的研究と実用化に貢献したトロント大学名誉教授・ベクター研究所主任科学顧問のジェフリー・ヒントン博士に2019年の本田賞を授与した。

 本田賞は、次世代のけん引役を果たす新たな知見をもたらした優れた科学者をたたえるために1980年に創設された。ことしの授与式は18日午後、東京都千代田区の帝国ホテルで開かれ、ヒントン博士にメダル、賞状と副賞1000万円が贈られた。

 授与式に続き、同博士は「ディープラーニング革命」と題して記念講演した。本田財団や本田賞選考委員会の関係者らに受賞の謝辞を述べた後、ディープラーニングが生まれるまでの研究内容などを詳しく紹介した。

 ヒントン博士は47年にわたり「人工ニューラルネットワーク」の研究を続けている。人工ニューラルネットワークは、人間の脳の仕組みをモデル化し、膨大なニューロンの活動パターンを用いて学習するという独創的な発想に基づいて提唱されたが、コンピューターの処理能力不足などから実用化が進まず、1990年代はAI研究の「冬の時代」と言われた。

 そうした中でもヒントン博士は研究を進め、2002年に新たな高速学習アルゴリズムを発表するなど、AIが膨大なデータを効率的に処理することを可能にし、ディープラーニングの飛躍的な進化を実現した。さらに2009年には「多層ニューラルネットワーク」によって音声認識技術の劇的な性能向上を、2012年には「深層畳み込みニューラルネットワーク」によって従来の画像認識技術を超える精度をそれぞれ実現するなど、ディープラーニングを使ったAI技術に革命をもたらした。

 同財団は、現在世界中に広がるAIを活用したサービスのほとんどはヒントン博士の研究成果がなければ実現しなかったとしている。

 ヒントン博士は1947年12月英国生まれ。1970年にケンブリッジ大学で実験心理学学士号、1978年にエジンバラ大学で人工知能博士号をそれぞれ取得。1987年にトロント大学のコンピューターサイエンス学部教授に就任した。

 記念講演するヒントン博士

 「ディープラーニング(深層学習)とは、人間が自然に行うタスクをコンピュータに学習させる機械学習の手法のひとつです。人工知能(AI)の急速な発展を支える技術であり、その進歩により様々な分野への実用化が進んでいます。」

 「近年開発の進んでいる自動運転車においてもカギとなっているのは、ディープラーニングです。停止標識を認識したり、電柱と人間を区別したりするのも、ディープラーニングが可能にしている技術と言えます。また、電話、タブレット、テレビ、ハンズフリースピーカーなどの音声認識にも重要な役割を果たしています。」

 「近年ディープラーニングが注目を集めているのには理由があります。それはディープラーニングが、従来の技術では不可能だったレベルのパフォーマンスを達成できるようになってきているからです。」

 「ディープラーニングの技術は、人間の神経細胞(ニューロン)の仕組みを模したシステムであるニューラルネットワークがベースになっています。ニューラルネットワークを多層にして用いることで、データに含まれる特徴を段階的により深く学習することが可能になります。」

 「多層構造のニューラルネットワークに大量の画像、テキスト、音声データなどを入力することで、コンピュータのモデルはデータに含まれる特徴を各層で自動的に学習していきます。この構造と学習の手法がディープラーニング特有であり、これによりディープラーニングのモデルは極めて高い精度を誇り、時には人間の認識精度を超えることもあります。」

 ディープラーニングの歴史

 人間の脳の構造を模した機械学習における最初の手法であるパーセプトロンが考案されたのは1957年であるが、マシンスペックの大幅な不足や、排他的論理和の認識ができないなどの欠点が露呈したため、研究が大きく続けられることはなかった。

 その後、1980年代より、排他的論理和の問題を解決したバックプロパゲーションが開発されたが、非効率的なメカニズムや、動詞の過去形など複雑な認識ができない(そもそも3層ニューラルネットで任意関数は全て近似可能であり、大脳新皮質がなぜ3層以上存在するのかが不明であった)などの要因により、1990年代後半には沈静化した。

 長らく冬の時代が続いていたニューラルネットワークであるが、2006年にジェフリー・ヒントンによってスタックドオートエンコーダなど多層にネットワークを積み重ねる手法が提唱され、さらに2012年には物体の認識率を競うILSVRCにおいてジェフリー・ヒントン率いるトロント大学のチームがディープラーニングによって従来の手法(エラー率26%)に比べてエラー率17%と実に10%もの劇的な進歩を遂げたことが機械学習の研究者らに衝撃を与えた。その後もILSVRCでは毎年上位はディープラーニングを使ったチームが占めるようになり、エラー率はすでに5%程度にまで改善している。

 今日のディープラーニングにつながる世界的に最も先駆的研究として、日本の福島邦彦(NHK放送技術研究所、その後大阪大学基礎工学部生物工学科)によって1979年に発表されたネオコグニトロンが挙げられる。

 ネオコグニトロンには自己組織化機能があり、自ら学習することによってパターン認識能力を獲得(概念の形成)していく。応用例として、福島らは手書き文字データベース(ビッグデータ)から自己学習によって手書き文字認識能力(各文字の概念)が獲得されることを実証した。しかし、当時は「手書き文字認識方式の一つ」と誤解され、その重要性についての認識が世間に広がらなかった。

 ディープラーニングは物体認識を中心にさまざまな分野で活用されている。また、Googleをはじめとした多くのIT企業が研究開発に力を入れている。また、自動運転車の障害物センサーにも使われている。

  GoogleのAndroid 4.3は、音声認識にディープラーニング技術を活用することで、精度を25から50パーセント向上させた。2012年、スタンフォード大学との共同研究であるグーグル・ブレイン(英語版)(Google brain)は、1,000のサーバーの16,000のコアを使い、3日間で猫の画像に反応するニューラルネットワークを構築したと発表して話題となった。

 この研究では、200ドット四方の1,000万枚の画像を解析させている。ただし、人間の脳には遠く及ばないと指摘されている。GoogleLeNetと呼ばれるチームによるトロント大学との共同研究では、画像の説明文を自動で生成できる「Image to Text」と呼ばれるシステムを開発した。

 これは、コンピュータビジョンと自然言語処理を組み合わせ、ユーザーがアップロードした画像を認識し、説明文を表示するものである。2015年3月、Schroffらは800万人の2億枚の画像を99.6%の精度で判定した(22層)。

 2016年1月、AlphaGoと呼ばれるシステムが中国系フランス人のヨーロッパ囲碁王者である樊麾(英語版)と2015年10月に対局し、5戦全勝の成績を収めていたことが発表された。

 主に開発に携わったのは2013年にGoogleが買収したDeepMind。囲碁はチェスよりも盤面が広いために打てる手数の多さは比較にならないほどで人間のプロと互角に打てるようになるまでさらに10年はかかるという予測を覆した点と、囲碁に特化したエキスパートマシンではなく汎用的にも用いることができるシステムを使っている点に注目が集まった。

 2016年から2017年にかけては、いずれも世界トップクラスの棋士である韓国の李世乭と中国の柯潔と対戦し、2016年の李世ドルとの5番勝負では4勝1敗、2017年の柯潔との3番勝負では3連勝を収めた。

 中国では天網に代表されるようにディープラーニングが国民に対する当局の監視強化を目的に急速に普及しており、世界のディープラーニング用サーバーの4分の3を占めているとされる。

 米国政府によれば2013年からディープラーニングに関する論文数では中国が米国を超えて世界一となっている。ヒントンらと並んで「ディープラーニングの父」と呼ばれているヨシュア・ベンジオ(英語版)は中国が市民の監視や独裁政治の強化に人工知能を利用していることに警鐘を鳴らした。

参考 サイエンスポータル: https://scienceportal.jst.go.jp/news/newsflash_review/newsflash/2019/11/20191120_01.html

  

ブログランキング・にほんブログ村へ 人気ブログランキングへ   ←One Click please