2016年5月7日土曜日

『人工知能は人間を超えるか』

  • AIの歴史・分類
  • 推論・探索
  • 知識
  • 機械学習
  • ディープラーニング
  • ディープラーニングの先にあるもの
AIの歴史・分類
AI効果
原理が分かってしまうと「これは知能ではない」と思うこと。
音声認識、文字認識、自然言語処理、ゲーム(将棋・囲碁)、検索エンジン、など。
AIの4段階レベル
レベル キーワード AIの種類 説明 例え
レベル1 制御 単純な制御プログラム ●マーケティング目的にAI搭載を名乗る家電製品。 縦横の長さに基づく厳格な仕分けルール(この長さなら大、中、小)を定めておき、それに則って作業する。
レベル2 探索・推論、
知識
古典的な人工知能 ●入力と出力を関連付ける方法が洗練されている。
●推論・探索を行なったり、知識ベースを取り入れたもの。
●古典的なパズルを解くプログラムや診断プログラム
荷物の種類に関する知識を与え、それを活用して作業する。「割れ物注意」なら丁寧に扱う、など。
レベル3 機械学習 機械学習を取り入れた人工知能 ●入力と出力を関連付ける方法がデータをもとに学習されている。
●機械学習…サンプルとなるデータをもとに、ルールや知識を自ら学習すること。
●古くからの技術がビッグデータで進化。
●最近の人工知能はレベル3を指す。
厳格なルールや知識は与えない。サンプルを与え、そこからルール(これは大、これは中、これは小)を学ばせる。
レベル4 特微表現学習 ディープラーニングを取り入れた人工知能 ●機械学習をする際のデータを表すために使われる変数自体(特微量)を学習するもの。 荷物の大中小だけでなく、「ゴルフバッグならこう運んだほうがよい」など自ら新しい視点でルールを学習する。
AIブーム
第1次AIブーム 推論・探索
第2次AIブーム 知識
第3次AIブーム 機械学習・特徴表現学習

推論・探索
探索の基本は探索木
探索木
深さ優先探索 1つの枝葉をとにかく掘り下げてダメなら次の枝葉へ 見つけた解が最短距離とは限らない。
幅優先探索 同じ階層をすべて調べてから次の階層へ ゴールまでの最短距離を見つけることができるが、すべての経路を記憶しないといけないので、たくさんのメモリが必要。
囲碁・将棋も探索の一種
オセロ 10の60乗
チェス 10の120乗
将棋 10の220乗
囲碁 10の360乗

将棋ソフトが強くなった理由
  1. コンピュータの処理速度が向上。
  2. よりよい特徴量(データのどこに注目するか)の発見。「2つの駒の関係」より「3つの駒の関係」がより重要であることがわかった。
  3. スコアの評価に「モンテカルロ法」を導入。盤面の評価方法を人間が決めるのではなく、ひたすらランダムに指し続けその勝率で盤面を評価する。力任せ(ブルートフォース)。
知識
エキスパートシステム
  • if-thenでルール(知識)を記述。
  • 専門家から知識をヒアリングして知識を取り出すのが大変。
  • ルールの数が増えると、矛盾がしたりして管理が大変。
  • 必要とする知識が限定されていればよいが、「常識レベルの知識」が必要となるとルールを記述しきれない。
知識を表現する「意味ネットワーク(Semantic Network)」
  • is-a関係(継承)、part-of関係(属性)
オントロジー(Ontology)〜概念化の明示的な仕様
ヘビーウェイト・
オントロジー
○「人間がきちんと考えて知識を記述していためにどうしたらよいか」を考える
ライトウェイト・
オントロジー
○コンピュータにデータを読み込ませて自動で概念間の関係性を見つけようとする。
○効率性を重視。完全な正しさを求めない。
○ウェブデータを解析するウェブマイニングやビッグデータを解析するデータマイニングと相性がよい。
IBMのワトソン
ワトソン自体は質問の意味を理解しているわけではなく、質問に含まれるキーワードと関連しそうな答えを高速で引っ張り出しているだけ。
機械翻訳の限界
  • 単純な文ですら一般常識がなければ訳せない。
  • He saw a woman in the garden with a telescope. 庭にいるのは彼or彼女? 望遠鏡を持っているのは彼or彼女?
  • 人間はそれまでの経験から「なんとなくそのほうがありそうだ」と判断している。
フレーム問題
  • あるタスクを実行するのに「関係ある知識だけを取り出してそれを使う」という、人間ならごく当たり前にやっている作業が難しい。
  • 洞窟の中から、時限爆弾の下にあるバッテリーを取ってくるロボット
改良点 結果
ロボット1号 爆弾もいっしょに取ってきた。
ロボット2号 「自分が何かをしたら、その行動に伴って副次的に起こること」も考慮する。 ありとあらゆる事象(壁の色が変わらないか;天井が崩れないか;…)が起こるかどうか考え始め、時間が切れ、時限爆弾が爆発した。
ロボット3号 目的を遂行するのに無関係な事項は考慮しない。 ありとあらゆる事象について、目的に関係あるか考え始め、時間が切れ、時限爆弾が爆発した。
シンボルグラウンディング問題
  • コンピュータは記号をそれが意味するものと結び付けられない。
機械学習

「学習する」ということは「分ける」こと。「判断」とはイエスとノーに「分ける」こと。 機械学習とは、大量のデータを処理しながら「分け方」を自動的の習得すること。

機械学習 教師あり学習
教師なし学習 入力データのみを与え、データの中にある一定のパターンやルールを抽出することが目的。
「分け方」
最近傍法
(Nearest Neighbor)
●一番近い隣を使う。
ナイーブベイズ法
(Maive Bayes)
●データの特徴ごとにどのカテゴリに当てはまるかを足し合わせていく。
決定木
(Decision Tree)
●ある属性がある値が入っているかどうかで線引する。
サポートベクタマシン
(Support Vector Machine)
●余白を最大にするように分ける。
ニューラルネットワーク
(Neural Network)
●人間の脳神経回路をまねすることによって分ける。
●人間のニューロンが学習によってシナプスの結合強度を変化させるように、学習する過程で重み付けを変化させ、最適な値を出力するように調整する。
●重み付けの調整=「誤差逆伝播(Back Propagation)」
●「学習」には時間がかかるが、「予測」は一瞬。
機械学習の弱点
  • フィーチャーエンジニアリング(Feature Engineering、特徴量設計)
  • 特徴量…機械学習の入力に使う変数。その値が特徴を定量的に表す。
  • 特徴量を何にするかが予測精度に決定的な意味を持つ。しかし特徴量を何にするかは人間が頭を使って考えるしかなかった。
人工知能の諸問題
  • 「知識」を書ききれない問題
  • フレーム問題
  • シンボルグラウンディング問題
  • 機械学習での特徴量問題
は結局、同じ1つのことを指している。
⇒「世界からどの特徴に注目して情報を取り出すべきか」に関して、人間の手を借りなければならなかった。 特微量の取得ができなかった。 概念を自ら獲得することができなかった。
ディープラーニング
  • ディープラーニングとは、データをもとに、コンピュータが自ら特微量をつくり出すこと。
  • 人工知能研究における50年来のブレークスルー。
  • 1956年から始まった人工知能研究、最初の10〜20年で主要な成果ができあがっていて、その後はマイナーチェンジの繰り返し。
  • ディープラーニングは、多階層のニューラルネットワーク。何層にも深く(ディープに)重なったニューラルネットワーク。
天気での例え
入力層:47都道府県の天気
       ↓圧縮
隠れ層:10ヵ所の天気
       ↓復元
出力層:47都道府県の天気
  • 復元エラーが最小になるように特徴表現(10ヵ所)を探す。
  • 特徴表現(10ヵ所)とは例えば、「東北」「関東」「日本海側」など。
  • 「主成分分析」と同じ。(たくさんの変数を、少数個の無相関な合成変数に集約する方法)
【ニューラルネットワーク】
入力層
 ↓
隠れ層
 ↓
出力層
【多階層ニューラルネットワーク】
(ディープな階層)
入力層
 ↓
隠れ層=入力層
     ↓
    隠れ層=入力層
         ↓
        隠れ層=入力層
             ↓
  • 「手書きの3」を入力すると「典型的な3」つまり「3の概念」が抽出される。
  • 相関のあるものをひとまとまりにすることで特徴量を取り出し、さらにそれを用いて高次の特徴量を取り出す。高次の特徴量を使って概念を取り出す。
得られる特徴量や概念の頑健性を高める
  • 入力にノイズを加える
  • ニューロンを一部停止させる
すごい計算機パワーが必要
  • グーグルのネコ認識・・・1,000台のサーバを3日間稼働、1億円。
  • のちにGPUを活用し16台のPCでも同様の学習が同程度の時間でできるようになった。
ディープラーニングの先にあるもの
ディープラーニングは特徴表現学習の一種であるが、この技術を使って、いままでの人工知能の研究がもう一度なぞられるような発展を遂げていくのでは。
技術 入力データ 入力データから得るもの 影響を受ける産業
①画像認識 画像データ 画像からの特徴表現と概念 ●広告
●画像診断
②マルチモーダルな
抽象化
観測データ(動画、音声、圧力、など) マルチモーダルな特徴表現と概念 ●ペッパー
●ビッグデータ
●防犯・監視
③行動と
プランニング
自分の行動データ+観測データ 「行動と結果」の特徴表現と概念 ●自動運転
●農業の自動化
●物流(ラストワンマイル)
●ロボット
④行動に基づく
抽象化
試行錯誤の連続的な行動データ 一連の行動を通じた現実世界からの特徴量 ●社会への進出
●家事・介護
●他者理解
●感情労働の代替
⑤言語との
紐づけ
言語データ 言語と概念のグランディング ●翻訳
●海外向けEC
⑥さらなる
知識獲得
人類が蓄積してきた大量の言語データ 言語を通じての知識 ●教育
●秘書
●ホワイトカラー支援
AIの衝撃 人工知能は人類の敵か (講談社現代新書)
小林 雅一
講談社
売り上げランキング: 1,462