macroscope

( はてなダイアリーから移動しました)

経験式、統計的モデル、機械学習 / (勧めたくない用語) 人工知能、AI

【まだ書きかえます。どこをいつ書きかえたかを必ずしも明示しません。】

- まえおき -
この記事は、わたし個人がここでしめす用語をどのように理解しているかについての おぼえがきです。専門家として用語のただしい意味を解説するものではありません。この用語はみなさんこうつかうべきだと主張するものでもありません (こうつかうのがよいと自分は思うという意見はいくらかふくみますが)。

- 1 -
このごろ、「人工知能」あるいはその英語 artificial intelligence の略である「AI」ということばがはやっている。誇張していうと、どの分野でも研究費をとるためには AI をからめないといけないような気分がある。

しかし、「人工知能」ということばの意味が、それをつかう人びとのあいだでも共有されているかどうかは疑問だ。2010年代には、多くのばあい、「人工知能」は「機械学習」とだいたい同じ意味につかわれているようだ。しかし、わたしは1980年代にも「人工知能」ということばをたびたびきいた おぼえがあるけれども、そのときの意味はそうではなかった。わたし個人としては、このように意味の変遷のある「人工知能」ということばは、なるべくつかいたくないし、もし助言をもとめられれば、つかわないことをおすすめしたい。

ここでは、これに関係しそうないくつかの用語について、それぞれ思いあたることを書いておきたい。ひとつのすじのとおった論考にはならない。

- 2 -
1960年代の子どもとして、わたしは、「人工頭脳」ということばをきいたおぼえがある。「人工知能」はきかなかったと思う。「人工頭脳」は「電子計算機」と関連していた。関連のしかたは、このことばをつかう人のあいだでも、まちまちだったと思う。子どものときは分類できなかったのだけれど、いま考えて、分類してみる。

  • 当時の計算機ではとてもできなかったのだが、将来できるだろうという空想として、人の脳によるいろいろな判断と同様なことをする装置。
  • 当時の電子計算機そのものをさす。当時の多くの計算機は、数値計算 (整数の四則演算や、実数の近似としての浮動小数点数の四則演算) だけができた。それでも、会計や国勢調査の集計、物理現象のシミュレーションなどを、手計算よりもずっとはやくできるようになっていた。(ただし、データをパンチカードのかたちで用意する時間をふくめると、はやいとはかぎらなかった。)
  • 当時はまだ「ロボット」といわれていなかったと思うが、自分で動いたり、物を動かしたりすることができる装置がつくられていた。月・惑星探査につかわれたものなどはあきらかに、こまかく人からの指令をうけずに自動制御されていた。目や耳にあたるセンサーと、自分が移動したり物体を操作したりする手足にあたる部分のあいだに、なんらかの演算装置があった。その演算装置は、人の頭脳とちがった理屈で動作するとしても、頭脳にあたるといえる。

- 3 -
「人工知能」ということばが いつからつかわれているか、わたしはよく知らない。ともかく、 1980年代にはつかわれていた。

1980年代の「人工知能」は、計算機がたくさんの論理演算をすることによってなりたつと考えられていた。

1960年代ごろ以後に生きのこったほとんどのディジタル計算機は、2進法にもとづいている。0と1との2進法演算は、偽と真との論理演算と、基本的に同じである。だから計算機は、数値計算でなく論理演算をする装置とみることもできる。

実用につかう論理演算としては、計算機の基本演算よりももうすこし論理学(記号論理学)にちかづけたものをつかったほうがよさそうだ。記号論理学でいう「述語論理」の演算をすることを基本機能とした Prolog というプログラム言語がつくられ、それが「人工知能」にやくだつと考えられた。

当時つくられようとしていた人工知能的ソフトウェアの類として、 expert system というものがあった。これは、専門家の判断を代行するシステムだ。ここでいう判断の例としては、医者による病気の診断や治療方法の選択があげられる。専門家の判断を、論理式で書けるようなルールのあつまりによっていると近似し、そのルールを計算機上で再現する。そのシステムが用意されて、データを与えられれば、専門家がいなくても、専門家と同様な判断ができるだろう。たとえば医者のいない過疎地域などの医療に役だつと期待された。

そこから分岐したひとつの方向は、「ファジー(fuzzy)論理」だった。実際の専門家が使うルールは「白か黒か」でなく、グレーの段階がある。expert systemのようなものも、それを素過程とするべきかもしれない。

どんな expert system が実用になるところまでいったか、わたしはよく知らないのだが、標準的な述語論理にもとづくものも、ファジー論理にもとづくものも、期待されたほどの成果はあがらなかったのだろうと思う 。

- 4 -
「機械学習」について知ろうとして、ネット上の情報のキーワード検索をすると、ここで考えようとする「機械学習」とは別の、つぎのようなものも検索にかかって、わけるのがむずかしい。

  • 人間が学習する過程を機械にまねさせること
  • 人間が学習する過程を機械によってたすけること
  • 人間が機械について学習すること

「機械学習」では、機械(実際にはソフトウェア)が、「学習」し、「学習」の成果を適用してなんらかの有用なしごとをする。「学習」するにしたがって、しごとの性能があがっていく。この「学習」は、人間による学習とおなじしくみによっている必要はない。ただ、経験をふまえて行動を変えうるところが学習とにているのだ。

- 5 -
わたしはこれまで「機械学習」になじみがない。「機械学習」とおなじではないが、いくらかにたところがあって、わたしがなじみがある概念は、「経験式」(empirical formula) 、あるいは「統計的モデル」だ。

経験式は、過去の入力変数と出力変数との組のデータにもとづいてくみたてられ、あらたな入力変数のデータをあたえられて出力変数の値を推定するしくみだ。経験式の形は、多くの場合は、数式だ。たとえば、多項式とか指数関数とか対数関数からなる。式の形は、専門家が対象の性質を見てきめる (その判断は、客観的というよりは主観的で、試行錯誤によることが多い)。式にはいくつかの係数(パラメタ)がふくまれている。パラメタの値は、過去の経験のデータを材料として、(典型的には、統計学的手法によって) きめる。

わたしからみると「経験式のパラメタを決める」と「統計的モデルのパラメタを決める」は区別がつかない。では、「経験式」と「統計的モデル」はおなじものか、となると、自信をもっていえない。ここではひとまず両者を同一視しておく。

経験式や統計的モデルの典型的なつかいかたでは、パラメタをきめる過程 (calibration = 較正)と、経験式やモデルの適用とを、きちんと区別する。モデルの検証(verification)として、較正用と独立とみなせるデータにモデルを適用する。

- 6 -
「機械学習」を、わたしは、経験式や統計的モデルを、適用しながらパラメタを修正していく態度でつかうことをさす、と理解している。わたしの理解では、機械学習は、広い意味で、経験式や統計的モデルの利用なのだが、狭い意味の経験式や統計的モデルの利用では悪い方法とされることをやっている。

機械学習では、パラメタの修正だけでなく、モデルを変更しているといわれるかもしれない。しかし、学習しながらモデルの構造を根本的に変化させることはできないだろう。たとえとして、モデルが多項式である場合についていえば、あらかじめ考えるモデルは、たくさんの項がある多項式だが、そのうち多くの項の係数がゼロであるようなものとし、学習によって、係数がゼロである項とゼロでない項とが入れかわっていくようにすることができると思う。上で「パラメタを修正する」と言ったのは、このような状況もふくめたつもりだ。

- 7 -
気候の分野でも機械学習が有効な局面はあるだろうとは思うが、わたしがすぐに思いあたるものはない。

気候のモデルは、物理法則によっている部分と経験式によっている部分がある。機械学習は物理法則によっている部分のかわりにはならない。経験式によっている部分については、較正と適用とを区別して使うのにじゅうぶんデータがあれば、機械学習にきりかえる必要は感じないだろう。データがじゅうぶんでないがなんとかしたいとき、機械学習にたよりたくなるだろうが、その状況では、(機械学習にせよ従来の経験式のつかいかたにせよ)精度検証はむずかしいだろう。

- 8 -
話はとぶが、「AIが社会のなかの差別を固定・助長する」ことが指摘されている。これは機械学習にかぎらず、経験式や統計的モデルの利用でも同様だと考えられる。機械学習の学習でとりこまれるデータ、経験式や統計的モデルの較正データにふくまれるこれまでの相関が今後もつづくという想定で、判断がおこなわれてしまう。たとえば、これまでの医者の大部分が男だったとすると、医者は男だろうという推測がはいった計算がされてしまい、医者であり女性である人にとって不当な結論がえられることがありうる。対策は単純ではないが、一般論としていえば、モデル構築や学習データの項目の設定をする際に、倫理的・法的・社会的な課題(「ELSI」)を考慮する必要がある、ということなのだと思う。