気象に関する情報処理の専門家のブログ記事の表題に、「流量調査」ということばが、「気象」「防災」といっしょに示されていた。
てっきり、この「流量」は川の水の流量(その慣用表現については[2012-04-27の記事]参照)のことだと思った。気象災害のうちでも大雨による洪水が重要なもののひとつだ。河川流量の観測は気象庁でなく国土交通省水管理・国土保全局(もとの河川局から改組された)の業務だけれど、流量の予測には気象庁の気象予測も関係しているはずだ(具体的にどのようにかかわっているのかは知らないが)。
ところが、記事の中身を見たら、流量とは、1日あたりなん件、あるいは1日あたりなんメガバイトの情報が伝達されたか、という話だった。確かに、情報の伝達を扱う立場ならば、情報の流量という表現を使いたくなるのはもっともだ。
さて、現代社会には大量の情報が流通していて、その全体を人が直接とらえることはできない。情報からなる世界の構造をつかむのに機械の助けを借りたい。その際に、同じキーワード(複数)が使われている記事どうしは(主張が一致するとは限らないが)話題が近いにちがいない、という判断で、情報の世界の距離を見積もったり、情報の群れ構造を認識したりすることができるとありがたい。ところが、専門集団ごとに用語が違う。同じ対象について違う表現を使うこと(きょうもネット上の別のところで「電場」と「電界」という例を見かけた)については、同意語辞書を用意しておけばすむのだが、違った対象に対して同じ用語を使うことについては、判断を自動化させるのがとてもむずかしい。たぶん、情報の世界の構造をつかむ作業の全自動化は不可能で、要所要所で人間の判断を使った半自動化をめざすべきなのだろう。