macroscope

( はてなダイアリーから移動しました)

けた数の多い数をどう書くか (わたしはコンマをいれたくない)

【まだ書きかえます。どこをいつ書きかえたか、かならずしも明示しません。】

- 1 -
わたしが分担執筆している本の編者(学者)が、わたしの原稿にあらわれる数値に 3けたごとにコンマを入れてきた。(原稿にでてくる数値ではなく単なる例だが)「3776」は「3,776」と書け、というわけだ。しかし、わたしは、自分が著者である文章で、しかも、他人の手本となろうとしている教科書的な本で、コンマを入れた表記をしたくない。交渉の結果、わたしの執筆部分については、3けたごとに空白を入れるという形にしてもらった。

わたしは、1960年代の子どもとして、つぎのようにならったおぼえがある。

  • 「けた数のおおい数は、コンマをいれて読みやすくすることがある。」 (かならずそうするという意味ではない。)
  • 「4けたくぎりと3けたくぎりがある。」 (両方の流儀が対等にあつかわれていた。)

[ここでのかぎかっこは引用ではなく、わたしの記憶から再構成したものだが、このブログ記事の地の文と区別したかったので、このように書いた。]

わたしは、そういう知識をもっていたけれども、ながらく、数字はくぎらずにつづけて書いていた。

しかし、ちかごろ、けた数が多くなるばあいは、くぎったほうがまちがいがすくないという意義をみとめるようになり、(世界の書きことば全体で多数かどうかは知らないが) 世界の科学文献の多数派である 3けたくぎりをするようになった。ただし、コンマは、小数点とまぎらわしいので、さけたい。現代の物理・化学の国際的約束にあわせて、空白をいれることにした。

【ただし、4けた(数千)の数値で、5けた以上のものとの一覧の中でなければ、くぎらないほうをえらぶ。「3 776」ではなく「3776」とする。とくに、学術文献のページ番号が4けたになることがよくある(まれに5けたもある)が、ひとつの番号のうちにはくぎりをいれたくない。】

- 2 -
「コンマ」は、欧文 (ラテン アルファベットで書かれる言語) の句読点のひとつだ。「ピリオド」が文のおわりをしめすのに対して、コンマは文のうちのまとまりをしめす。

なお、日本語話者のうちでも、人によって、「コンマ」とよぶ人と、「カンマ」とよぶ人がいて、一方に統一するのがむずかしい。これは、英語の「comma」を日本語にどうとりこむかのゆらぎだ。ただし、「comma」の発音から日本語にすれば「コマ」か「カマ」になりそうなものだが、そういう表現は見かけない。日本語にすでにある語と かさなるのが さけられたのだろう。

わたしはながらく、日本語の文章を書くとき、(欧文またはプログラム言語を引用するときのほかは) コンマをつかわずにきた。句読点の読点は「てん」として意識し、原則としては右下がりの点として書いてきたが、コンマとして印刷されていても、区別してこなかった。日本語の横書きの出版物で読点のところにコンマをつかう流儀があることは知っていた。それは出版者が印刷の段階で統一するので、原稿を書く人は読点で書いてもコンマで書いてもよいのだと思っていた。

コンマと読点の区別は、中国語をまなんだときに意識した。現代中国語では、コンマが日本語の読点にあたるやくわりをし、日本語の読点と同じ形の右下がりの点は列挙のときにつかうのだ。(それぞれ中国語でなんとよぶかは おぼえていない。この記事の本題ならばしらべて書くところだが、わきすじなので省略する。)

- 3 -
世界の(全部ではないらしいが)ほとんどの自然言語 (人間のことば) で、数は十進法で表現される。この記事(5節まで)であつかう「数」は、原則として、正の整数である。

十進法は、十ごとにまとめたものを、さらに十ごとにまとめる、ということをくりかえすことである。これによって、「整数 × 十のべき[冪]」をならべた形の表現が発達した。ここでの「整数」は 1から9までの値をとる。さらに、「整数」のとりうる値として「0」をくわえると、位[くらい]どりで数値を表現でき、十のべきを明示しなくてよくなる。

- 4 -
十進法で、けた数の多い数のよびかたには、いくつもの流儀がある。

まず、十のべきにそれぞれ固有名をつけるというやりかたがある。ここでは「素朴十進法」とよぶことにする。

漢語で「億」「兆」がつかいはじめられたころは素朴十進法で、「億」は10の5乗(現代日本語でいう十万)、「兆」は10の6乗(百万)だったらしい。

しかし漢のころには、「十万」「百万」「千万」とすすんで、「億=万×万=10の8乗」、「兆=万×億=10の12乗」というしくみもつかわれるようになった。これは (当時つかわれたことばではないが)「万進法」とよぶのが適切だろう。

(「兆=億×億=10の16乗」というしくみもあったそうだ。そのつぎが「京=億×兆=10の24乗」ならば「億進法」といえる。「京=兆×兆=10の32乗」とするしくみもあるかもしれないが、どうよぶべきかはすぐには思いつかない。)

日本には、万進法が輸入され、江戸時代以後はほぼ万進法に統一された。中華人民共和国もいまは万進法がふつうだが、「兆」ということばが素朴十進法をひきついで 10の6乗につかわれるので、10の12乗は「万億」というのだそうだ。

アジアのうちでも、現代のベトナム、タイ、インドネシアは、いずれも(つぎにのべる)千進法をつかっている。ベトナムは数詞として漢語由来の要素をつかうが、「兆」は10の6乗だ (この部分は素朴十進法なのだろう)。千進法がおもになっているのは、近代ヨーロッパの影響なのだろうか、それ以前からのインドの影響なのだろうか? わたしはまだインドについてはしらべていないので、わからない。

ヨーロッパの諸言語では、わたしの知るかぎりいずれも、千進法が基本だ。千の上は「十千」「百千」のように表現して、「千千」であたらしいことばをつかう。

そこからさきはふたとおりにわかれる。英語圏のうちでもふたとおりある。

いわゆる「アメリカ式」は、千進法だ。million=10の6乗、billion=千million=10の9乗、trillion=千billion=10の12乗だ。科学用語(ただしメートル法関連ではない)の「ppb」「ppt」 は この方式によるものだ。

いわゆる「イギリス式」は、百万進法だ。10の9乗は thousand millionとし、billion = million million = 10の12乗、trillion = million billion = 10の18乗、とする。

ここにでてくる「bi-」「 tri-」 は、それぞれラテン語の 2, 3 からきている。この数 (かりに n とする)をふやしていけば、系統的に大きな数の名まえがつくれる。「イギリス式」ならば、「百万のn乗」で、わかりやすい。「アメリカ式」のほうは、「千の(n+1)乗」で、わかりにくい。

メートル法の接頭語も、千進法だ。このばあい、千のべきにはひとつずつ固有名がつけられている。固有名は自動的にきまるわけではなく、会議できめる。まだ固有名がつけられていないところはよびようがない。(固有名はどこかの言語の数詞にもとづいていることもあるが、それがえらばれる必然性はなく、だれかの思いつきが採用されただけである。)

- 5 -
ヨーロッパの諸言語 (すくなくとも、英語、フランス語、ドイツ語)では、数字のけたのくぎりを、ことばにあわせれば、3けたくぎりになる。

くぎりのところに、英語ではコンマをいれる。これは、小数点にピリオドをつかうのと組になっている。初期近代(活字印刷がはじまったころ)以来のヨーロッパ諸語の句読点の体系のうちで、ピリオドのほうがコンマよりも重要なくぎりだから、小数点にピリオド、3けたくぎりにコンマをつかうのは、すじがとおっていると思う。

しかし、フランス語やドイツ語では、小数点にコンマをつかう。3けたくぎりをどうするか、わたしはよくしらべていないのだが、ピリオドをつかうばあいと、空白をつかうばあいがあるらしい。

日本語では、明治時代には英語・フランス語・ドイツ語を同等に重視していたはずだが、算数の小数点にはピリオド、3けたまたは4けたくぎりにコンマを採用した。この記号のつかいわけに関するかぎり英語と同じ形になった。

数字を書くばあいの小数点(ピリオド)と、文章をかくばあいの読点(右下がりの短い線)とは、形がちがうのだが、どちらも「てん」と読まれる。

なお、日本語のなかの数値表現で小数点をコンマで書くことはほとんどないにもかかわらず、ことばによる表現では「0.1」のことを「コンマ1」のように、「コンマ」ということばをつかって言うことはある。これはドイツ語かフランス語の影響なのだろう。

日本語の文章表現の万進法にあわせるならば 4けたくぎり、世界の科学文献の多数派である千進法(あるいは百万進法)の言語にあわせるならば 3けたくぎりがよい。また、メートル法の千進法の接頭語をつかった単位のあいだの換算のわかりやすさからも、3けたくぎりがよい。

- 6 -
くぎりとして空白をえらぶことが、物理・化学の分野で徐々に普及している。とくに、国際単位系(SI)の標準文書で、その方式が採用されている。

国際度量衡局 (BIPM, Bureau International des Poies et Measures)の

の日本語訳

  • 国際単位系(SI)第9版(2019)日本語版

が、産総研 計量標準総合センター のウェブページ https://unit.aist.go.jp/nmij/public/report/SI_9th/ で提供されている。

その5.4.4節 (日本語版 119ページ)に次のように書かれている。

数字の形式および小数点数字の整数部分と小数部分を分ける記号を小数点と呼ぶ。第22回国際度量衡総会(2003年, 決議10)の決定により、小数点は「点(.)またはカンマ(,)のどちらかを使う」ことになっている。どちらを選ぶかは、言語の習慣や関連する状況による。 数字が+1と−1の間にある場合は、小数点の前に常にゼロを記載する。 第9回国際度量衡総会(1948年, 決議7)および第22回国際度量衡総会(2003年, 決議10)により、桁数の多い数字を表記する際は、読み易くするために、3桁ごとに空白を空けてもよいことになった。この3桁ごとのグループの間に点やカンマは挿入しない。しかし、小数点の前または後の桁数が4桁のみの場合は、1桁だけを分けるための空白は設けないことが一般的である。このようなかたちで桁数をグループ分けするか否かは、それぞれの選択に委ねられる。設計図、財務諸表、コンピュータが読み取るスクリプト(scripts)などの特定の専門的分野では、このやりかたは必ずしも使われていない。 表中の数字の場合、同じ欄の中で使用する形式は統一する。

つまり、小数点をピリオドまたはコンマであらわし、3けたくぎりには空白をつかうのだ。

ただし、SI単位をつかうことについては、日本では「計量法」という法律による義務づけがあるが、数値を数字で書く形式については (たしかめていないが) その義務づけにふくまれていないと思う。

理科年表』では、2019年11月に出た『理科年表 2020』([読書メモ])の「物理・化学」の部の「単位」の章の「物5-6」ページに、あたらしく「物理量や単位の記号、および物理量の値の表記法」という記事がくわわった。そこでは、「SIが推奨している物理量や単位の記号、および物理量の値の表記法は以下の通りである。」とし、「物理量の値」の節のうちに「数値の数字が小数点を起点として5桁以上続く場合は、3桁ずつの区切りとして半角スペースを入れる。4桁の場合は入れても入れなくてもよい。」と書かれている。

「半角スペース」と なっているところは、SI文書日本語訳では「空白」であり、『理科年表』のこの記事の執筆者が、日本語圏の従来の習慣にあわせて変えたのだろう。現在では日本語圏でも漢字・かなの文字幅が一定で算用数字の文字幅はその半分とはかぎらないので、「半角」という表現はあまり適切ではないと思う。しかし、漢字・かな の1文字ぶんの空白をあけると、あきらかに大きすぎるので、現実的助言としては、こう言ったほうがよいのかもしれない。

- 6X -
わたしは日本語のなかで空白くぎりを推進したいのだが、それをみとめてもらうことのむずかしさも感じている。

日本語の漢字かなまじり文では、文字のあいだに空白をいれて(単語の)くぎりにする習慣がない。空白があっても無視されたり、印刷の際のゆらぎにすぎないと思われたりする。編集・印刷の際に、空白が執筆者の意図どおりに たもたれない ことがよくおこる。

- 6Y -
数字がならんでいるが、それがひとつの数値をあらわすのではなく、識別のための番号やコード(code)であるときには、くぎりの記号として、ハイフン (「-」) や 斜線 (スラッシュ、「/」) などがつかわれることもある。しかし、ハイフンは、(とくに ASCII文字コードで) 算数の ひきざん の演算子と区別がつかない。斜線は わりざん の演算子につかわれることがある。数値をあらわす数字列のうちのくぎりにはならない。

- 7 -
【ここからは別の記事にしたほうがよいかもしれないが、一連の考えだったので、同じ記事の別の節にしておく。】

ここからは、実数の表現を考える。

けた数の多い数値については、指数型表記がよくつかわれる。

指数が実数であることをみとめるならば、X の(底 Bの)対数を E として、「X = BE」とかける。

指数を整数にかぎると、「X = M × BE」の形に書ける。M (「仮数」とよばれることがある)は本来は実数で、実際には小数がつかわれる。Mを1以上B未満にとるのが標準的とされる。

計算機内部表現としての「浮動小数点表現」では、ふつうBを2にする。Bを16や8とすることもあった。

他方、人が見るための表記では、Bを10にする。これを「科学的表記法」ということがあるが、その表現は何をさすかあいまいなので、わたしはつかいたくない。「十進 浮動小数点表現」というのが適切だと思う。

このような指数型表記は、有効数字を明確につたえるのに便利だ。(教材ページ[有効数字の考えかた])。また、数値のかけざんが指数のたしざんに対応することを計算に利用できる (教材ページ[数値の指数型表現 (10の何乗) の性質])。

- 7X -
ただし、指数はふつう上つき添え字として書かれるが、添え字はあつかいにくい。

上つき添え字であるという情報がうしなわれると、105 (十万) が 105 (百五)にばける。(電子メールなどで数値をつたえるのに、これでこまることがある。)

ブラウザや、ワープロソフトウェアの印刷機能で、上つき添え字が、ふつうの文字の縦横それぞれ半角(面積では4分の1角)であらわされる(日本語フォントではよくある)と、添え字の文字がちいさすぎて見わけにくい。(試験問題を「ワープロソフトウェア」でつくってファイルを提出し、印刷されたものを見たら、大事な数値(たとえば「 2.5×106」)が読みにくいものになっていた。2回めからは注意して「2.5かける10の6乗」などという注釈をつけた。)

単位をうまくえらんで、指数部を省略できるとよいのだが、メートル法の接頭語のつかわれかたは、習慣によってかぎられている。長さは、km はつかうが、Mm, Gm, Tm などはつかわない。(メートル法ではない 光年 または パーセク はつかわれる。kmと光年のあいだの規模の長さだと、万km、億km などといった表現になる。)

メガメートル、ギガメートルなどという表現が通じる時代はくるだろうか? まず大学で「わたしの授業ではこの用語体系をつかう」としてやってみようか、とも思う。しかし、学生にとっては、大学でまなんだことを社会でつかうのだし、とくにわたしが担当する科目は、教員をめざす人のための教科内容の科目でもあるので、中学・高校の用語から離れるのもまずいとも思う。

- 8 -
数値を文字でどのように書くかをおしえることは、小学校の科目でいえば、算数と国語のはざまになる。中学以降だと、おそらく数学でも国語でもおしえないだろう。理科ではおしえるだろうが、理科の場にかぎった知識だと思われるかもしれない。

かけざんの順序の話題では、わたしは、「算数は数学の初歩をおしえる科目だ」という意見に賛同した。小学校の算数でおしえる かけざん の概念は、数学でいう (整数や実数の) かけざんと同じものであるべきで、算数特有の「かけられる数」と「かける数」の区別などをもちこむべきではないのだ。

しかし、ここではあえて、「算数は数学の初歩をおしえるだけの科目ではない」と主張したい。単位のついた量や有効数字のあつかいなど、わたしが仮に「量学」とよぶ分野がある。どれかの科目でおしえるようにきめるべきだと思う。小学校の算数から、中学の理科や社会科につなぐべきなのかもしれない。けたくぎりの表現は、この「量学」と国語のはざまにあたり、両科目の連携がほしいところだと思う。