macroscope

( はてなダイアリーから移動しました)

QWERTY (2)

[前の記事]に、思いがけず、参照した論文の著者の安岡孝一さんからコメントをいただいたので、もう少し調べてみた。(ただし「少し」であって「詳しく」ではない。この主題についてはわたしは気にかけつづけるつもりではあるが、本気で調べるかどうかは、まだわからない。)

Elsevier社から出ているResearch Policyという雑誌の42巻6-7号に「Discussion on QWERTY」という小特集がある。http://www.sciencedirect.com/science/journal/00487333/42/6-7
この雑誌をとっている図書館に行ったら読んでみたいと思う。オンラインでも買えば読めるのだが、1件35.95ドル(短いコメント論文でもこの値段)で5件買って読もうというほどの興味がわかない。(有料だから嫌っているわけではない。特集全体が36ドルなら買う気になると思う。) Google Scholarで検索してみると、このうちVergneの論文は印刷前の原稿の形で別のウェブサイトに置かれていた。Kay (2013a, b)の論文自体は見あたらないが、それを参照しているKay (2013c)の講演予稿が見つかった。

Kay (2013c)は、Yasuoka & Yasuoka (2011)をも(発表年を2009と書いているが)参照している。Sholesがキー配列を決めた際の判断基準は明確には記録に残っていない。前の記事でわたしが参照したYamada (1980)を含むいくつかの文献は「英語で続けて現われやすい2文字をround basket上で反対側に置いた」という説をとっている。Yasuoka & Yasuokaはこの説を否定する判断をしている。たとえばEとRは続いて現われやすいが反対側に置かれてはいないのだ。Kayはそれを認めながら、「英語で続けて現われやすい2文字がround basket上で隣どうしになるのを避けた」という説をたてる。ただし、Kay (2013c)が実際に数値を使って示しているのは「QWERTY配列のround basketで隣どうしになった文字が英語の文章で続けて現れる頻度が少ないこと」であって、それを部分的に変更した配列でもDvorak配列でもこの頻度が多くなるという結果も得たそうだが、(Kay 2013aを読むまでは未確認だが)考えうるあらゆる配列のうちでQWERTYが最適だと論証できたとは考えにくい。

なお、Kayは「Sholesは店頭で実演する人の便宜のためにTYPEWRITERという文字列を打つのに使うキーを同じ段に置きたかった」という説は採用して、配列の選択範囲を狭めている。他方Yasuoka & Yasuokaは、当時の商品名は「Type-Writer」であったのにハイフンは同じ段に置かれていないことなどを理由に、この説はあやしいとしている。

ここまで読んだわたしの判断としては、Kayの論証は不完全なのだが、「Sholesが配列を決めるにあたってはキーと印字部をつなぐ棒がからまないようにするという目標が重要だった」という説は(「反対側に置いた」という不要な枝葉を否定すれば)もっともである可能性が高まったと思った。

Kayは「Sholesの判断基準を前提とすればQWERTY配列が最適だった」と言っているようだ。とくにKay (2013a)の題名を見ると、Kayはこれが唯一の最適解であってそれに決まるのは必然だったと主張しているようだ。わたしがKay (2013c)を読んだ限りでは、その主張が論証されているとは思えないし、常識的に考えて最適な配列はひとつにはしぼれないと思う。しかし「QWERTY配列がSholesの判断基準で誤差の範囲で同程度に最適とみなせる配列の集合に含まれている」という意味ならば、(実際そうだと納得したわけではないが)ありうると思う。

さらに、KayはQWERTYが経路依存の例ではないと言っているようだ。「経路依存」という学術用語の意味は「最適でない技術にはまってしまう」ことを含むので、Sholesが生きていた1890年までの状況に限れば「QWERTY配列は最適(なもののひとつ)だったのだから経路依存ではない」という理屈は成り立ちそうだ。しかし、現代のコンピュータのキーボードについて、あるいはそこまで行かなくてもキーと印字部をつなぐ棒の配置が円形(round basket)から半円形に変わった以後のタイプライターについては、すでにSholesの判断基準は意味がなくなっているので、QWERTY配列が生き残ったのは経路依存だと言うべきではないか? ただし、Kayにとってのこの用語の意味がわたしにとっての意味と違うのかもしれない。

Vergne (2013)の論文は経営学の背景知識がないわたしにはあまり理解できなかったのだが、Kayの「QWERTY配列は経路依存の例ではない」という理屈を(わたしとは違って)認めたうえで、しかし経路依存は技術の発達過程にはよくあるのだ、と言っているようだ。

文献 ([前の記事]と重なるものは省略)

  • Neil M. Kay, 2013a: Rerun the tape of history and QWERTY always wins. Research Policy, 42:1175-1185. [わたしはまだ読んでいない]
  • Neil M. Kay, 2013b: Rerun the tape of history and QWERTY always wins: Response to Arthur, Margolis, and Vergne. Research Policy, 42:1195-1196. [わたしはまだ読んでいない]
  • Neil M. Kay, 2013c: The QWERTY Problem. Paper to be presented at the 35th DRUID, 2013. http://druid8.sit.aau.dk/acc_papers/rluar3kk4i5t4gelr7j36gx9hma5.pdf
  • Jean-Philippe Vergne, 2013: QWERTY is dead; long live path dependence. Research Policy, 42:1191-1194.

QWERTY

現在のコンピュータ用のキーボードのアルファベットの配列は、英語用の場合で言えば、左からQWERTYと文字がならんでいる。(日本語用キーボードでは、かなが加わり、記号類の位置が英語と違うところがあるが、アルファベットに関しては英語用と同じものが使われている。) これは、英語あるいは日本語ローマ字を速く入力するために設計された配列ではない。(英語の入力にはDvorak配列がよいと言われることが多い。日本語についてはこれとは別だが母音キーをホームポジションに集める点では共通の日本語ローマ字配列が開発されたことがあった。) 19世紀末ごろにできたタイプライターのキーボード配列の事実上の標準が、いったん慣れたものを新しく覚えなおしたくないという人々の惰性によって、生き残ってしまったものと考えられる。技術史用語でいう「経路依存性」あるいはlock inの例ともいえる。

タイプライターのキー配列がQWERTYになったのは、初期のタイプライター開発者が、わざとキー操作が速くならないように考えたのだという説がある。2013年8月に出た橋本毅彦氏の文庫本の第8章のうちの節の見出しに「スピードを遅くするためのQWERTYのキー配列」とあるのはその説に立っていると言えるだろう。なお、この本は2002年に出た本の改訂版だが、この部分の記述は旧版の第7章からそのまま引き継いでいる。

ところが、その少し前、2013年5月に、わたしは(だれかのTwitterでの発言がきっかけだったと思うが) アメリカのSmithsonianのStamp氏の記事で、その説は「伝説」にすぎず歴史的事実ではないという主張を読んでいた。

Stamp氏がもっとも重要な根拠だとするのは、安岡孝一氏と安岡素子氏の研究(2011年の論文)だ。それによれば、QWERTY配列が選ばれた理由に電信を受信してタイプで文字を打つ仕事をしていた人の要望があったという。当時使われていたアメリカ式のモールス符号(のちの国際式モールス符号とは異なる)では「Z」と「SE」がまぎらわしかったので、その判別がぎりぎりになっても手の動きが追いつくように、Z、S、Eのキーが近くにあるのが好まれたというのだ。しかしこれだけでは、Z、S、E以外の部分についての「伝説」の否定にはなっていないと思う。

わたしは1970年代、アメリカから東京大学に異動してコンピュータのための日本語入力方式を研究していた山田尚勇(ひさお)教授からこの件の話を聞いた覚えがある。ネット検索してみると山田氏の1980年の論文がみつかった。これのIV(B)節によれば、Sholesが1873年にキー配列を決めた際には、jamming (キーと活字ヘッドをつなぐ棒がからみあうこと)を避けるため、よくならぶ2文字をround basketの反対側に配置した、とある。その過程で、意図したのではないが、速く入力するのが困難になった場合がある、とも言っている。文献としてCurrent (1954)が参照されている。

自分で研究したわけではなくこれだけ読んだことをもとにした推測だが、タイプライター開発の初期の段階で、棒がからまないことを入力の速さよりも優先する判断は実際あったのだろうとわたしは思う。ただし「わざと遅くした」というのは当時の人の意図ではなく後世の人の皮肉を含む表現として読むべきだと思う。それからまもなくタイプライターの機械的機構が改良されてどんなキー連鎖でも棒がからむ可能性は薄れたと思うが、配列は惰性で残ったのだろう。そこにさらに安岡氏のいう電信受信者による選択があったのだと思う。

なお、安岡孝一氏の2005年の報告には、その後にQWERTY配列が生き残るのを助けたいくつかの事情が述べられている。

  • 1893年、多くのタイプライター製造会社が合併し、そのキー配列はQWERTYに統一される。その後出てきた会社はQWERTY配列を採用する戦略をとった。
  • 1901年、Donald Murrayが印刷電信機を開発する。これを原型としたテレタイプが普及する。これは1234567890と同じキーにQWERTYUIOPが割り当てられることを前提に設計されていた。
  • 1949年、電子計算機EDSACが入出力装置としてテレタイプを利用する。

文献

「風立ちぬ」

風立ちぬ」という映画が話題になっている。わたしは映画を見る習慣がないし、宮崎駿(はやお)監督にもとくに興味がない。航空工学の中身に立ち入った話ならば、気象学の歴史にもかかわる可能性があるのだが、うわさによればそうではなさそうだ。関東大震災の描写はよいという評判も見たが、それをめあてに映画館に行こうとも思わない。テレビで放送されたら見るかもしれない。

ここでは題名にだけこだわっておく。この題名は、堀辰雄の小説の題名からきている。そしてそれは、Paul Valéryの詩の一節「Le vent se lève! Il faut tenter de vivre!」からきている。もとの詩Le Cimetière marin (海辺の墓地)はhttp://fr.wikisource.org/wiki/Le_Cimeti%C3%A8re_marin にある。またC. Day Lewis による英語訳との対照で http://homepages.wmich.edu/~cooneys/poems/fr/valery.daylewis.html [2018-06-16 リンク先をweb archiveに変更]にある。問題の節は最後の連の最初の行だ。わたしはこの詩全体を読みきれていない。(問題の節のあとの文はともかく、前の文になぜ感嘆符がついているのかも理解していない。) しかしともかく堀辰雄の「風立ちぬ、いざ生きめやも」というのはこの節の訳として変だという議論はもっともだと思う。

「Il faut tenter de vivre!」はLewis訳では「We must try to live!」だ(ただしフランス語原文にはweに直接対応するものはない)。「いざ生きむ」ならばよいのだが、「やも」は反語になってしまう。堀辰雄が誤訳したのか、あえて原文とは違う「生きたいのだが、生きられそうもない」というような意味の語句を創作したのか。宮崎監督は「生きねば」という形でとりあげている。こちらは原文の意味に近いだろう。

「se lève」は現在形であって、「立ちぬ」の完了態表現には対応しない。「立つ」でよいと思うが、目の前の情景の描写だとすれば、古文ならば「立てり」(たち-あり)のほうがよいかもしれないと思う。堀辰雄も、宮崎監督も、あえて原文を離れても、ここは回想であるという印象を与えたかったのだろうか?

わたしはフランス語の読みにも日本語の古文の作文にも自信がないが、Valéryのこの語句を古文に訳すならば「風立てり。いざ生きむとす。」としたい。

さて、「Le vent se lève.」は「風が起こる」ことだと思うが、それを聞くと、日本語圏では、秋が始まることへの連想が働くと思う。フランス語圏でもそうなのか、わたしは知らない。日本(関東から九州にかけての東西軸地方)の夏にも、もちろん風は吹く。ときには嵐もある。しかし夏の大部分の時間は亜熱帯高気圧の下にあって風は弱い。秋には温帯低気圧がほぼ一定時間ごとに通過する。夏から秋に移ることは、風が弱い季節から確実に風が吹く季節に移ることとも言えるだろう。ただし、冬や春が風の季節でないというわけではない。

スーパーグローバル大学

2013年7月末ごろ、「文部科学省が、いくつかの大学を『スーパーグローバル大学』化するという事業を始める」という趣旨の報道があった。あとでウェブ検索をすると、報道記事はいくつか見つかるが、文部科学省からの新しい発表は見つからず、少し前の5月28日に出された教育再生実行会議の提言だけが見つかった。

http://www.kantei.go.jp/jp/singi/kyouikusaisei/teigen.html
「これからの大学教育等の在り方について」(第三次提言)(平成25年5月28日)
1.グローバル化に対応した教育環境づくりを進める。
(1) 徹底した国際化を断行し、世界に伍して競う大学の教育環境をつくる。
...
○国は、大学のグローバル化を大きく進展させてきた現行の「大学の国際化のためのネットワーク形成推進事業(グローバル30事業)」等の経験と知見を踏まえ、外国人教員の積極採用や、海外大学との連携、英語による授業のみで卒業可能な学位課程の拡充など、国際化を断行する大学(「スーパーグローバル大学」(仮称))を重点的に支援する。国際共同研究等の充実を図り、今後10年間で世界大学ランキングトップ100に10校以上をランクインさせるなど国際的存在感を高める。

これが5月末に話題になった記憶はないが、7月末に報道されたときには、いろいろな批評があった。自民党の政策に反対する人々から否定的な意見があったのは当然だが、保守系の人のうちにも「国家を基礎とした国際化はよいが、グローバル化は多国籍資本に国民を売り渡すようなものだ」という批判もあった。またグローバル化政策には賛成であっても「スーパーグローバル大学」という名まえは品がないという意見があったと思う。

また「世界大学ランキング」がどの機関が判断したランキングをさすのか不明だという指摘もあった。複数の機関のランキングがそれぞれ違う観点でつくられていることを承知でそう書いたならばねらいがあいまいだし、違いを無視しているならばあまりに単純化したものの見かただと思う。

授業を日本語でやるべきか英語でやるべきかはむずかしいところがある。ただし政策を決める側で注意してほしいのは、両方の言語で教材を用意するのはひとつの言語で用意するのの2倍近い労力がかかることだ。

大学全体を、授業も会議もすべて英語でやるように変えてしまうならば(文科省への報告も英語のまま行くか、あるいは翻訳専業者に日本語へ翻訳してもらうことになる)、それなりに運営可能だし、もし日本の外国人在留資格に関する行政が積極的に協力すれば、外国の大学との間で異動先としてひけをとらなくなるかもしれない。ただしその大学はもはや日本語圏の大学ではなく、いわば日本にあっても英語圏の大学になる。(OISTは初めからそうなっているだろうか?)

もし、英語圏の大学であって日本語圏の大学でもありたいのであれば、二つの言語で教材を提供することができる人を、そういう意欲をもちつづけることができる待遇で確保しなければならない。

- - -
内容はともかく、「スーパーグローバル大学」という用語は、わたしには気もちが悪い。

まず「スーパーグローバル」を英語で解釈すると、英語のsuperは独立した単語でなく接頭語だから、super-global universityはsuper-globalな大学にちがいない。地球にとって上のほう、つまり上空にある大学ということなのか、地球よりも大きなまとまり、たとえば太陽系の大学ということなのか。

他方、日本語で解釈すると、「スーパー」は英語を勉強していなかった1960年代の子どもでも知っていることばだったが、それは商店の一種をさしていた。個人店よりは大きくて「デパート」よりは小さく、代金を出口の「レジ」でまとめてはらうのが特徴だった。今もわたしは日本語の文脈で「スーパー」と聞けばこの意味で解釈を始めてしまう。

(「スーパーマン」ということばは聞いたことがあって「マン」が人のことだとは知っていたのだけれど、そういう主人公がでてくるアニメは見なかった(「パーマン」と「バットマン」は見たのだけれど)。「スーパーマン」は「すごい人」らしいが「スーパー」と「すごい」が同じことかわからなかった。

また、「字幕スーパー」ということばも見たが、なんで「スーパー」なのかわからなかった。「スーパーインポーズ」ということばもあることを知ったにもかかわらず、それとこれが結びついたのは、そのもとになった英語の単語を知ってからだった。)

「スーパー」で売っているものは個人店や「デパート」よりも安いことが多かった。ただしまったく同じものではなく、雑につくられた「やすもの」であることも多かった。日本語の文脈で「スーパー」ということばを聞いたときわたしがまず思いうかべるのはこの「スーパー」なのだ。

スーパーマーケットというしくみは20世紀資本主義社会の偉大な発明である、とは思う。それは大衆向けのしくみなので、ひとりあたりにすると、手軽なものであって、高級なものではない。

「グローバル」ということばは、わたしが中学生だった1970年代にはあまり日本語として聞かれることばではなかった。わたしの「グローバル」の理解は英語の global からきている。

「スーパーグローバル」と言われて、わたしが感覚的に連想するのは、世界いたるところに店を出している「スーパー」ということになる。理屈をいえばそれは「グローバルスーパーマーケット」なのだが。たとえばウォルマートとかカルフールが例になるだろう。1990年代にはヤオハンがそのようになると思われたものだった。

そこで、「スーパーグローバル大学」ということばからわたしの頭に思いうかぶのは、世界じゅうから来たお客さん(学生)たちが、無言で、棚にならべられた(知識の)パッケージをそれぞれ持ち帰っていく情景なのだ。

人間力

2013年7月25日、下村文部科学大臣の発言をきっかけに、「人間力」ということばが話題になった。わたしが27日ごろまでにTwitter上のいろいろな発言を見て考えたことをまとめておく。Twitter上の発言者のお名前はひとまず出さない形にしておく。

人間力」ということばは(定着した)日本語にないという前提で、冗談として、しかし理屈を持って、その意味を考えた発言がいくつかあった。

  • 「『馬力』と同様なエネルギーの単位」。正確には仕事率(つまり単位時間あたりのエネルギー)の単位である(と指摘されていた)。
  • 「人と人との間に働く力であり、引力と斥力がある。読みは『じんかんりょく』」。「分子間力」からの連想にちがいない。

冗談ではなく今の話題に対応可能な「人間力」の定義として、次のページの存在が指摘された。

鳥取大学
人間力の考え方
http://www.tottori-u.ac.jp/dd.aspx?menuid=2382
本学では、「人間力」を、「知力」、「実践力」、「気力」、「体力」及び「コミュニケーション力」の5つの構成要素から成り立つ総合的かつ人格的能力として定義する。
[そして構成要素それぞれの定義が続くのだが、引用は省略する。]

これを紹介してくださった人は、「定義としてはいろいろな批判があるだろうが、ともかくここまで具体化したことはすごい」という趣旨の論評をしていた。

この「人間力の考え方」は「鳥取大学教育グランドデザイン」の一部とされている。その文書が作成された年は見あたらなかった。別のページを見ると、鳥取大学の現行の平成22-25年度の「中期目標」の文書には「人間力」ということばがあるがその前の平成16-21年度のものには見あたらない。したがって、おそらく平成16-21つまり2004-2009年度の間に「人間力」についての議論がされたのだろう。

鳥取大学の「人間力の考え方」のページには次の記述もある。

文部科学省は「人間力戦略ビジョン」において、「新しい時代を切り拓くたくましい日本人の育成」のための指導理念として「人間力」を位置づけている(文部科学広報25号、平成14年9月30日)

人間力」は10年以上前から文部科学省の政策で使われていた用語だったのだ。【「文部科学広報」は平成22年度以後のぶんはオンラインにあるが古いものはないらしく、まだ原文を確認していないのだが。】

ただし、鳥取大学は「人間力」を入学した学生への教育目標としている。目標がかなえば、卒業する学生はみな「人間力」をそなえていることになり、そのうちでの優劣をつける必要はないだろう。

今回の大臣の発言で問題なのは「人間力」を持ち出したこと自体ではなく、それを入学試験の判定基準で使えというところだ。そうなると、受験者の間の「人間力」の相対評価をしなければならなくなる。そして、不合格になった人について「人間として価値がない」かのような印象を与えてしまう(ということを指摘した人もいた)。

ロボットが受ける試験ならば人間力を問うのもよい、という冗談半分の発言もあった。

もう少しややこしい話で、「『人間力』を問う試験をすれば教育におかねをかけられる社会階層の人が有利になるので、社会階層の固定化につながる」という批判もあったと思う。そういう主張には「貧しい人の教育の機会を均等に近づけるには、学力試験の一発勝負のほうがよいのだ」という主張が伴うことが多い。この前段はもっともだと思うが、そこから後段の主張につないでよいかはわたしはよくわからない。

ベテラン

ひとつ前の記事(のもとになったプレゼンテーションファイル)を書いたとき、ふと、自分は「ベテラン」だと言いたくなったのだ。

1960年代の子どもとして、わたしは日本語に「ベテラン」ということばがあることを知った。おもにスポーツの報道で使われていたが、その他の職種にも適用できるようだった。何かの専門的技能を使った仕事の経験を積んだ人、というような意味で、「新人」と対照されることばだ、というように理解した。ただし、自分からこのことばを使うことはなかったと思う。

おとなになってから、このことばは英語の veteran から来ていると知った。これは熟練者という意味もあるが、アメリカ合衆国では退役軍人をさす。アメリカではveteranの団体は政治にかなりの圧力をかける団体であるらしい。

そして、わたしはある種類の情報処理の専門的技能について自信をもち同業者の間でも頼りにされた職人であった時期があった。

しかし、情報処理の技術は急速に発展し、わたしはその進展についていけなくなった。今や、この分野の職人の募集があっても、わたしの能力でつとまるものは少ない。

わたしは、親の世代ならば定年となるはずだったとしになったが、今の時代、まだ職業人から引退するには若い。しかし、情報処理の職人としては、日本語の「ベテラン」というよりはむしろアメリカ英語の veteran のようなものになってしまったような気がする。

だが、veteranの経験を背景とした発言が必要とされることもあるような気もする。

Cool Japan = 日本を冷やせ(?)

ある人が「『Cool Japan』よりも別の『XXXX Japan』のほうがいいのではないか」というような議論をしていた。(そこで話題になっていたXXXXには、ここでは話を広げないことにする。) そのときわたしは一瞬、「Cool Japan」を「日本を冷(ひ)やせ」だと思った。少し頭をめぐらして、近ごろ(2000年ごろからだろうか?) 「cool」という形容詞がほめことばに使われているのを思い出した【[2016-09-21補足] [クールビズ、ウォームビズ (2006-03-22)]参照】。ほかのことばで置きかえにくいが「気持ちがいい」と「賢い」に近いところがあるだろう。「Cool Japan」は日本のいいところを宣伝するための標語として使われているのだろう。

わたしが「cool」をすぐ動詞と解釈した背景には、気象学の専門文献を読み慣れていることがある。ひとまず気候の話は別にして狭い意味の気象の文脈で、英語では「寒冷な」という形容詞はcoldであってcoolはめったに使われない。気象の文脈で話題になるのはたいてい隣どうしの相対的高温・低温なので、低温側の用語はひととおりでよい。Coolは「冷やす」という動詞、あるいはcoolingという形で「冷却」あるいは「寒冷化」という名詞としては出てくる。(熱力学的な意味で熱を奪うことをさす場合と、温度を下げることをさす場合がある。) 反対語は、「温暖な」も「あたためる」「温暖化する」もwarmなのだが。【[2022-12-27 補足] 「あたためる」が熱力学的な意味で熱をあたえることをさすならば動詞は heat をつかう。[warming, heating, cooling] (2018-12-15) 参照。】

気候の話だとちょっと違って、日本語で「寒帯」と「冷帯」の区別をすることがあり、対応する英語表現は一定しないと思うが、たとえばcold zoneとcool temperate zoneという表現は通じるだろう。ここでは、coolは低温だがcoldほどではないという語感が有効なのだと思う。ただしcool zoneとは言わないと思う。世界の気候を大きく寒帯・温帯・熱帯と分けたとき温帯がtemperate zoneで、その温帯をcool temperate zone (冷温帯あるいは冷帯)とwarm temperate zone (暖温帯あるいは狭い意味の温帯。「暖帯」とは言わないと思う)に分けるのだ。

しかし、「Cool Japan」は「日本を冷やせ」だと理解したとして、その発言が実際に有効な場合を想像しようとしてもなかなか考えにくい。地球温暖化を防ごうということを「冷やせ」というのはわかるが、それならば「世界を冷やせ」だろう。都市のヒートアイランド現象を防ごうというのならばたとえば「東京を冷やせ」だろう。比喩的な意味で、日本の言論空間が興奮状態にあるのでもっと冷静になってほしい、という主張ならばわからないでもない。

とにかく7月や8月の東京で開くオリンピックはcoolではない。野外は暑いし、電力需給のきびしさは今後数年では解決できず、お客さんに快適な冷房を提供しようとすれば住民が節電のため何かをがまんしなければならないことになりそうだ。

東アジア共通語として漢文を使う可能性があるか

[1月2日の記事]では、アジア共通語として英語をもとにした半人工言語を使うことを考えた。

共通語の候補としてはもう一つの考えがある。漢文である。

ただしこれはアジアのうちでも漢字文明圏にしか通用しない。東アジアと東南アジアを分けるとすれば、東アジア全体は含められるけれども、東南アジアではベトナムだけが含められる。(ベトナムでは現在実用には漢字が使われていないけれども、学術用語など多くの単語が漢語から構成されているし、漢字の知識は自国の歴史資料を読むにも有用だ。しかしその他の東南アジア諸国では、少数民族である華人だけがなじみがある手段を奨励するのはうまくないだろう。) 南アジア・西アジア・(中国国境外の)中央アジアではほとんどの人になじみのない言語だろう。

また、これを声に出す言語として採用すると、現在の漢字利用者のうちの相対多数が学んでいる近代北京音を標準にするしかないと思うが、それでは日本人にとって魅力が乏しい。話しことばのない書きことばだけの言語でコミュニケーションが成り立つかどうか。20世紀末までならば無理だと言ったところだろうが、キーボード入力で文字が表示される通信機器がこれだけ普及すると可能かもしれないという気がしてきた。

文法や語彙の標準も、現在の利用者数で決めれば現代北京語に近いものになってしまうかもしれないが、日本、朝鮮、ベトナムの言語文化への影響がいちばん強かったのは唐代だと思われるので、唐代の文章に模範を求めたいと思う。読みを重視しないのだから当然、韻文ではなく散文が基本となる。

すでに、Wikipediaには、「文言」の「維基大典」zh-classical.wikipedia.org が存在する。現代中国語(「中文」)の「維基百科」zh.wikipedia.org に比べるとささやかなものにすぎないが。これがどの時代の文章を模範としているか確認していないが、きょう(2013-01-20)現在の表紙には杜牧という唐の詩人に関する記事が出ている。

漢字の文字コードや表示をどうするかという問題もある。今のインターネットではUnicodeが事実上の標準だ。細かい指定をしなければ、中国語・韓国語・日本語の多くの文字は同一視されてしまう。今の場合それでよいと思うが、逆に区別される文字のほうでむずかしいことが起きる。日本語の書き手が日本語の漢字コードで入力して、中国語の読み手が日本語フォントのない環境で読むと、大部分は正しい漢文になっているがところどころ読めない字が混ざることになるだろう。漢文専用の入力方式を整備すればそのような事態は減らせるが、それに慣れる必要がある。

(日本語対応のFirefoxブラウザで見る限りでは)「文言」のWikipediaでは文字の表示は繁体字に統一されているようだ。他方、「中文」のWikipediaは、書かれた文字がそれぞれ簡体字繁体字かを記録しているらしく、表示は(便宜上日本語の漢字で写すと)「不転換」「大陸簡体」「馬新[マレーシア・シンガポール]簡体」「台湾正体」「港澳[ホンコン・マカオ]繁体」が選べるようになっている。すごいくふうだと思うが、日本語や韓国語の漢字が書きこまれることは想定外だろう。東アジアの人がよけいな苦痛なく漢文で情報交換できるためにはこれよりもう少し高度なプラットフォームを構築しなければならなくなりそうだ。

なお、漢語以外の言語からの外来語や固有名詞は、どこかの地方の発音に従って漢字で音訳するのではなく、ローマ字表記で混ぜるのが妥当だろう。漢文は縦書きしたい人もいるだろうが、その場合ローマ字は横倒しでがまんしてもらおう。

アジア共通語のウェブサイトを作ろう

アジアの人々が知識を共有する場がほしいと思う。たとえばウェブサイトだ。ところが、アジアの人々が使っている言語は多様だ。どういう言語で述べれば伝わるかという問題がある。

アジアの人が集まる国際会議では、通訳がはいる場合もあると思うが、(昔はともかく今の)自然科学の専門の会議であれば、共通言語として英語を使うのがほとんどだ。自然科学者が外国を訪問して現地の自然科学者と個別に情報交換する場合も、一方が他方の国語を使いこなせる場合のほかは、英語に頼ることが多い。

この事情をふまえると、少なくとも自然科学関係の話題では、アジアの人々の間で共有したい情報は、まず英語で書くしかないだろう。それを見て、英語を読めない自分のまわりの人にも伝えたいと思った人が、他言語への翻訳を追加すればよいだろう。その翻訳が正しいかどうかを原文を書いた人が確認することは困難だから、「このサイトが責任をもつ内容は英語版です。他言語版は非公式なものです。」とことわっておく必要があるかもしれない。

そう思ってみてもなかなか実際に始められない。思えば自分が「英語が苦手」なのだ。(高校生のときは高校生にしては英語が得意だったし、大学院生のときは専門の論文に限れば日本語よりも英語のほうが読み書きしやすいと感じていたわたしでも、こんな弱音を吐いてしまう。) アジア人どうしで会話しているときはどんな英語を使っているか意識していないのだが、反省してみると、専門用語を正確に使うようには注意をはらっているが、単数複数や冠詞の使いわけなどには無頓着なのだ。聞き手も単数複数や冠詞のない言語で育っている人ならば、そこでとがめられることはない。英語nativeの人にどう聞こえているかわからないが、幸い、標準的な英語でも冠詞や語尾は弱く発音されるところなので、そこを弱く発音しているかぎりは、あまり耳ざわりではないと思う。ところが、文章を書くとなると、そういう英語がそのまま世界に出ていってはまずいと感じる。学校で習った文法に従っていないのは恥ずかしいという意識は思いきって捨てることができるが、実際に読者に意味を取り違えられる可能性はなるべく減らしたい。ところがどういうチェックをしたらそれができるかよくわからないのだ。

わたしはこの問題を何年も前から感じていたが、なかなか文章表現できなかった。最近出た「科学」(岩波書店)の2013年1月号で、日本の大学で理科系の学生に英語を教えているトム・ガリーさんが科学に関する世界共通語としての英語の欠点について論じているのを読み、もっともだと思った。ただし、人工言語を使うという対案は筋は通るがこれから実現可能とは思えない。(また、人工言語の例としてあげられているエスペラントも単数複数の区別や定冠詞などの英語の欠点は共有する。)

英語を(半)人工言語に改造することを考えたほうがよいのだと思う。文法や語彙の標準は、まずはイギリス・アメリカ・オーストラリアなどで共通に通用するものにならうしかないと思うが、それらの国の文化に深くかかわる要素は除外する。複数の言語を知っている立場から見て普遍的でないと判断される英語特有の性質もなるべく避ける。ウェブサイトで使う英語(の方言)の標準としてこのようなもの [仮に「アジア共通語」と呼ぶ]を設定し、投稿された文書をそれに沿って添削してから掲載し、なるべくは投稿する人自身が標準に沿った言語で書くようにする。

「アジア共通語」(ができた場合)の強みは、アジアのさまざまな言語との間の相互翻訳がしやすいことだ。そのために機械翻訳を活用することにする。読み書きできる言語が英語と自国語だけの人でも、アジア共通語と自国語の間で複数回機械翻訳して意味が変わらないかを確かめることができる。それがうまくいかない場合、原稿を改訂する、翻訳プログラムを改訂する、アジア共通語標準を改訂するという対策がありうる。とうぶんの間は機械翻訳技術もアジア共通語標準も未熟だろうから、書き手の不満を受け止めて改訂する努力が必要だろう。

実際には、たとえアジアで共有したい自然科学関係の話題でも、人が書く文章の全部が機械翻訳可能ではないだろう。あらかじめ人(書き手あるいは編集者)が機械翻訳対象にするところとしないところの区別を意識して記号を入れておくのが現実的対策だと思う。機械翻訳からはずすところは、翻訳家がその専門技能を駆使した訳をつけるまでは、暫定的に原文のまま表示しておくことになる。切り分けも、機械的にできず人の技能を必要とする仕事だが、機械翻訳技術の開発者と伝えたい内容をもつ人とで共同研究して参考例を示せば、書き手にまかせることができると思う。

「アジア共通語」の標準を、現在通用している英語の標準に近いものと、合理的に筋を通したものとの間で、どのあたりに置くかはむずかしい問題だ。たとえば、筋を通せば、単数複数の区別や冠詞をなくすことも考えられるのだが、そうすると、英語とは明らかに違う言語になってしまう。大勢力になれれば別だが少なくとも当面は、「英語とみなされうる」ことは生き残りのために必要な性質なので、単数複数や冠詞については、「あってもよいがまちがってもとがめない」というのを「標準」とするのがよいのかもしれない。

文献

  • トム・ガリー (Tom Gally), 2013: 英語は科学の共通語に適しているか。科学, 83, 107-110.

  • この記事ではわざと「母語」ではなく「自国語」を持ち出した。自然科学関係の話題をまぎれなく伝えるための語彙がそろっていると期待できるのは、国の公用語として使われている言語にしぼられると考えたからだ。また、「英語native」もふつうは「英語を母語とする人」という意味で使うのだが、むしろここでは「英語による初等中等教育を受けた人」をさすとしたほうがよさそうだ。
  • [2013-01-06追加] 「仮称・アジア共通語」としたのはここで考えているウェブサイトの利用者間の共通語という程度の意味にすぎず、アジア全体に通用させてやろうという思いあがった考えではない。ただし、英語をもとにした半人工言語で行こうと考えているところどうしの通化はできるかもしれないと思う。

わたしの個人言語と共通語の違い

(わたし以外の人に意味のある情報ではないと思うが、頭の中の「場所をあける」ために書き出すことにする。)

わたしは静岡県と愛知県の数か所で育ったが、そのいずれの地域の方言も身につけなかった。方言の要素をとりこんでしまったところはあると思うが、わたしの母語はほぼ共通語である。

日本語の共通語は公的にはあまり詳しく決められていない。しかし、NHKのアナウンサーが使う日本語の発音にはかなり詳しい標準があり、それが日本語の発音の標準とみなされることがある。

わたしは学生だった1970年代に、「NHK日本語発音アクセント辞典」や柴田武日本の方言」(岩波新書)などの本を読んで、自分にとって自然な発音がNHK標準とどう違うかを反省してみた。

  • ガ行の子音は、語頭では破裂音だが、語頭以外の発音は破裂音の場合と鼻音の場合があり、NHK標準では鼻音のほうが望ましいとされていた。ところがわたしの発音はどちらでもなく摩擦音なのだ。外国語の入門書を見ると、オランダ語の g や、スペイン語の語頭以外の g が摩擦音だそうだ。ただし、わたしは自分の発音のこの特徴を他人から指摘されたことはない。摩擦音の g は、本人の発音が破裂音である人にも鼻音である人にも、違う音と思われないらしい。
  • 無声子音ではさまれた位置や無声子音に続く語尾の母音が無声化することがある。たとえば「です、ます」の「す」は「s」だけに近い音になる(時間は1拍分とる)。わたしの発音はNHKが示すほどは無声化を起こさない。これは静岡県育ちの人の多くに共通の特徴だそうだ。(ただし、「三角形」は「『サンカクケー』のクが無声化する」のではなく、初めから「サンカッケー」だと認識している。)
  • (少年時代のわたしの発音は、サ行の子音が英語の th に近くなっていると指摘された。今はこのくせはなくなっていると思う。)
  • アクセントについて。
    • 平板型と分類される語は、1拍めは低く、2拍めから高く発音されるのが標準とされている。わたしの発音もだいたいそうだが例外がある。2拍めが長音の場合たとえばコーコー(高校)や、2拍めが「ン」の場合たとえばケンキュー(研究)は、最初から高く、まったく平板に発音している。ただし「1拍めと2拍めがあわせて1音節の場合」と一般化することはできない。2拍めが促音の場合たとえばガッコー(学校)では、1拍めは低く発音している。2拍めはまったく音が聞こえないので高いか低いか決められないのだが、一般の平板型と共通の形と考えてよさそうだ。
    • 「白い」などのいくつかの形容詞について、終止形「シロイ」は2拍めのロを高く発音するが、連用形「シロク」は1拍めのシを高く発音するのが標準とされている。わたしは連用形でも2拍めが高い形を変えない。(ただし名詞の「白」は別の単語と認識しており1拍めのシを高く発音している。) 静岡県の一部の方言では終止形でも1拍めを高く発音するので、それに同化されないように意識した結果かもしれない。

わたしは機械翻訳をどのように使うか

正確な事実を確認していないのだが、「どこかのウェブページの外国語版を作る際に機械翻訳の結果をそのまま使って恥ずかしいことになってしまった」という話を聞いた。

機械翻訳の結果は、そのまま訳文として公開できるものではない。これは現在の技術水準だからというよりも、おそらくいくら技術が発達してもそうだろう。

使いみちを自然科学的記述や取扱説明書など文化の違いの影響が少ないものに限定して、翻訳ソフトウェアの能力を理解した人たちがそれを意識して原文を書く場合に限って、ソフトウェアの出力をそのまま公開して役だつものになるだろう。その原文をどのような言語で書いたらよいかについて、目的を意識した研究が進むことを期待している。

しかし、それ以外の場合にも機械翻訳はむだではない。人が翻訳する手間をはぶくため、あるいは内容を把握するための参考にするためには使える。ただし手間をはぶけるかどうかは使う人の言語能力による。

わたしは英語から日本語への機械翻訳をたびたび使っている。もとが紙の本である場合は、スキャンとOCR (文字認識)と機械翻訳という三重の手間がかかるが、わたしが日本語訳を得たいと思う場合は、英語原文をにらんで辞書をひいて日本語を考えるよりも、三重の手間をかけるほうを選ぶ。このほうが総合能率が上がる気がするのだが、それには気分転換ができるという要因もあるかもしれない。また、わたしが翻訳しようと思う文章は、自然科学または社会科学・歴史などのおもに事実を伝えるものだ。おもに(作者のにせよ登場人物のにせよ)感情あるいは意見を伝えるものや、芸術作品については、機械翻訳を役だてることはむずかしいだろう。

わたしは英語と日本語の両方向の有料のソフトウェアを持っているが、これまで実質的には英語から日本語の向きだけに使っている。ほかに、インドネシア語などいくつかの言語から英語への翻訳を、インターネット上の無料のサービスで使ってみたことがある。

わたしにとって機械翻訳が有効なのは、機械翻訳ソフトウェアの機能がわたしの能力にないわけではないがくりかえすと苦痛であるところを補ってくれるからだ。おもに、文法解析結果の行き先言語(ここでは日本語)での表現と、単語の置きかえだ。

言語の文は、文法構造に従って語を配置したものであるとともに、時間の流れの中に語を配置したものでもある。言語によって語順が違う。翻訳は、文法構造と情報の流れの順序の両方を保つことができない。両方をなるべく生かすことができる妥協点をさぐることが、翻訳の苦しみの主要部分(のひとつ)なのだと思う。

最近変わったかもしれないが、2010年ごろにGoogle translateを使ってみたところ、英語から日本語は使いものにならなかったが、ドイツ語から英語は参考になった。(分離動詞のところでは失敗していたが。) Google translateは文法解析を重視せず、文を時間軸上の単語の連鎖ととらえて類似例から統計的に訳語を推定していると聞いた。語順の近い言語ならばこれで役にたつが、語順が大きく違う言語では悲惨なことになるのかもしれない。

わたしにとって参考になる機械翻訳は、文法解析を優先するものだ。語順は変わるので、情報の流れは不自然になる。わたしは機械翻訳結果を原文と対訳にして両方ながめながら意味を取る。そして、実際に翻訳をめざす場合は、ここでどう妥協するか考える。これは片手間ではできない頭脳労働だが、少なくともわたしにとっては、原文と辞書をにらんで頭脳労働するよりは能率があがる。また、訳文が完成して原文を消せれば文書ファイルの量が半分に縮むのがはげみになる。

わたしにとって役にたっている機械翻訳の機能の第2は単語の置きかえだ。実は、わたしが訳そうと思う文章は、だいたいわたしは辞書をひかずに読める。つまり単語の意味は頭にはいっているはずなのだ。対応する日本語が頭にはいっているとは限らないが、辞書かウェブ検索で見つけることはでき、それでも見つからない新語またはよそのローカル語ならば原語のまま書いて注釈をつけるべきだと判断できる。ただし、たとえ頭の中にあっても、編集中の文書ファイルの適切なところに書き出すのには手間がかかる。この手間を減らしてくれる機械化はありがたい。

ただし、機械が見つけてくれる訳語はまとはずれのこともある。言語間で単語の意味の広がり(W.A. グロータース 著・柴田 武 訳 (1967)『誤訳』でいう「森羅万象の割り方」)が違うのだが、これに計算機ソフトウェアで完全に対応できるとは思えない。いつの世も、人が原文と照らし合わせてチェックすることは必要だろう。例外として、自然科学的事実の記述や取扱説明書などで、専門用語の意味が一対一に対応することがわかっている場合は、訳語の選択を機械にまかせることができるかもしれない。

結局、機械翻訳は、自分で翻訳できる能力をもった人が、その能率を上げるために使うことができる道具だ、ということなのだと思う。

【[2013-09-30補足] わたしは、自分の翻訳文を売り物にしたことは、まだない。自分の翻訳文として公開できるところまで文章を磨こうとしたことはいくらかあるが、多くの場合、それに多くの時間をかけられなくて挫折している。自分が参照するだけの場合は、機械翻訳結果を修正しないまま原文とならべて見ることが多くなっている。この記事はそういう人の感想として受け止めていただきたい。】

- - -

ここで、山岡洋一氏が(ひとつの文章限りかもしれないが)「翻訳のパラダイム」と呼んだ問題[わたしが読書ノートの補足として書いた別記事参照]に行きあたる。

外国語から日本語への翻訳について、日本語としては不自然(「翻訳調」)でも、原文の情報を失わずに日本語の文法に合わせたものがよいとする考えがある。思えば漢文訓読というのはそういうものであり、近代にヨーロッパ言語についても同じ考えかたをあてはめたものだと言えるだろう。旧世代(およそ、第2次大戦前育ち)の人が書いたものにそういう意見がよく見られることを知っていたのだが、最近、自分と同年輩の人が大学教育での言語能力訓練としてはそういう欧文和訳が重要だと主張しているのを見てちょっと驚いた。その人が想定している学問分野は人文系であり、わたしは理科系だから違うということはできるのだが。

わたしは漢文訓読は嫌いだった。漢文音読主義とも言える主張に共鳴した(ここでは声を出して読むという意味ではなく音訓)。【[2019-12-30 補足] むしろ「漢文直読主義」と言ったほうがよさそうだ。】漢文を外国語として、原文の情報の順序をくずさずに理解したいと思った。英語については、たまたま中学で「変形文法」の概念をとりいれた実験的な授業を受けたせいもあるのだが、文の基本構造と、文を変形して別の文の一部にはめこむ操作を中心に理解した。複雑な文が出てくると、単純な文に分解してそれぞれを解釈する。解釈結果を日本語でひとつの文に組み立てることは、命令されればやるけれども、されなければしないですませた。大学院では、専門の基礎にかかわる日本語の教材がまだ充実していなかった事情もあって、英語の文献を毎週読まされたけれども、セミナーではその文献に書かれたことの「意味を説明せよ」という訓練を受けた。「訳せ」ではない。内容をあまりよく理解していない場合にしかたなく直訳を示すことはあったが、それは高く評価されなかった。このようなわけで、わたしは、英語の文章が言っていることを自分が理解するためには日本語になおす必要はない。日本語になおす必要がある場合、中間段階としてまず直訳したほうがよいと思うことは多いが、自分のその能力はあまり訓練されておらず、がんばればできるのだが根気が続かない。そこを機械がやってくれるのは助かる。当然、機械の作業は人間ならばしないようなまちがいもあるが、わたしは、日本語の印刷物の校正経験も、大学教員経験もあるので、まちがいを見つけて修正することはそれほど苦にならない。こういう事情をもつわたしには機械翻訳は役にたつのだが、事情の違う人には役にたたないかもしれない。

- - -

わたしは英語から日本語への翻訳にある会社の有料ソフトウェアを使っている。前には別の会社のものを使ってみたこともあった。どちらがよいか判断できなかったが、たまたま一方に決めてときどき新しい版に更新してきた。このソフトウェアはMS Windows用で、ほかのOSには対応していないようだ。LinuxなどUnix系OSで仕事をしようとしてきたわたしにとって、翻訳は、OCR、世界地図とともにWindowsを手離せない数少ない理由だった。

なお、今使っている版はときどき凍りついて(キー入力を受けつけなくなって)強制終了させるしかなくなることがある。Windowsの管理者でないユーザーで使っているので権限が不足しているのかもしれない(許可を求める画面が出れば許可するようにしているのだが)。あるいは、ウィルス対策ソフトウェアを入れているので、翻訳ソフトウェアの動作のうち何かを危険と判断して止めてしまうのかもしれない。そのほか、ソフトウェアメーカーが予想しないソフトウェアどうしのあいしょうの問題かもしれない。ソフトウェアメーカーのウェブサイトを見ても、わたしが出会った症状に対応しそうなソフトウェア更新情報も、対策方法の案内も出ていない。わたし自身まだ報告していないのでメーカーが気づいていないということなのかもしれない。

このソフトウェアは、文章を文(センテンス)に分解してそれぞれについて文法解析して訳しているらしい。

文章のレイアウトを崩さずに対訳にする機能もあるのだが、それだと訳文の修正ができない。わたしは訳文の修正をしたいので、文章を対訳エディタにとりこむ。するとレイアウトだけでなく段落構造もくずれてしまう。あとで訳文ができあがってから原本と見比べて手作業で段落構造を復活することになる。(段落の位置を示すものをあらかじめはさんでおくという対策はありうる。ただし文への分解の作業のじゃまになるといけない。独立した文をはさんでしまえばよいことになるが、ちょっとめんどうだ。)

対訳エディタにとりこんだ内容を、まず一斉に文への分解と日本語への訳をしてみて、それから文ごとに見て修正していくことが多い。機械翻訳結果の日本語を見て、直観的に不自然だったり、原つづりが残っていたりすると、原文と見比べる。これによってOCRの失敗を訂正できることがけっこうある。(逆に、固有名詞が多いなどの理由で機械翻訳作業からはずした部分については、OCRのまちがいの検出が楽でない。)

文への分解は句読点があるので大部分はソフトウェアまかせでよいのだが、省略をあらわすピリオドがある場合や、文になっていない見出しがはさまる場合など、手作業での修正が必要な場合がある。

文法解析は、わたしが使っている会社のソフトウェアでは正しくできる可能性が高いが、文の構造の一部に長い項目の列挙が含まれている場合などはだれにとってもむずかしい。そのほかでも、ときどき大まちがいがある。「トキバエは矢を好む」([別記事]の最初の部分参照)のようなかんちがいは避けられず、人が修正できることが重要だ。この会社の安いソフトウェア(最新版は知らないが数年前のもの)では文法解析の修正が不可能で、その文については機械翻訳をあきらめるしかなかった。高いバージョンでは修正可能で、助かっている。(値段の差だけ価値はあると思うが、できればこの機能のないソフトウェアが大量に出まわらないようにしてほしいとも思う。) ただし、高いバージョンでも利用者ができることは品詞の指定と語句のグループの指定だ。わたしとしては、それに加えて文法解析そのものを「このグループが主語」というふうにやらせてもらいたい。ソフトウェアが前提とする文法上の概念を利用者に開示することになるので、企業秘密としてまもりたい知識との兼ね合いがむずかしいかもしれないが。

単語の置きかえについては、「英和辞典をひいて第1候補をはめる」ような操作を機械化してくれるだけでも、わたしにとってはありがたい。ただし、世の中一般とは違う訳語が適切な場合には、同じ文書内では一貫して同じ訳語を使ったほうがよいことが多いから、ユーザー辞書登録機能はぜひほしい。科学技術共通用語辞書は役にたつが、それ以外の専門辞書は、わたしの目的には、かえってじゃまであることがわかった。わたしが訳す文書が、辞書を作った人の想定する専門領域とずれているにちがいない。専門辞書の訳語が機械翻訳の際に自動的に参照されるのではなく、利用者による訳語変更の際に候補として表示されるのならば役にたつ。

利用者が機械翻訳を修正した際の訳語選択が、そのあと機械翻訳をさせたとき訳語選択に反映されているのかどうかは、よくわからない。できれば修正の頻度を反映させてほしい。ただし、同じ人が訳すからといって同じ専門領域の文献とは限らない。できれば利用者が文書をグループに分けてそれぞれごとに頻度管理できる機能がほしい。

わたしは原文を残して対訳の形にしているのでがまんできるのだが、固有名詞、頭文字略語、数式などが多い部分は、機械翻訳の結果はわけのわからないものになり、むしろ原文のまま変えずに訳文にはさんでもらったほうがありがたい。わたしが使っている版のソフトウェアでは、「品詞設定」で「原語のまま」を指定することは可能だが、対象をいちいち手動指定しなければならない。語の種類ごとに指定を自動化できるとよいと思う。わたしの場合、固有名詞のうち人名は原つづりのままのほうがよい。(たまたま辞書作成者が知っているものだけかたかなになるのはうまくない。) 頭文字略語は、原則はそのままで、ユーザー辞書登録したものだけ訳され、辞書登録時に参考例が示される、というのがよい。数式や数学記号も、そのように判定された場合は、無変換であるべきだ。

文章中に注の番号がはいっている場合、その位置が(個別の文のうちでの場所は手動で動かさなければならないかもしれないが、どの文についているかは)訳文でもわかるようにしたい。わたしが使っているソフトウェアでは「{1}」 のようにしておくと「{1}」のように出るが、文法解析の中で「{1}」が名詞として扱われているようだ。文法解析上は無視して記号があるという情報だけ訳文に伝えられるとありがたい。前に述べた段落マーカーなどもその扱いができればよいと思う。(たとえばHTMLのタグ <p> </p> などが無変換で出ると決まっていればわたしはそれを入れておくので、翻訳ソフトウェアに段落構造を保つ機能がほしいとは言わなくてすむ。)