2012-11-22

本の1ページあたりの情報量を英語と日本語で比較する

先日、周りから読め読め言われていたOrson Scott CardのEnder's Gameをついに読んだのだが、読んでいて途中気になったことがある。

なんか長いのだ。300ページちょいの本なのに、なんかやたらとイベントがあるし、仕事の合間に読んでいたとは言え、なんだかんだいって読了するのに5、6日かかってしまった。別に僕はそこまで読むのが速いほうではないが、日本語で300ページなら、せいぜいかかっても2、3日だし、英語を読む速度が日本語を読む速度の半分というのは、今となっては考えにくい。

気になったので、Ender's Gameの日本語版を探してみたところ、ハヤカワ文庫から出版されていた。でもってページ数を見てみると540ページとなっている。原書が320ページほどだから、540/320〜1.7倍のページ数ということになる。逆に言えば、英語版の方が、日本語版より、1ページの情報量が1.7倍多いということになる。もちろん「訳することによって情報量が増減しない」ということを仮定しているが、そこまで大逸れた仮定でもないだろう。

ということで、この現象が果たして他の作品にも当てはまるのか気になったので、少し他の本も調べてみた。

実際にデータをとったのは、村上春樹の作品だ。英語版に関しては、Random Houseのこのカタログを参考にした。和書だと複数本に分かれている作品もあり、その場合は、ページ数を足し合わせたものを、作品の総ページ数とした。その結果をまとめたのが下のグラフだ。各点が作品に対応しており、X座標が英語でのページ数、Y座標が日本語でのページ数となっている。

見事に線形に比例しており、決定係数(R2)も〜0.9とかなり高い。勿論すべて同じ出版社なので、このデータだけではなんとも言えないが、ことRandom Houseから出ている村上本に限って言えば、1ページあたりの情報量は、英語の方が日本語の2倍近くある。Random Houseの本は別にぎっしり字がつまっている印象は全くないので、これはかなり驚きだった。

今のところ、Random Houseの村上作品という偏ったデータしか取れていないのだが、筆者の経験則として「日本語の本の方が、英語の本より、1ページあたりのの情報量が少ない」というのは、まず正しいと思っている。

ということで、もしより大きい偏りの少ないデータで分析をしたことがある人がいれば、是非お話を聞いてみたい。

Creative Commons License