Twitterは560文字制限!? 同じ文字数に込められる情報量の違い|Nao Tokui’s blog
記事の中では、中国語の114文字のTweetを英語に翻訳すると430文字になったという実例が挙げられています。なんと四倍弱。果たして、そん なに差があるものなのか、日本語の場合はどれくらいの差になるのか、他の言語では… ??? Twitterユーザーの端くれとして、興味が膨らみます。
そこで実際に全く同一内容の文章を世界各国語に翻訳したらどれくらいの文字数になるのかというのを数えてみました。「同一内容」と「世界各国後に翻訳されている」といえば….. ハリーポッター?? いえ、最古のそして人類史上最大のベストセラーがありました。聖書です。ここでは簡単に創世記の第一章
1節 まだ何もない時、神様は天と地をお造りになりました。
〜 31節 神様はでき上がった世界を隅から隅まで見渡しましたが、どこから見ても非の打ちどこ ろがありません。 こうして六日目も終わりました。
に含まれる文字数を比較しました。Public Domainのデータが簡単に入手できる点も聖書のいいところです。今回はBible Gatewayのデータを使いました。
予想通り、中国語が一番文字数が少なく、日本語、韓国語(ハングル)がつづきます。大きく差をあけてロシア語、イタリア語、英語などのヨーロッパ系の言語 が続きます (英語に関してはたくさんの版が存在したので、そのうち5つの平均をとっています)。一番文字数が少ない中国語と英語などのヨーロッパの言語との間では約 4倍、日本語/韓国語とは約2.6倍の開きがあることが分かりました。上の記事の「4倍弱」という結果がここで再現されています。
この結果をそのまま受け入れるならば、中国語の140文字には英語 約560文字程度の情報量を込められるということになります。英語で560文字というと、例えばNewYork Timesのこの記事くらいですね。Twitterのいわゆる「つぶやき」という言葉に込められたイメージとはかなり違ってきます。
もし私が言語学に詳しければ、インド・ヨーロッパ語族の系統と東アジアの漢字文化圏のについて一席ぶつところなんですが… 分析はこの辺にしておきましょう。あくまで今回の結果は目安でしかありません。同じ内容とはいえ、書き方によっては文字数は当然増減するわけですし (たとえば、口語体か文語体かなど)、ここでの数字はそれほど大事ではありません。たとえば、日本とアメリカでのTwitterの使われ方を比較する際の 一つの視点としてとらえていただけるとうれしいです。
