Statistical chinoiseries
I came across some interesting statistics about the frequency of apparition of chinese and japanese characters in the chinese and japanese wikipedia.
The first 100 characters for Japanese:
の に る ン と は た い し を で て が な 年 ス れ ル 日 ト イリ か あ ア
す ら ラ う っ り こ も さ ク月 ッ ま 大 タ ド 本 シ く ジ よ ロ レ き 学
フ ん カ 国 テ 道 一 人 ム マ 中 市 駅 つ ィ め バ プ そ コ お け ウ オ 線
用 行 者 グ 県 メ え 部 ど デ ビ 地 サ や ニ 東 キ わ 名 チ ナ 合 上 作 出
The first 100 characters for Chinese:
的 年 一 中 人 是 有 在 大 之 不 日 以 国 月 和 行 為 上 为 了 國 其 生 用
学 地 法 文 公 子 出 第 家 成 斯 世 主 作 而 他 者 十 民 三 可 名 部 自 本
分 前 二 代 也 於 西 下 政 所 方 个 理 于 到 王 多 事 南 定 利 物 使 天 德
同 要 得 特 小 及 北 道 或 立 会 高 能 后 由 外 新 等 如 教 科 山 台 時 克
Not surprinsingly, in the two cases, among the most common characters, we find a lot of basic grammar particles.
Japanese is an agglutinative language. It uses a lot of particles that are juxtaposed at the end of words and have a wide range of grammatical functions : topic, subject, object, direction, feelings… Those particles are written thanks to hiragana (の に と は を で て が か も…). Thanks to those particles, the sentence’s structure is quite flexible. You can for example put the object before the subject or vice-versa.
Japanese is also an inflected language : verbs, adjectives and to a smaller extent nouns, can have a variable ending to reflect grammatical information, such as tense. That variable part is written in hiragana too and the inflective form (i.e. the word without the variable ending) is written in Kanji (chinese characters). As an example, compare 多い (ooi) and 多かった (ookatta). They share the same lexeme 多 which is a character meaning “numerous” and have a different ending い (reflecting present) and かった (reflecting past). That explains the magnitude of hiragana in the rank.
The ranks also shows the predominance of katakana used to write foreign people’s name and loan words.
At the opposite of Japanese, Chinese highly depends on syntax (word order and sentence structure) but still uses a lot of grammatical particles. It features Subject Verb Object word order and includes the use of serial verb construction. Among the most frequent characters, we find those famous particles (的 在 不 和 了 用 成 可 部 也…) as well as basic characters used by verbs and measure words.
Interestingly, the two most frequent characters (の for Japanese and 的 for Chinese) are two particles which share the same value of genitive case. As an example, “my friend” (“a friend of mine”) will be translated 我 的 朋友 in Chinese and 私 の 友達 in Japanese.
The two ranks also share a number of characters : 年 月 日 (year, mounth, day), 学 (studies), 国 (country), 地 (ground) etc