javascript is disabled, enable it otherwise the site will not work properly!

javascript est désactivé, activez-le sinon le site ne fonctionnera pas correctement !

Lingua cinese media

Il cinese medio (中古漢語^T, 中古汉语^S, Zhōnggǔ Hànyǔ^P), o anche cinese antico nell'accezione utilizzata dal linguista Bernhard Karlgren o "lingua cinese media" o "medio cinese", si riferisce alla lingua cinese parlata durante le Dinastie del Nord e del Sud e le dinastie Sui 隋朝, Tang 唐朝 e Song 宋朝 (VI-X secolo). Il termine "cinese medio", in contrapposizione al cinese antico e al cinese moderno, si usa di solito nel contesto della fonologia storica cinese, che cerca di ricostruire la pronuncia del cinese utilizzato in quei tempi. Siccome le dinastie Tang e Song corrispondono a quello che alcuni storici chiamano "Rinascimento cinese" (il termine è preso in prestito dalla storiografia europea), la lingua si può anche pensare come "cinese rinascimentale". La traduzione "cinese medioevale" o "cinese medievale" deriva dal nome in cinese, che contiene la sillaba 中 zhōng ("centro/mezzo") e dal fatto che è la varietà intermedia tra il un generico cinese antico e un altrettanto generico cinese moderno (in realtà, l'evoluzione del cinese si può suddividere in molti più periodi e varietà. In più, il nome rischia di fuorviare siccome il periodo Tang e Song sono considerati il Rinascimento cinese, quindi l'esatto opposto di un medioevo se pensato come epoca oscura. Il Medioevo cinese si può considerare il periodo a seguito della caduta della dinastia Han).

Il medio cinese si divide in un periodo iniziale, generalmente chiamato "primo cinese medio", e un periodo successivo, il "tardo cinese medio". Il punto di transizione fra il primo e il tardo medio cinese è collocato nel passaggio dalla dinastia Tang alla dinastia Song ed è indicato da sviluppi fonologici. Ad esempio, nel libro di rima Qieyun 切韵, sono mostrati i caratteri delle iniziali bilabiali [p pʰ b m], ma non vi sono iniziali labiodentali come /f/ e /v/, che si possono trovare nel Jiyun. Questo indica che nei quattro secoli dopo la comparsa del Qieyun nella pronuncia del cinese avvenne un cambiamento di suoni.

La ricostruzione del medio cinese da parte di diversi linguisti moderni varia leggermente, ma le differenze sono di poco conto e non danno adito a grandi controversie, indicando che la fonologia di questa lingua è ormai alquanto ben compresa e accettata. Il cinese medio non si scrive utilizzando caratteri di tipo alfabetico, pertanto i suoni non possono essere derivati direttamente dalla scrittura, ma devono essere dedotti da una pluralità di fonti.

Lingue moderne. Proprio come il proto-indo-europeo può essere ricostruito dalle moderne lingue indo-europee, così il cinese medio può essere ricostruito (approssimativamente) dalle moderne lingue sinitiche (ad es. il beifanghua/cinese mandarino 北方话, il Wu 吴语, il Min 闽南语 o il cantonese 广东话, detto anche "Yue" 粤语).
La pronuncia di caratteri cinesi preservata in vocaboli cinesi prestati, che sopravvive in lingue non cinesi come il giapponese, il coreano ed il vietnamita, le "lingue sino-xeniche". I caratteri cinesi in queste lingue sono detti "kanji, hanja e han tu'".
La poesia cinese classica del periodo del cinese medio (poesia Tang e Song), costruita su un impianto solido di rime e rimandi tonali.
Le traslitterazioni di parole straniere in caratteri cinesi. Ad esempio, il vocabolo sanscrito facente parte del lessico buddhista "Dravida" fu tradotto dagli scribi religiosi nella serie di caratteri 達羅毗荼, che ora in putonghua (普通话) (mandarino) si leggono come /ta35 luo35 phi35 thu35/ (pinyin: Dáluópítú). Ciò suggerisce che il mandarino /uo/ (pinyin -uo) sia il riflesso moderno di un antico suono simile ad /a/, e che il tono /35/ sia a sua volta un riflesso di antiche consonanti articolate. Entrambe queste ipotesi possono in effetti essere confermate attraverso il confronto tra i moderni dialetti cinesi.
Libri di rima (o dizionari di rima). Gli antichi filologi cinesi del periodo Qing dedicarono moltissimi sforzi a riassumere il sistema poetico cinese attraverso i rimari. Vi fu una profusione di opere di poesia cinese durante l'era Tang (唐诗) continuata poi durante il periodo Song (宋诗), con una rigida struttura del verso che si basava sulla rima e sul tono dei caratteri finali nei versi poetici. Il cinese medio incorporato nei libri di rima era un aiuto fondamentale per gli autori nella composizione poetica. Il dizionario di rima Qieyun 切韵 del 601 d.C. è la più antica registrazione fissa della fonologia della pronuncia cinese, sebbene senza l'aiuto di lettere fonetiche, ma di voci che sono indicizzate in base a una rigorosa gerarchia di tono, rima e attacco. Fino alla fortuita scoperta di una versione della Dinastia Tang nelle caverne di Dunhuang (敦煌), si conoscevano solo frammenti o copie incomplete (la prima grande spedizione nelle grotte di Mogao a Dunhuang risale al 1910 e in essa vennero reperiti molti testi sacri buddisti). I successivi dizionari di rima ampliati, come il Guangyun 广韵 (1008) e il Jiyun 集韵 (1037) della Dinastia Song dell'XI secolo, sopravvivono ai giorni nostri. Si tratta essenzialmente di versioni estese del Qieyun, e fino alla scoperta di Dunhuang, il Guangyun fu la base da cui venne ricostruito il cinese medio.

Questo paragrafo serve per capire molto in generale come erano pronunciate le consonanti moderne nel periodo del primo cinese medio, nato prima della dinastia Sui. Serve anche a presentare la fonetica in generale. Come punto di partenza nella tabella, sono stati presi i suoni moderni, indicati con il pinyin. Questa ricostruzione è utile, tra i vari motivi, anche per cercare di capire la pronuncia dei sinogrammi nelle altre lingue, siccome sono stati importati in tempi arcaici. Dopo la spiegazione, una tabella ricapitola tutta la trascrizione Baxter del Primo Cinese Medio (2011), che si distingue da tutte le altre per la sua semplicità, e vi si affianca il suono in alfabeto fonetico internazionale IPA, dopodiché si elencano tutti i cluster vocalici.

Quando i sinogrammi furono importati in Corea e Giappone, il cinese antico stava per volgere al termine. Siccome la pronuncia del cinese antico e cinese medio non è direttamente attestata e il pinyin è stato inventato nella seconda metà del Novecento, è stata ricostruita col metodo comparativo applicato alle tavole di rime e ai prestiti cinesi in altre lingue: poiché i prestiti talvolta ritengono una pronuncia arcaica, si possono usare per ricostruire sia il cinese antico che il cinese medio. Altri vocaboli sono in comune con una determinata varietà di cinese perché la lingua in questione appartiene alla stessa famiglia di quella del cinese (infatti il cinese appartiene al ceppo sino-tibetano, a cui appartengono oltre 500 lingue; di alcune di queste, sono state ricostruite le varietà antiche). La ricostruzione del cinese antico, che viene talvolta citata, e la trascrizione usata sono quelle dei linguisti William Baxter e Laurent Sagart, che hanno ricostruito la loro versione del cinese antico e l'hanno presentata in Old Chinese: a New Reconstruction (2014). La fonte della ricostruzione del primo cinese medio (Baxter, 2011) è il Guangyun (广韵). Si dà una breve presentazione dei principali rimari usati per ricostruire il primo cinese medio:

Il Qieyun è stato ritrovato da Aurel Stein in forma frammentaria nelle grotte di Mogao a Dunhuang in una spedizione del 1906-1908. Una copia quasi completa è stata scoperta da due studiosi nel mercato dell'antico distretto di Liulichang 琉璃厂 (Pechino) nel 1947. Di quest'ultima copia sono stati pubblicati pochi anni dopo due studi di Dong Tonghe 董同龢 (1948, 1952) e uno studio di Li Rong 李荣 (1956). La copia faceva parte della Biblioteca Imperiale e, dopo la fine dello stato fantoccio di Manciukuò e la cattura di Puyi, era stata venduta. L'autore del Qieyun è Lu Fayan (陸法言, fl. 581-601), che ha intrapreso la stesura dell'opera vent'anni dopo una discussione tra amici sulla corretta pronuncia dei classici cinesi. L'opera è stata pubblicata nel 601, durante la dinastia Sui, e ha conosciuto un enorme successo. La specifica varietà del Qieyun, da cui deriva il Guangyun, è indicata nella prefazione di Lu Fayan come un compromesso tra le varietà di cinese del nord e del sud con una maggiore propensione verso quella del sud, dunque è una varietà artificiale; è poi specifica per la lettura e composizione di poesie con una precisa struttura, che include rime e toni. Questa interpretazione cozza con la prima ipotesi di Karlgren, che in passato aveva ipotizzato che fosse la pronuncia della capitale del tempo, Chang'an (questa teoria è oggi superata). Chiaramente, un dizionario del 601 conterrà e attesterà sinogrammi inventati fino a quella data. Per esempio, manca il carattere 呢, assente pure nello Shuowen Jiezi 说文解字 (100 d.C. circa) di Xu Shen 许慎 (dinastia Han 汉朝 206 a.C.-220 d.C., molto anteriore) ma attestato nel Dizionario Kangxi 康熙字典 (dinastia Qing 清朝, 1644-1912, l'ultima) compilato a partire dal 1710 e pubblicato nel 1716. Siccome i caratteri sono organizzati in base alla rima, non si utilizza un sistema di radicali (ossia i radicali Shuowen, antenati dei radicali Kangxi)

La prima grande revisione del Qieyun è stata effettuata e pubblicata nel 706 da Wang Renxu (王仁煦, fl. 706) e si chiama Kanmiu Buque Qieyun (刊謬補缺切韻). Una copia completa è stata scovata nel Museo del Palazzo Imperiale a Pechino nel 1947. È stata dunque ristampata da Long Yuchun 龍宇純 (1968) e Zhou Zumou 周祖謨 (1983). Quest'ultima edizione include il facsimile dell'opera, che appare rovinato. Esistono tre versioni della revisione di Wang Renxu: la prima si chiama 王一 e consiste in un frammento ritrovato nelle grotte di Dunhuang. La seconda, 王二, si chiama anche Xiàngbáběn 项跋本, perché comprende una postfazione di Xiàng Yuánbiàn 项元汴, oppure viene anche chiamata Péiwùqí Zhèngzìběn 裴务齐正字本. La terza versione, 王三, si chiama anche Quánwáng 全王 e Gùgōngběn 故宫本 e Sòngbáběn 宋跋本 perché è completa, è stata ritrovata nel Palazzo Imperiale e ha una postfazione di Sòng Lián 宋濂.

Il Tangyun era la prima revisione del Qieyun, effettuata da Sun Mian (孫愐, fl. 751) e pubblicata nel 751. Purtroppo è andato perduto. In totale, dalle poche informazioni indirette, era composto da 5 libri detti "rotoli" (卷 juan3).
Nel 780 circa, è stato pubblicato lo Yunhai Jingyuan 韻海鏡源 di Yan Zhenqing 颜真卿 (709–785), composto da 360 volumi e dalle dimensioni enormi. Anche questo rimario, come il Tangyun, è andato perduto.

Quanto al Guangyun, i due principali redattori sono Chen Pengnian (陳彭年, 961–1017) e Qiu Yong (邱雍, fl. 1007-1008), mentre il patrocinatore è stato l'Imperatore Zhenzong della Dinastia Song (r. 997-1022). Si tratta di un'altra revisione, correzione e espansione del Qieyun, effettuata tra il 1007 e il 1008 e pubblicata nel 1008. In totale è composto da 5 libri (卷 juan3) e la pronuncia dei caratteri è indicata in fanqie (carattere per indicare l'iniziale di sillaba + carattere per indicare la rima + la sillaba 切 qie4 o, nel Qieyun, la sillaba 反 fan3). Siccome il libro rispecchia le antiche abitudini tipografiche cinesi, è scritto in verticale e si legge da destra a sinistra (e dunque al contrario, come se fosse arabo o ebraico).
Molte altre riedizioni del Qieyun, sia famose che meno note, sono andate perdute.

Si dà qui una rapida introduzione ai suoni del primo cinese medio.

C'era distinzione tra *b, p, ph sorda aspirata. La prima della tripletta è sonora perché, se si mette il palmo della mano intorno alla gola, si sentono le vibrazioni delle corde vocali durante la pronuncia. Si provi a pronunciare in questo modo "vvvvv" e "fffff". Nel suono aspirato, si aggiunge uno sbuffo d'aria alla consonante. Distinzioni di questo tipo (sonora-sorda-sorda aspirata), nelle lingue sinitiche, restano in dialetti come lo shanghainese (famiglia Wu). Nel tardo cinese medio, si erano formate altre consonanti ancora, come ad esempio "bh" */bʱ/ sonora aspirata, mentre la distinzione in forma di tripletta (già presente nel cinese arcaico) era sparita con la scomparsa della consonante sonora dalla tripletta.
- La seconda distinzione era presente tra *d, t, th sorda aspirata.
- La terza distinzione era presente tra *g, k, kh sorda aspirata
- La quarta distinzione era presente tra *dz, ts, tsh sorda aspirata.

I suoni retroflessi (e cioè prodotti con la punta della lingua piegata indietro, nell'incavo del palato) vengono trascritti con una -“r” che non ha valore fonetico e, qualora ci sia aspirazione, la -“h” si scrive dopo la “r”. Nel contesto dei suoni retroflessi, c'è *dzr (come ZH in pinyin ma sonoro), tsr e tsrh sorda aspirata.

La seconda tripletta di suoni retroflessi è basilarmente costituita da una retroflessione di d e t, da cui si ottiene *dr, tr, trh sorda aspirata.

Un altro nuovo suono retroflesso, oggi sparito, è la "n" retroflessa, scritta come *“nr”. Suoni simili sono ancora presenti in lingue come il sanscrito, l’hindi e il nepali, pure se non sono di ceppo sinitico. In più, la "n" retroflessa anche presente nella pronuncia arcaica di parole in thailandese e bengali.

Sono presenti le palatali, rese riconoscibili con una “y” senza valore fonetico e che si comporta come la “r”. In cinese medio esiste la tripletta dzy, tsy, tsyh sorda aspirata. Nel pronunciare queste tre consonanti, la lingua è già in posizione di "gn" di gnomo.

Esiste anche la versione palatale di N, che è *“ny” ("gn" di gnomo), da cui è nata la sillaba ER e la R- in pinyin.

La R- del pinyin esisteva già come suono in dei contesti ed è trascritto *zr e la sua controparte sorda è *sr.

Esisteva poi una versione sonora dei moderni S (*s) e X (*sy), trascritta come *z e *zy.

L'aspirazione H (/x/, /h/), trascritta “x” aveva la controparte in cui vibrano le corde vocali “h” (*/ɣ/, / ɦ/).

Non esisteva il suono F /f/, comparso nel tardo cinese medio e derivato forse dal suono affricato */pf/ e */pfʰ/, a sua volta derivato da un suono bilabiale (vedi avanti).
Il cinese medio ha perso la consonante vibrante sonora */r/, che se intervocalica o prevocalica si riduce nella monovibrante /ɾ/ . Il cinese medio ha anche perso il suono */l̥/ , che si pronuncia come una L ma senza vibrazione delle corde vocali, tali per cui esce solo aria. Un simile suono esiste nel cluster "tl" /tl̥/ in islandese. Di contro, nel cinese medio sono nate le consonanti retroflesse, nate dai cluster del cinese arcaico che spesso avevano la consonante "-l-" (o, secondo Baxter, "-r-") al secondo membro. Un simile processo si ha anche in vietnamita.
Laddove in cinese arcaico c'era una sillaba che terminava in *-r, in cinese medio si è trasformata in *-j oppure è sparita.
Esisteva uno colpo di glottide, una consonante laringale/glottidale che equivale ad un colpetto di tosse che si accompagna all'attacco di una vocale. Quest’ultimo si trascrive come un apostrofo di fronte alla vocale. Nel tardo cinese medio era ancora presente, mentre nel cinese arcaico poteva trovarsi anche a fine sillaba. Una volta sparito, nel cinese medio (non quello contemporaneo) aveva creato il tono crescente in gran parte dei casi.
Esistevano già i toni (Baxter registra il tono piatto/level 平 píng senza segni, crescente 上 shàng con una X maiuscola a fine sillaba e discendente/departing 去 qù con una H maiuscola a fine sillaba, tre in totale). Tutte le sillabe che terminavano in stop senza rilascio di suono (vedi avanti), atonali, venivano poi indicate come tono entrante (入, rù) e quindi si preferiva considerarle separate da tutte le altre. Il tono crescente del cinese medio si è formato dalla caduta del colpo di glottide a fine sillaba nel cinese arcaico, mentre il tono decrescente nel cinese medio deriverebbe in gran parte dei casi dalla caduta di una "-s" in un cluster consonantico a fine sillaba nel cinese arcaico. Tutte le sillabe che non avevano né il tono crescente, né il tono discendente (e quindi non avevano stacchi glottali o "-s" in fondo ma tutt'altro), né uno stop senza rilascio di suono (vedi avanti) avevano assunto il tono acuto. Non esisteva il terzo tono del cinese contemporaneo.
A fine sillaba si poteva avere, come suoni sonori, una –*n o una –*ng ma anche una –*m.
Esistevano pure tre consonanti occlusive senza rilascio di suono, oggi ancora presenti in lingue come il cantonese (famiglia Yue), il coreano e il vietnamita. Sono la –*p (la vocale si interrompe serrando le labbra ma senza una “p” di rilascio), la –*t (interruzione in zona dentale) e la –*k (interruzione in zona velare).
In conclusione, a inizio sillaba poteva esserci il suono *“ng-” nasale. Oggi è sparito nel cinese mandarino, ma ancora presente in lingue regionali come il cantonese.
Riguardo invece al quadro vocalico, presenta anch'esso delle differenze, ma la più plateale consiste nell’evoluzione della vocale alta centrale (quella presente in ZHI, CHI, SHI, RI), della vocale alta posteriore non arrotondata (quella presente in ZHE, CHE, SHE, RE) e della sillaba "ER".
Riguardo alla trascrizione di tre particolari vocali, il cluster "ae" */æ/ è una /e/ molto aperta, "ea" */ɛ/ è leggermente meno aperta e il simbolo "+" sta a indicare la vocale alta centrale */ɨ/.
Se la ricostruzione di Baxter-Sagart dell'antico cinese (2014) è corretta, il cinese arcaico aveva per ogni consonante (sorde, sonore, aspirate...) la sua versione faringalizzata, poi persa. La faringalizzazione è presente in lingue semitiche come l'ebraico antico e l'arabo ed era anche presente nel persiano antico. Consiste nel pronunciare una consonante con la radice della lingua contemporaneamente posizionata vicino alla parete della faringe/cavo orale. I due studiosi hanno anche aggiunto i suoni /q/ (K di koala pronunciata con la radice della lingua e non col dorso; esiste anche la sua versione aspirata) e /ɢ/ (lo stesso identico suono ma reso sonoro, non più sordo), che si sarebbero persi nel cinese medio. Molte altre consonanti poi sparite in cinese medio sono state proposte per il cinese arcaico da altri studiosi, per esempio la /ð/ interdentale sonora e /θ/ interdentale sorda nella ricostruzione di Pulleyblank, ma il cinese arcaico ha in generale svariati punti controversi e oggetto di dibattito.
Riguardo ai soli segnetti più importanti della ricostruzione Baxter-Sagart, i suoni messi tra parentesi quadra [...] indicano che non si è certi del suono ricostruito e, in alternativa, il suono corretto doveva essere simile a quello ricostruito. I suoni messi tra parentesi tonda (...) indicano il dubbio sulla presenza effettiva o no di quel suono. La "h" messa come apice indica l'aspirazione, la "w" in posizione apicale indica un arrotondamento delle labbra e ʕ i posizione apicale (è una forma simile a un falcetto) indica la faringalizzazione di tutto il composto. Si ricorda che l̥ è una L di leva pronunciata sorda (esce solo aria dai lati della lingua) e r̥ è una R di arare pronunciata sorda.
Ora che la ricostruzione Baxter-Sagart è stata introdotta, si può precisare (anche per dare un'idea dei cluster nel cinese arcaico) che la retroflessione aspirata CH- (sia odierna sia del cinese medio, in cui le retroflesse compaiono per la prima volta) deriva da cluster come *tsʰr, *[d]r, *tʰr, *lr ,*s.r̥ ,*qʰ<r> , *t.l̥ , *n̥r , *t.qʰ, *s-l̥ˤ<r> e *tr. Ci sono, come spesso accade, delle eccezioni, per esempio laddove il cluster si origina da *r̥ e *tʰ. Tutti questi cluster sono spariti nel cinese medio. Alcuni di questi suoni sono spariti dall'inventario consonantico del primo cinese medio.
Il suono retroflesso sordo SH- deriva da cluster come *s.t, *sr o da rielaborazioni di consonanti insolate come *l̥ e*[d] .
Il suono retroflesso ZH- deriva da cluster come *[t.q], *tr, *[dz]ˤr e dalla consonante isolata *t.
Come già accennato, il suono retroflesso sonoro R- in cinese medio era una gn di "gnomo", cioè un suono nasale palatale, * /ɲ/-, che è una mutazione del cinese arcaico */n/-. Lo stesso suono si trovava nella versione del primo cinese medio di ER; anch'esso deriva da una */n/- nell'antico cinese, quasi sempre seguita dalla vocale neutra schwa /ə/.
Nel cinese arcaico era possibile trovare cluster anche in sillabe poi divenute non retroflesse: semplicemente, uno o tutti i membri del cluster si sono persi, come in 厄 e4 (primo cinese medio ‘eak, cinese arcaico *qˤ<r>[i]k) oppure 惯 guan4 (primo cinese medio kwaenH, cinese antico kˤro[n]-s).
Le sillabe che oggi iniziano in pinyin con W- in cinese medio talvolta erano introdotte da un’aspirazione sonora *h-, da una *m- o da *ng-.
Anche la sillaba YI /i/ era talvolta preceduta da *ng- /ŋ/. Ciò accade ancora più sporadicamente pure nei casi in cui ci sono altre sillabe introdotte dalla semivocale /j/.
La sillaba WU /u/ era *mju, *ngu ed era invece *'u (con colpo di glottide) nelle sillabe che oggi hanno il primo tono.
Non esisteva la schwa/vocale neutra */ə/, che invece esisteva in cinese arcaico e nel cinese contemporaneo (Baxter invece la interpreta come una */ɨ/). In cinese arcaico inoltre esisteva solo la */e/ chiusa, senza controparti più aperte.
La sillaba "AI" diventa spesso */ʔoj/ (anche il nucleo della sillaba "DAI" si pronunciava così), mentre "AO" è */ŋaw/ (anche se nucleo di sillaba, eccetto QIAO che diventa /jew/) e più sporadicamente /ʔaw/. La sillaba "YAN" /jɛn/, che curiosamente in pinyin non rispecchia a fondo la pronuncia, ha una pronuncia simile (perlopiù */jen; jem/ anche con la vocale più aperta)
La finale -NG non ha subito mutazioni, mentre laddove oggi c'è -N nel cinese medio degli albori ci poteva essere *-n oppure *-m (la seconda oggi è sparita nel cinese standard). Addirittura, le sillabe "CAN" finiva quasi sempre in -m. Le sillabe CHUN, CUN, DUAN, DUN, FEN, GUAN, HUN, JUAN, JUN, KUN, LUAN, LUN MAN, MEN, MIAN, MIN, PAN, PIAN, QUAN, QUN, RUAN, SHUN, SUAN, SUN, TUAN, TUN, WAN, WEN, XUAN, YUAN, YUN, ZHUAN, ZHUN, ZUAN, ZUN e pressoché in ogni caso TIAN e XUN hanno sempre conservato come coda la "-n". Le altre sillabe invece sono variabili. La seconda delle tue tabelle sottostanti indica una lista delle sillabe più diffuse che oggi terminano in -n ma che avevano *-m nel primo cinese medio. Questo suono tende a essere ritenuto in coreano, vietnamita e cantonese.
Il terzo tono attuale deriva in gran parte dei casi dal tono crescente del cinese medio, a sua volta derivato dalla caduta del colpo di glottide a fine sillaba. Un fenomeno simile è avvenuto anche in vietnamita, come dimostrato nella metà Novecento da Haudricourt.
Il secondo tono attuale deriva spesso da presenza di uno stop consonantico (-t, -p, -k, presenti comunque anche altrove) del cinese medio (a meno che non ci sia una coda nasale -ng o -n/-m, che invece si sono conservate oggi in -ng e -n) e dalla caduta degli stop finali è nato il tono crescente, presente per; anche in quelle con finale nasale. Siccome era breve di durata, si usava per trascrivere le parole con vocali brevi dal sanscrito.
Il primo tono dal cinese medio a oggi resta perlopiù invariato. Oggi la resa del primo tono varia in altezza da dialetto a dialetto: nello standard attuale di Pechino, su cui tutti i toni si modellano, ha un'altezza acuta, mentre per esempio nel dialetto Wu di Shanghai (shanghaiano) e Wenzhou (wenzhounese) è meno acuto, mentre nel dialetto Xiang di Changsha l'intonazione è nel registro medio. Semplicemente, se in Cina si vuole parlare il cinese comune per capirsi (molti dialetti di stessa famiglia sono non intelligibili tra loro), si parla il cinese standard, il putonghua, che ha le sue precise regole di intonazione.
Un discorso analogo si può fare con gli altri toni, che ovviamente hanno molte varietà dialettali oltre allo standard. Per esempio, il terzo tono in putonghua parte nel registro grave, cala e risale (di colpo o in modo lento e scandito) al registro alto. Nel dialetto Gan di Nanchang, scende e risale fermandosi nel registro medio. Il secondo tono attuale dal registro medio sale a quello acuto, mentre nel dialetto di Nanjing parte dal registro grave e risale al registro medio. In altri dialetti ancora c'è una convergenza di toni: nel dialetto Jin di Taiyuan ad esempio il primo e il secondo tono attuali convergono in una specie di primo tono nel registro grave. Per finire, il quarto tono attuale dal registro acuto scende in picchiata nel registro grave, ma nel dialetto Xiang di Changsha parte dal registro medio e scende in picchiata nel registro grave. Quando si parla dei quattro toni "acuto, crescente, calante-crescente e decrescente" ci si riferisce al putonghua, che si affianca a numerosi dialetti. In altri dialetti ci possono essere più di quattro toni: ad esempio, nel dialetto Pinghua di Nanning, dal punto di vista fonetico ce ne sono sei. Infine, nel dialetto di Yinchuan ce ne sono soltanto tre.
Anche il quarto tono attuale in parecchi casi resta perlopiù invariato dal tono decrescente del cinese medio, nato dalla caduta di -*S nei cluster a fine sillaba del cinese arcaico. Un simile fenomeno avviene anche in vietnamita, come dimostrò nuovamente Haudricourt. Comunque in cinese c'erano e ci sono anche sillabe col quarto tono che terminano con suoni nasali.
In tutte quante le regole dette finora, come più volte ribadito, valgono in parecchi casi ma si possono trovare delle eccezioni.
L'Old Chinese, nella ricostruzione Baxter-Sagart, aveva a fine sillaba la seguenti combinazioni: *-s, -t, -[t]s, -k, -ks, -p, -[p]s, -ʔ (stacco glottale), -ʔs (da questa combinazione, ovunque si trovi, derivano degli odierni quarti toni discendenti), -n, -ns, -nʔ, -[n]ʔs, -m, -mʔ, -mʔs, -ms, -ng, -ngʔ, -ngs, -ngʔs, -r (divenuta *-n nel primo cinese medio), -[r]ʔ, -rs.
Nel Middle Chinese, di contro si trovano soltanto *-n, *-m (converge in -n nel cinese moderno standard), *-ng *-p, *-t, *-k (i tre stop senza rilascio di suono sono tutti caduti in cinese mandarino).
Successivamente al tardo cinese medio, è venuto il primo mandarino o mandarino antico (早期官话 Zǎoqí Guānhuà o 古官话 Gǔ Guānhuà), databile dal periodo che va dalla nascita della Dinastia Jin (晋朝, nata nel 1115) al dominio della Dinastia Yuan (元朝), che corrisponde al khanato mongolo (1279-1368), che fu poi deposto dalla dinastia Ming (明朝, 1368-1644). Durante il primo mandarino (khanato mongolo), tutti gli stop consonantici senza rilascio di suono si sono leniti in uno stacco glottale/colpo di glottide fino a cadere. La loro caduta ha portato alla riorganizzazione del sistema tonale, siccome il tono entrante è scomparso. Contemporaneamente, sono quasi sicuramente scomparsi i suoni fricativi sonori z- e zy-. Dopodiché, era nato il suono */f/-, tuttora presente in cinese, i cluster vocalici si sono semplificati parecchio, *ny- si è trasformato nel suono retroflesso simile alla moderna R- e le retroflesse *dr, *tr, *trh e *zr sono sparite. Infine, la differenza sonora-sorda-sorda aspirata è sparita, riducendosi a non aspirata-sorda aspirata, come nel cinese contemporaneo. Lo stesso fenomeno ha interessato pure l'aspirazione *h e *x. Le differenziazioni restano solo in shangainese, mentre gli stop consonantici senza rilascio di suono sono presenti solo in cantonese e in alcune sillabe di dialetto taiwanese, come 学 xue2, che si proununcia in modo simile a "hok". Nel Primo Mandarino, era ancora presente *ng- a inizio sillaba. Riguardo alle vocali, era nata la vocale neutra schwa, tuttora presente, e la distinzione tra *ju e *jo si è persa, convergendo in *ju e successivamente nel moderno YU, cioè /y/. Era ancora presente la *-m a fine sillaba, ma parte di esse si erano assimilate in *-n. Le rimanenti si sono tutte assimilate in *-n tra il tardo periodo Ming e il primo periodo Qing (清朝), l'ultima dinastia imperiale cinese. Nei dizionari di rime di questo periodo (khanato mongolo, Primo Mandarino), i caratteri avevano la pronuncia indicata con l'alfabeto 'Phags-pa, inventato dal monaco tibetano Drogön Chögyal Phagpa per Kublai Khan. Il cinese parlato tra il periodo Ming (fine del khanato mongolo) e il primo periodo Qing (che deposero i Ming nel 1644) è detto "mandarino Medio" (Middle Mandarin). Durante il Mandarino Medio, in Corea il re Sejong il Grande ha inventato l'alfabeto hangeul (1443). La fase finale non ha un nome preciso, ma si può chiamare "mandarino tardoimperiale" ("lingua franca tardo imperiale") e dura fino a tutta la dinastia Qing (l'ultimo imperatore, Puyi, abdica nel 1912, dopo la Rivolta di Wuhan dell'anno precedente). Nell'Ottocento, il dialetto più prestigioso era diventato quello di Pechino, che aveva sorpassato quello di Nanchino (periodo Ming). Dopo l'inizio Ottocento, è caduta la differenziazione tra /t͡s/ e la palatale /d͡ʑ/, siccome è avvenuta una convergenza verso la seconda. Questa differenza è rimasta però cristallizzata nel toponimo "Tientsin" (Tianjin 天津) e nel nome dell'università di "Tsinghua" (清华大学).
Se si usa il cinese medio o arcaico per cercare le corrispondenze di suono nei sinogrammi usati in altre lingue, bisogna sempre tenere conto anche dell'evoluzione di queste lingue: la pronuncia odierna potrebbe essere diversa da quella di un periodo anteriore, oppure conoscere la pronuncia arcaica nella lingua di approdo aiuta nel fare analisi e collegamenti. Sotto la tabella, sono presenti delle introduzioni sommarie al giapponese, coreano e vietnamita antichi.

X indica il tono ascendente (shang4 上 del Cinese Medio, che nel cinese contemporaneo standard è analogo al cosiddetto secondo tono) e H indica il tono discendente (qu4 去, che oggi è analogo al quarto tono), che parte da un'intonazione acuta ("HIGH").

Le sillabe senza stop hanno il tono entrante (ru4 入); in altre parole, è il modo di dire che vocale è sfuggita per lo stop consonantico senza rilascio di suono.

Tutte le altre hanno il tono piatto (ping2 平), che nel Putonghua è equivalente al primo tono. Questi toni sono poi ulteriormente evoluti dal Primo Cinese Medio.

Qui sono presentati i cluster vocalici (cluster fonetici, non ortografici) del primo cinese medio secondo la ricostruzione Baxter-Sagart, senza iniziali e finali di alcun tipo:

Oj, ow.

Aej /æi/, aew.

Aw, aj.

Ja, je, jej, jew, jo, joj, jow, ju, juw, jae, j+ (sempre seguito da consonante) /jɨ/, j+j, jie, jiej, jij, jiw, jiew, jwe, jwej, jw+j, jwi, jwie, jwo, jwoj, jwa.

Wo, woj, wi, we, wi, wij, wa, waj, wae, wea /wɛ/, waej, weaj, wej.

Ej, ew.

La tabella indica a grandi linee la conversione delle consonanti dal pinyin a inizio sillaba al suono ricostruito, in trascrizione Baxter e basandosi sul Qieyun. Viene pure indicata l'origine del suono moderno Yu e suoi derivati e della -E senza code nasali, entrambi in isolamento. Infine, viene anche trattata la vocale alta centrale. Queste tre vocali sono assenti in italiano e le prime due non appartengono al cinese medio degli albori, quindi creano curiosità riguardo alla loro origine insieme anche alla sillaba "ER", pure presente. Molti altri suoni vocalici sono stati spiegati in precedenza. Nelle due colonne in mezzo viene fornita la trascrizione scientifica in alfabeto fonetico internazionale (IPA) e, nell'ultima, una spiegazione dei suoni prima in putonghua e poi in Early Middle Chinese.

Un lavoro estremamente più approfondito deve comunque procedere oltre la sintesi qui operata, che è soltanto un buon punto di partenza, e può fare uso delle tavole di sinogrammi con la pronuncia ricostruita per una consultazione più a fondo o per la ricerca della pronuncia di una singola sillaba. Si ricorda che la pronuncia è ricostruita, quindi accanto a ogni slash in IPA e a ogni suono trascritto andrebbe un asterisco per indicare questa caratteristica.

Un lavoro ancora più approfondito va anche a comprendere la resa delle vocali dei vari nuclei di sillaba, per esempio l'odierno -AI /ai/ in tutte le sue sillabe (ex. LAI, MAI, NAI, GAI, KAI, HAI, ZHAI, CHAI, SHAI, ZAI, CAI, SAI, BAI, PAI, DAI, TAI) e anche in isolamento, caso in cui, per esempio, si pronuncia spesso *'oj laddove c'è il primo tono odierno e *'ea col colpo di glottide oppure *ngoj.

Riordinando la tabella in base al Primo Cinese Medio, si possono individuare *ng- e *'- (colpo di glottide/stacco glottale) insieme alle retroflesse *nr-, *dr-, *tr- e *trh e l'aspirazione sonora *h-.

In base alla quarta colonna, riordinabile in base a un pulsante apposito, si possono isolare le sillabe che in primo medio cinese hanno *mj- > *v-, quelle che nel passaggio dal cinese mandarino basato sulla varietà fonetica di Nanchino a quello basato sulla varietà di Pechino hanno subito una palatalizzazione della consonante velare (e che, in un secondo momento, hanno subito la palatalizzazione di alcuni suoni alveolari).

Sono poi isolabili le sillabe che terminavano in *-m, *-p, *-t e *-k. Dopodiché, sono evidenziate quelle che anche oggi in Putonghua terminano con la coda nasale velare, la vocale non arrotondata /ɤ/, il dittongo "ai" che deriva da *oj e le sillabe che hanno oggi la vocale alta centrale, di cui si può vedere l'origine.

Infine, sono evidenziate quelle che avevano le vocali *ae e *ea, adattate nelle altre lingue. Sempre in base alla pulsantiera, si possono individuare i radicali Kangxi (R.K.) in base alla lista tradizionale di 214 caratteri, resa famosa dal dizionario Kangxi.

Per gli hanzi, sono stati usati i caratteri semplificati per renderli riconoscibili in putonghua, con alcune varianti arcaicheggianti.

Gli hanzi sono ordinati in base al pinyin, eccetto per un'espansione in fondo alla tabella. Tutti i caratteri sono tuttavia (ri)ordinabili con il pulsante nella casella "hanzi"

In cantonese sono messe solo le pronunce di caratteri che finiscono con uno stop senza rilascio udibile di suono, in *-m e che iniziavano in *ng- o *mj- oggi caduti, in *ny- e per consonante non palatalizzata in Primo Cinese Medio o che oggi hanno la vocale che in pinyin si trascrive -e (e.g. ge, ke, de...). A questi sono aggiunti quelli che in primo medio cinese avevano il dittongo *oj per mostrare come spesso le sillabe in parte *oj in cantonese. In alcuni casi di pronunce irregolari in cantonese, si affianca o sostituisce con il cantonese non nella versione standard (Canton/Guangzhou), ma in quella di Taishan. Se il suono è irrecuperabile in cantonese, si usano altri dialetti conservativi come il minnan, l'hokkien (una categoria particolare dei Minnan), l'hakka, il min dong e min bei (due categorie della famiglia min, che include i minnan) e pochi casi in Shanghainese (il più prestigioso dei dialetti wu dopo che sostituì quello di Suzhou) e dialetto gan. In particolare, le sillabe che iniziavan in *ny- non hanno questo suono in cantonese, in più la finale *-m dopo le sillabe che iniziano oggi con /f/ (e dunque in passato con le consonanti bilabiali con semivocale *bj-, pj-, phj-) si è assimilata in /n/ (l'unico dialetto che la preserva in questo contesto è il dialetto hakka). Ogni dialetto ha un suo sistema (o più sistemi) di romanizzazione, ma negli esempi si è optato per tenerne solo una (e.g. Il Pėh-ōe-jī /peʔ˩ ue˩ dzi˨/ per l'hokkien).

È importante capire quali sono i prestiti cinesi nelle altre lingue e come si pronunciano, partendo proprio dai sinogrammi, perché raccogliendo insieme le pronunce si possono notare affinità e differenze che permettono di fare ipotesi per ricostruire il cinese medio. Nel lavorare in questo modo, si usa il metodo comparativo. Una volta che il nucleo della sillaba viene ricostruito, si estende a tutti sinogrammi che vi fanno rima e contenuti nei rimari, come ad esempio il Guangyun, per poi fare altre comparazioni. Senza questi prestiti, a cui si affiancano i rimari, sarebbe impossibile ricostruire le varietà antiche del cinese letterario.

Contemporaneamente, chi studia i sinogrammi prestati nelle altre lingue, in svariati casi può rimanere perplesso nel vedere come ci siano delle vistose differenze con la pronuncia cinese attuale (putonghua), affiancate a delle sporadiche somiglianze forti. Questo sentimento deriva sia dalla non conoscenza del cinese medio e del modo attraverso il quale i prestiti sono stati adattati, una volta che il cinese medio è stato ricostruito. Facendo quindi un percorso inverso, dal punto di partenza del cinese medio si arriva a capire come mai un kanji o un hanja o un chu nom si pronuncia in un certo modo.

Per avere a disposizione degli strumenti usati per ricostruire il cinese medio e/o capire come la pronuncia varia rispetto ad esso, si offre quindi una spiegazione che illustra come i prestiti cinesi sono stati adattati. Viene anche inclusa qualche generalità sulle varietà arcaiche delle lingue, siccome i prestiti sono stati adattati in un periodo in cui non esisteva la varietà moderna. Siccome ogni lingua evolve seguendo il suo percorso, anche i prestiti evolvono parallelamente per l'influsso di trasformazioni o dialetti. Bisogna anche segnalare quali suoni mancavano in queste varietà antiche rispetto al cinese medio: spesso sono proprio i suoni assenti che hanno bisogno di essere adattati o epurati.

Capire come varia la pronuncia o come funzionavano le varietà antiche permette anche una migliore comprensione e memorizzazione della pronuncia, se viene affiancata a quella ricostruita in cinese medio e si osserva lungo la sua evoluzione. Nel caso del giapponese, parlare dell'adozione dei prestiti permette di capire anche come la suddetta lingua è stata arricchita di suoni, come ad esempio la coda nasale -/n/ assimilabile.

Le lingue selezionate (e talvolta affiancate per fare comparazioni) sono il Primo Cinese Medio (Early Middle Chinese, EMC) in ricostruzione Baxter presa dal Guangyun e notazione Baxter (sul cinese medio c'è molto consenso tra gli studiosi, in particolare sul sistema consonantico), il putonghua standard, il giapponese, il coreano e il vietnamita. Nelle ultime tre lingue, larghe fette di vocabolario derivano dal cinese, che ha avuto una grande influenza su queste lingue. In vietnamita, viene offerta la pronuncia antica dell'alfabeto importato dai missionari francesi, siccome la pronuncia aveva delle differenze. In fondo a ogni trattazione, c'è una tabellina che riassume in compendio tutte le trasformazioni dal cinese medio per una consultazione rapida.

Mentre da queste tre si può osservare il trattamento della pronuncia cinese dei sinogrammi, da altre due celebri lingue qui introdotte si può ricostruire il cinese medio e arricchire il panorama di comparazioni: si tratta del dialetto cantonese nella sua varietà standard di Hong Kong, qui trascritta con il sistema Jyutping. È un dialetto importante sia dal punto di vista culturale, sia dal punto di vista linguistico perché è piuttosto conservativo rispetto al cinese medio. Ad esempio, è uno dei pochi dialetti cinesi insieme a svariati Minnan e all'Hakka a mantenere gli stop consonantici senza rilascio di suono a fine sillaba: negli altri e nel guanhua si è lenito in uno stacco glottale a fine sillaba. Il cantonese, di famiglia Yue, deriva dal Proto-Yue, di cui esistono delle ricostruzioni.

La seconda invece è lo shanghainese. Sebbene non fornisca una grande aiuto nella ricostruzione delle code nasali a causa della sua forte confusione e riduca tutti gli stop senza rilascio udibile di suono in un colpo di glottide, è l'unico dialetto cinese a preservare una forte differenza tra consonanti sorde, sonore e sorde aspirate. Viene dunque introdotto in un ampio paragrafo.

Infine, la terza famiglia di dialetti da cui si possono pescare informazioni è il Min 闽. I Min sono un gruppo di dialetti meridionali piuttosto conservativi la cui versione primigenia, da cui discendono i vari Min, deriva insieme alle lingue Bai direttamente dall'Old Chinese. Il Proto-Min, di cui esistono delle ricostruzioni (e.g. Jerry Norman), conserva dal cinese medio la distinzione in consonanti come */b/, */p/ e */pʰ/ insieme ai tre stop senza rilascio di suono, alla nasale */ŋ/- a inizio sillaba e allo stacco glottale sempre a inizio sillaba. A questo si aggiungono alcune consonanti conservative rispetto all'Old Chinese. Tutte le altre famiglie dialettali discendono direttamente dal Primo Cinese Medio, come ad esempio lo shanghainese e il cantonese (il Proto-Yue si è formato durante le migrazioni per le invasioni subite dalla Cina durante il passaggio tra Dinastia Tang e Song). Il Proto-Min invece si è formato dopo la conquista di Nanyue 南越 e Baiyue 百越 da parte della Dinastia Han, conquiste con cui si è istituito il Primo Bac Thuoc 北属 (Appartenenza al Nord) nella storia vietnamita su un totale di quattro. Contemporaneamente, in Corea il regno di Goguryeo 高古丽 fu conquistato e diviso nelle Nove Comanderie Han, a loro conquistate da piccoli regni successivi coreani. Le lingue Min si sono suddivise in tre famiglie: le Min Bei 闽北, Min Dong 闽东 e Min Nan/Minnan 闽南 (Min Settentrionale, Min Occidentale, Min Meridionale). Al Min Bei appartiene il dialetto Jian'ou 建瓯话, mentre al Min Dong appartiene il dialetto di Fuzhou/fuzhounese/Fuzhouhua 福州话. Per scandagliare a fondo il Minnan, esso a sua volta ha un sottogruppo di dialetti prestigiosi e conservativi parlati a Fujian 福建 e Taiwan 台湾岛 (l'isola accanto a Fujian, già abitata dagli aborigeni e poi colonizzata anticamente dagli abitanti di Fujian), cioè gli Hokkien (dal nome di Fujian in dialetto). Gli Hokkien contano il dialetto di Amoy/amoynese/Amoy Hokkien (parlato a Xiamen 厦门, "Amoy" in dialetto), il taiwanese/Hokkien di Taiwan/Taiwanhua 台湾话 (con sotto-vairetà, come quella di Kaohsiung 高雄, diversa da quella della capitale Taipei 台北), lo Zhangzhou 漳州 e il Quanzhou 泉州. Altri due dialetti Minnan ma non del gruppo Hokkien sono il Chaozhou/Teochew 潮州 e lo Shantow/Swatow 汕头. Se il cantonese/Guangdonghua/dialetto Yue 粤语 ha la romanizzazione Jyutping e Yale e lo shanghainese/Shanghaihua/Huyu 上海话，沪语 ha tre romanizzazioni (Qian Nairong 钱乃荣, carente però di molti suoni; MinDict; Wikizionario), gli Hokkien hanno due romanizzazioni principali e molto simili tra loro, il Peh-oe-ji/POJ 白话字 e il Tai-lo 台罗 (quest'ultima fa meno uso di diacritici rispetto alla prima e riproduce meglio la pronuncia). A queste due, si aggiunge una romanizzazione ad-hoc per il Minnan di Chaozhou/Teochew, cioè il Peng'im 拼音, che in putonghua si pronuncia "pinyin".

L'ultimo dialetto meridionale utile siccome è conservativo (ma non trattato qui) è l'Hakka, che preserva la coda nasale *-m nei pochi casi in cui il cantonese la perde per un'assimilazione in -n. Conserva pure gli stop a fine sillaba. Il popolo Hakka ha iniziato a formarsi durante il periodo di turbolenze e guerra della Dinastia Jin (265-420), quindi è una delle famiglie dialettali discendenti dal Primo Cinese Medio più antiche.

Gli altri dialetti, anche se talvolta mostrano segnali di pronuncia arcaica, sono settentrionali e meno conservativi (e.g. dialetto Jin, dialetto Gan, dialetto Xiang).

Tutte le lingue che discendono dall'Old Chinese e Primo Cinese Medio, incluse quete stesse varietà di lingue e tutte le varietà storiche esistite e anche le lingue delle culture neolitiche (cioè esistite prima della Dinastia Xia) vengono dette "lingue sinitiche". Queste ultime derivano da una suddivisione del Proto-Sino-Tibetano (la cui ricostruzione è ancora agli esordi), detto anche Trans-Himalayano, in due macro-aree (secondo il modello classico ma tuttora in discussione di James Matisoff, 1978): le lingue sinitiche e il proto-tibeto-birmano, da cui derivano il proto-tibetico/Proto-Tibetic, ricostruito da Nicolas Tournadre, 2013 (vi deriva l'Old Tibetan/Tibetano Antico/Tibetano Arcaico, da cui discendono le lingue tibetiche, incluso il tibetano classico e moderno) e il proto-lolo-birmano/Proto-Lolo-Burmese/Proto-Nisoic (lingue lolo-birmane/Lolo-Burmese languages), da cui derivano le lingue lolo e le lingue birmane, a cui appartiene l'Old Burmese/Birmano Antico/Birmano Arcaico.

Stando a un paper di Laurent Sagart, Guillaume Jacques e Yunfan Lai del 2018 e pubblicato nel 2019, "Dated language phylogenies shed light on the ancestry of Sino-Tibetan", la famiglia Sino-Tibetana (e dunque il Proto-Sino-Tibetano) è nata circa nel 5200 a.C.

William S-Y. Wang in "Three windows on the past" (1998), uno studio glotto-cronologico di sette lingue sino-tibetane (contro le 50 dell'articolo di Sagart-Jacques-Yunfa), afferma che esse hanno iniziato a mostrare i primi segni di perdita di unità intorno al 4000 a.C. Le prime tracce di Old Chinese, in base alle datazioni dei gusci di tartaruga più antichi, risalgono al 1250 a.C., mentre l'Old Tibetan e l'Old Burmese sono molto posteriori: l'Old Tibetan, il più antico dei due, è attestato dal VII secolo d.C., ma di fatto esisteva già prima: semplicemente, poco prima del 649/650 era stato inventato l'alfabeto tibetano, che marca simbolicamente l'inizio del periodo dell'Old Tibetan, posteriore al proto-tibetico. Dunque in questo periodo il proto-tibetico si era già separato dal proto-tibeto-birmano, che forse era un pidgin nato dal contatto dei parlanti rimanenti di proto-sino-tibetano che entrarono in contatto con altri popoli e lingue. Successivamente è attestato pure l'Old Burmese, ormai separatosi dal proto-lolo-birmano).

Per la precisione, i tibeto-birmani, secondo un articolo di Bo Wen, Xuanhua Xie et al. (Analyses of Genetic Structure of Tibeto-Burman Populations Reveals Sex-Biased Admixture in Southern Tibeto-Burmans, scritto nel 2003 e pubblicato nel 2004), derivano da una migrazione verso il sud di alcune tribù dalla Cina nord-occidentale. Queste tribù, le Di-Qiang, entrarono in contatto con le tribù native austroasiatiche e Mon-Khmer. Da questo studio genetico emerge che si sono anche mescolati geneticamente tra loro. La migrazione viene datata "nel periodo delle Primavere e Autunni [circa 2600 anni fa]" (il periodo va da 771 a.C. al 476 a.C. [~600 a.C.]). Siccome questo periodo è ricordato per le guerre sanguinarie tra 120 feudi, poi riuniti dalla prima dinastia imperiale, la Dinastia Qin, si può ipotizzare che siano avvenute per le guerre (in futuro, molte altre migrazioni avrebbero avuto come protagonisti dei profughi di guerra). L'avvenimento che dà inizio a questo periodo è la caduta della Dinastia Zhou, che è costretta alla fuga in un piccolo territorio, l'unico che controlla saldamente. La tribù che sconfisse gli Zhou, i Quanrong, era del gruppo Qiang e abitava proprio nella Cina nord-occidentale.

In totale, le lingue sino-tibetane secondo il linguista Harald Hammarström sono circa 500. Gran parte di esse sono lingue minori. Secondo James Matisoff, circa 250-300 sono tibeto-birmane (secondo Ethnologue, oltre 400). Le proto-lingue, insieme allo stesso proto-sino-tibetano, si ricostruiscono con il metodo comparativo tra vocaboli attestati o a loro volta ricostruiti o cercando le informazioni di pronuncia nei dizionari o altre opere, e.g. il fanqie. Alcuni di questi strumenti, come il Sino-Tibetan Etymological Dictionary and Thesaurus Project (STEDT, a cura di James Matisoff, finito nel 2015, a cui hanno partecipato molti altri studiosi come Baxter e Tournadre e con delle correzioni di etimologia di Laurent Sagart indicate in un articolo del 2019), sono liberamente consultabili online. Matisoff mette in guardia dalle "megalo-ricostruzioni" e indica che si arrivano a macro-proto-lingue a partire dalle ricostruzioni dal basso, cioè da piccoli gruppi imparentati/dall'estremità, per poi risalire verso l'alto, fermo restando che bisogna avere un sistema di parentela e classificazione alla base (a volte c'è disaccordo tra linguisti sulla classificazione di una lingua). Se la lingua possiede un alfabeto già dai tempi antichi, già in partenza si è avvantaggiati (si pensi al birmano, tibetano, alle scritture brahmiche da cui derivano e dunque alle loro stesse informazioni originali, 'Phags-pa, coreano, giapponese e ai lavori dei missionari europei a partire dal Cinquecento come Rodriguez, Trigault, de Rhodes, Pigneau, Ruggieri, Ricci e Brollo). Diverso è il caso dell'Old Chinese, che è formato da una pletora di ideogrammi e pittogrammi (il qieyun e le chiavi di lettura comunque non hanno la stessa efficacia di un alfabeto). Per la parentela tra lingua, non si usa solo la fonetica (il vocabolario, se ricco di prestiti, può portare a risultati ingannevoli), ma pure la grammatica, attestata in grammatiche antiche (scritte anche da missionari europei e linguisti e a volte ispirate all'impostazione di quelle di latino) o ricostruita, per esempio tramite comparazioni di uno stesso testo tradotto in più lingue (si pensi alla stele di Myazedi, che ha un testo in Mon, birmano antico, pali e pyu). Se la classificazione di Matisoff è corretta, da un sistema di cambiamenti più o meno drammatici di fonetica e grammatica che colpiscono il proto-sino-tibetano si ricavano l'Old Chinese (nella sua fase più antica attestata a volte viene chiamato in modo diverso, "Proto-Sinitico" o "Early Old Chinese", Primo Cinese Antico) e il proto-tibeto-birmano.

Quanto all'invenzione dell'alfabeto tibetano, l'inventore secondo la tradizione e le fonti storiche che ne parlano è Thonmi Sambhota. Quest'ultimo era un giovane mandato nel 632 in India (forse nel Kashmir) a studiare l'alfabeto indiano (varietà Kashmir o Khotan) per inventare una scrittura per il tibetano direttamente da Songtsen Gampo. Songtsen Gampo non era un nobile qualunque, ma il 33° sovrano del Tibet, l'unificatore di molti territori tibetani prima divisi e il fondatore dell'Impero Tibetano. La sua consorte era la principessa Bhrikuti del clan Licchavi, nepalese e figlia del re dell'omonimo regno nepalese (il nepali ha l'alfabeto indiano come scrittura; forse Bhrikuti era anche buddista). Fu anche colui che introdusse il buddismo in Tibet, promosse la costruzione di templi buddisti e fece tradurre le scritture buddiste dal sanscrito al tibetano, che si era appena dotato di un alfabeto. Quest'ultimo fu confezionato da Thonmi Sambhota al suo ritorno in Tibet: si stabilì probabilmente nell'eremo di Panboka, a pochi chilometri da Lhasa e fondato da Songtsen Gampo, e lì creò l'alfabeto, poi presentato al re e accettato. Lo stesso sovrano imparò in quattro anni la scrittura e la sua applicazione pratica e tradusse più di venti testi. L'alfabeto fu adattato alla fonetica dell'Old Tibetan, siccome conteneva 6 nuove consonanti per 6 suoni tibetani. Songtsen Gampo come seconda moglie sposò nel 641 una cinese, la principessa Wencheng, imparentata con l'Imperatore Taizong della Dinastia Tang, che acconsentì alle nozze (Taizong era il secondo imperatore della dinastia). Da questo matrimonio sarebbe nato un presunto avvicinamento del re alla cultura cinese. Muore nel 649/650, nello stesso periodo in cui muore anche Taizong. Xuanzang è contemporaneo a Taizong e il periodo Tang, in generale, vede una crescita in popolarità del buddismo, già entrato in Cina durante la Dinastia Han probabilmente attraverso i missionari indiani che attraversarono la Via della Seta. Dalla Cina poi approdò in Corea e Giappone insieme ai sinogrammi con la pronuncia in Primo Cinese Medio e ai classici della letteratura cinese.

Uno strumento online utilizzabile per consultare le radici in proto-tibeto birmano e altre lingue sino-tibetane è lo STEDT (Sino-Tibetan Etymological Dictionary and Thesaurus), un dizionario curato da James Matisoff dell'Università di Berkley la cui versione finale è stata rilasciata nel 2015. Un paper di Laurent Sagart (2019) indica le correzioni di alcune etimologie sbagliate. Alla creazione dello STEDT hanno partecipato anche Nicolas Tournadre e William Baxter. La ricostruzione in Old Chinese non sembra essere quella più recente del 2014.

Siccome i caratteri cinesi sono arrivati in Giappone attraverso i coreani del regno di Baekje (百濟 백제, Corea meridionale) mentre in Cina stava volgendo a termine il cinese antico e stava nascendo il cinese medio, in quel periodo in Giappone si parlava il giapponese arcaico (Old Japanese, finito nel 794 con la fine del periodo Nara, quando la capitale era a Nara 奈良, e l'inizio del periodo Heian 平安 , in cui si inventano il カタカナ katakana e ひらがな l'hiragana e la capitale era a Kyōto 京都, anticamente chiamata "Heian").
Un altro aspetto del giapponese arcaico consiste nell'assenza totale di consonanti a fine sillaba. Esso è però limitato solo a questa fase estremamente arcaica. Oggi è possibile solo inserire un suono nasale traslitterato con "n" (ン) che si assimila in base alla consonante successiva; questo suono nasale, insieme alla distinzione tra vocali lunghe e brevi e consonanti geminate/raddoppiate/tensificate e non, è stato inserito nel periodo Heian (794-1185), cioè durante il cosiddetto "giapponese medio degli albori/giapponese medio iniziale/Primo Giapponese Medio (Early Middle Japanese), proprio per adattare un enorme numero di prestiti cinesi al giapponese.
In generale, in giapponese non sono mai esistite le consonanti aspirate: quelle che in cinese medio hanno l'aspirazione la perdono a prescindere. Per esempio 台 "tai" /tʰai/, che in cinese moderno conserva l'aspirazione dal primo cinese medio *thoj, in giapponese è /tai/.
Nel giapponese arcaico era poi presente la consonante vibrante */r/ e non esisteva né il suono /d͡z/ occlusivo (esisteva una */ⁿz/ fricativa) né il suono /d͡ʑ/, che per esempio si ritrova oggi nella parola "kanji" (sarebbe una palatalizzazione di /d͡z/, aggiunto più avanti e in cui convergono */d͡z/ affricata, */z/ fricativa insieme anche a */ʑ/ e */d͡ʑ/ palatali del cinese medio).
Nel tardo giapponese medio (iniziato con lo shogunato di Minamoto no Yoritomo 源頼朝, detto "periodo Kamakura", in cui la capitale era Kamakura 鎌倉), periodo in cui abbiamo testimonianze occidentali della lingua giapponese come l’"Arte da Lingoa de Iapam" di João Rodriguez (1561/62-1633/34) del 1604-1608, il cluster vocalico /ou/, che tuttora conserva questa grafia, ha assunto la pronuncia /o:/, e la palatalizzazione di /si/ in シ /ɕi/ è attestata (e tuttora si conserva) mentre tutte le sillabe */kwe, kwi, gwe, gwi/ esistenti sono mutate in /ke, ki, ge, gi/. Un esempio di quest'ultima mutazione si può trovare nel kanji 鬼 che in cinese moderno (trascrizione pinyin 拼音) è guǐ /kwei/ con il terzo tono, in coreano moderno è 귀 (gwi, dall’alfabeto hangeul 한글 si legge /kwi/), in vietnamita moderno è quỷ /kwi˧˩/ (se il suono /k/ è seguito da "u(…)", non si scrive *cu, bensì "qu…"), in cantonese (trascrizione jyutping 粤拼) è "gwai2" /gwɐi̯/ (intonazione crescente) e in cinese medio era, secondo Baxter, */kjwɨj/. In giapponese moderno, con la lettura on'yomi, si pronuncia キ (dal katakana, usato per traslitterare sia i prestiti sia la pronuncia on’yomi 音読み, si pronuncia /ki/). Dopo queste considerazioni, è facile immaginare come in tardo giapponese medio, prima della convergenza, fosse */kwi/.
I due dittonghi /we/ e /wi/, che in giapponese esistevano anche in isolamento, trascrivevano sillabe aventi cluster vocalici complessi, chiaramente ridotti. I tre casi emblematici sono -*/jwe/, -*/jwij/, -*/jwɨj/, che in cinese moderno sono "wei" e in giapponese, a colpo d'occhio, sono "we" e "wi", che però oggi sono in disuso totale pure se in isolamento, oltre che dopo consonante. Entrambi, se in isolamento, a prescindere si riducono in /i/. Sei esempi con il corrispettivo in primo cinese medio sono 畏 *jw+jH, 韋 *hjw+j, 位 *hwij^H, 威 *'jw+j, 爲 *hjwe, 委 *'jwe^X, oggi tutti quanti /i/.
Nel tardo giapponese medio (Late Middle Japanese) inoltre le sillabe ヂ /di/ e チ /ti/ si palatalizzano in /d͡ʑi/ e /tɕi/ (la prima converge in pronuncia con l’odierna ジ /d͡ʑi/, in passato /dzi/).
Nel giapponese moderno degli albori, che copre tutto il periodo Edo (ovvero tutto il periodo dello shogunato Tokugawa, durante la quale la capitale venne spostata a Edo 江戸, poi rinominata Tōkyō 東京 durante la Restaurazione Meiji 明治), anche /kwa/ e /gwa/ diventano /ka/ e /ga/, un esempio sembra rintracciabile in 瓜, l'anguria, che in cinese moderno è gua /kwa/ con il primo tono, in coreano moderno è 과 goa (oggi /kwa/), in vietnamita moderno è "qua" /kwa/, in cantonese è "gwaa1" /gwa:/ (intonazione piatta acuta) e in cinese medio era *kwae. In giapponese moderno è カ (/ka/), quindi durante il giapponese moderno degli albori /kwa/ e diventato /ka/. Questo è pure il periodo in cui /u/, vocale arrotondata, diventa /ɯ/: non è più procheila. In altre parole, si toglie l'arrotondamento delle labbra.
Il dittongo *-/wo/ del cinese medio tende a ridursi in /o/ in giapponese, se e preceduto da consonante. In isolamento, non trascrive nessun kanji. Due esempi sono 婚 e 昏, entrambi *xwon /xwon/ in cinese, oggi /kon/ in giapponese. Un terzo esempio è 国 *kwok, in giapponese moderno /kokɯ/. Si può quindi momentaneamente concludere che nelle sillabe moderne [ka, ki, ke, ko] e [ga, gi, ge, go] e [kan], se si fa un confronto col cinese medio, era talvolta presente un dittongo che inizia per /w/-, oggi caduto da tutte le combinazioni. Per fare un paio di rapidi esempi contenenti "kan", si possono prendere 館/馆 *kwan^H, oggi /kan/, e 款 *khwan^X, oggi /kan/. Questo fenomeno di caduta della semiconsonante /w/- in realtà è presente in altre sillabe ancora come 團 *dwan, in giapponese moderno /dan/ oppure 端 *dwan, oggi /tan/. Coinvolgerebbe quindi anche i suoni dentali e l'aspirazione in cinese medio, perché si può fare un ultimo esempio 換/换 *hwan^H, oggi /kan/.
I gruppi vocalici molto complessi in cinese medio tendono a ridursi a prescindere, per esempio *woj diventa /ai/ in giapponese, ad esempio 退 *thwoj^H, oggi /tai/. Un altro esempio è 快 *khwaej, oggi /kai/. Qui si può pure notare la vocale /æ/ approssimata in /a/.
Quindi per tirare una conclusione sommaria sull'antica semivocale (-)/w/, dal cinese medio si nota come oggi si siano persi i dittonghi che iniziano per -/w/ quando sono preceduti da consonante. Questi ultimi in cinese moderno tendono a restare. Riguardo a questi dittonghi in isolamento, "we" e "wi" si riducono in /i/ essendo in disuso, mentre /wa/ si usa ancora e resta inalterato (ex. 話 /wa/). "Wo" in isolamento non si usa, mentre come particella per indicare il complemento oggetto diretto (l'unico uso frequente in giapponese moderno in scrittura hiragana) si pronuncia /o/ ma in romaji si latinizza come "wo" per non confonderlo con "o" (esistono kanji che si pronunciano /o/, come 汚). Se presente in cluster vocalici complessi (in cinese medio hanno tre o quattro membri), /w/- si è sempre semplificato; in generale, si tolgono uno o due membri.
Per rimanere in tema di gruppi vocalici, siccome in giapponese moderno /je/ fa parte del katakana per traslitterare prestiti moderni, nella pronuncia attuale dei kanji il suono appare sostituito: ad esempio, la sillaba 消 in cinese medio è *sjew, mentre in giapponese è /ɕjo:/, che si scrive (e ricostruisce) "shou": o è stato trasformato o muta per l'effetto della -/u/. Se non si trasforma, è riconoscibile in versione semplificata, senza la semivocale /j/-, come in 健 *gjen^X, in giapponese /ken/.
La /h/- in cinese moderno, nel cinese medio distinta in aspirazione sorda e sonora, diventa /k/ e /g/ in giapponese moderno per approssimare i suoni */x/ e */ɣ/ del cinese medio, alternativi a /h/ e /ɦ/ o reperibili almeno nel caso di assimilazione data dal suono /u/ e /w/ appena successivo. La parola "kanji" è un esempio di questo fenomeno.
Le sillabe che giapponese moderno iniziano per /h/- in giapponese medio avevano /ɸ/, che deriva a sua volta da un’antica /p/ divenuta fricativa o /b/ defonologizzata e poi diventata pure lei fricativa. Un esempio è la parola 日本 (ニホン nihon), che straordinariamente conserva la variante arcaicheggiante ニッポン (nippon), da cui deriva l’aggettivo "nipponico": In cinese medio era *pwon^X /pwon/, con intonazione crescente indicata da X (oggi terzo tono), mentre in cantonese oggi è "bun2".
La /f/ del cinese moderno, che deriva dal cinese medio *b, *p e *ph, in giapponese tende a diventare una semplice aspirazione perché la fricativa labiodentale /f/ non è mai esistita. Due esempi sono 非 *pj+j, oggi /hi/ e 方 *pjang, oggi /xo:/, cioè "hou". Nel primo esempio, si semplifica il gruppo vocalico perché la vocale alta centrale si fa convergere/si sostituisce con /i/. Da questi due punti si può concludere che l'odierna /h/ in giapponese deriva da suoni bilabiali del cinese medio, come anche l'odierna /f/ del putonghua: entrambe le consonanti hanno la medesima origine.
Sebbene sia vero che il giapponese ha inventato durante il periodo medio degli albori il suono nasale finale assimilabile (e quindi completamente flessibile) per adattare i prestiti cinesi, la distinzione netta del cinese medio tra *–n e *–m in giapponese non esiste, inoltre il suono nasale finale si usava più per riprodurre questi due suoni che per /ŋ/ finale, che spesso si può trovare approssimato come /i/ o /u/, per esempio in 生, che in cinese moderno è shēng (primo tono), in cantonese è "saang1" /sa:ŋ/ e in giapponese è セイ /sei/. In questi contesti sono nati /au/ (oggi (o:/), /eu/ (oggi /yo:/ anche in scrittura) e /ou/ (oggi /o:/). Un esempio dell'ultimo caso è il kanji 孔 *khuwng^X, che in giapponese si pronuncia /ko:/ e si scrive */kou/.
/au/, in giapponese moderno /o:/, deriva non solo dall’esigenza di accomodare "vocale+ŋ" del cinese medio ma, in sillabe completamente diverse, ma anche dal bisogno di accomodare il nucleo di sillaba cinese "ao" (/au-ao/ in mandarino; in cinese medio era *aw). Ad esempio, 毛 máo (tono crescente) in cinese medio era *maw e in giapponese moderno è {{{2}}} /mo:/, da cui si ricava un antico /mau/. In cantonese moderno ci assomiglia perché oggi si pronuncia "mou4" (tono discendente). Si può quindi concludere che l'allungamento vocalico /o:/ deriva sia dalla trascrizione del suono nasale velare del cinese medio, sia dalla trascrizione della *-/w/ finale in cinese medio, dalla trascrizione della finale *-p (vedi avanti).
Il giapponese a inizio sillaba non ha mai avuto /ŋ/ (ma in giapponese si può trovare sostituito con g-, abbastanza simile) e /ɲ/ (si approssima con /n/, se si prende in considerazione il cinese medio; nel cinese arcaico al posto di /ɲ/ iniziale c’era comunque sempre /n/ nella ricostruzione di Baxter-Sagart). Un esempio si vede in 二 èr /ʌɻ/, che in cinese medio era *nyi /ɲi/ e in giapponese moderno è ニ (/ni/). Un esempio invece di sostituzione di /ŋ/ con /g/ è nel carattere 语, che in cinese medio era *ngjo^X (tono crescente) e in giapponese è ゴ /go/.
Di contro, in parecchi kanji si può notare come non sia avvenuta la palatalizzazione in cinese laddove la pronuncia in cinese medio era *gi, ki, khi (con "i" anche semivocalica per formare dittonghi o il suono moderno /y/) e oggi, in pinyin, forma le sillabe JI e QI. Per esempio, 气 (versione tradizionale 氣), che in mandarino è qì (/tɕʰi˥˩/, quarto tono, in cinese medio era *khj+j^H, ovvero */kʰjɨj/ con tono discendente), in giapponese si pronuncia キ (/ki/): non c’è palatalizzazione e il resto della sillaba è andato semplificandosi ancora una volta. In più, a prescindere si tolgono tutte le aspirazioni perché il giapponese non ne ha mai avute. Un altro esempio è 京, che in cinese moderno è "jīng" (primo tono), in cantonese è "ging1" /gi:ŋ/ e in giapponese è /kjo:/, derivato a sua volta da /kjou/ per rendere il suono -/ŋ/. Oppure, siccome è *kjaeng in cinese medio, il dittongo "jae" si è reso come /e/ per formare quindi /eu/ che, come già detto, diventa oggi /jo:/.
La vocale centrale alta /ɨ/, reperibile nelle sillabe cinesi ZHI, CHI, SHI, RI, ZI, CI, SI non esiste in giapponese e non esisteva nemmeno in cinese medio in questi precisi contesti appena elencati. In giapponese al suo posto si trova /i/. Ad esempio, 時 (semplificato 时) in cinese moderno è shí (secondo tono), in cinese medio *dzyi, in cantonese è "si4" /si:/ e in giapponese moderno シ (/ɕi/), oggi sempre palatalizzato.
Vocali anteriori aperte in cinese medio come ad esempio */æ/ presente in cinese medio, siccome nel giapponese arcaico non sono probabilmente mai esistite, sono state quindi approssimate in /a/ oppure /e/. In giapponese poi c’è spesso molta confusione nel distinguere le occlusive sorde da quelle sonore /b; p/ (oggi /b/ oppure /h/), /d; t/, /g; k/: anche in cinese oggi non c’è una distinzione netta, appartenente invece al cinese medio e a dialetti come lo shangainese.
Nel giapponese non esistono cluster consonantici a parte quelli formati da finale nasale e successiva consonante (si pensi alla stessa parola "kanji"). Tutti gli altri, derivati dagli stop senza rilascio di suono presenti nel cinese medio, o si perdono perché cade lo stop oppure, come nel caso di "studente", in giapponese moderno 学生 (ガクセイ, gakusei, in cinese "xue2sheng1"), c’è una vocale che permette di preservare lo stop, anche se la lettura on’yomi del kanji si allunga. Di solito si vede proprio la "u" oggi non più arrotondata, sporadicamente "i" se la vocale appena precedente è anteriore. Per la precisione, partendo dal presupposto che i tre stop a fine sillaba del cinese medio sono *-p, *-t, *-k, lo stop in zona velare *-k diventa "ku/ki" come nell'esempio precedente, quello in zona dentale diventa "tsu/chi" (oggi palatalizzati a partire da *"tu/ti") mentre quello in zona bilabiale è diventato /ɸu/ per poi ridursi oggi in */u/ > /ɯ/ (il simbolo ">" indica, nella letteratura filologica, la derivazione di una forma da un'altra). In quest'ultimo caso, come anticipato sopra, nascono altri allungamenti vocalici. Un esempio a caso di quest'ultima casistica è 甲 *kaep, che in giapponese è oggi /ko:/, che probabilmente deriva da */kau/, siccome /æ/ si approssima. Se dopo uno stop c'è una consonante che si articola nello stesso luogo (ex. -k k-), avviene un raddoppio, per esempio nella parola 国家 ("kokka"). Quest'ultimo fenomeno avviene anche in coreano, dove questa parola si pronuncia "gukka" /kukka/.
Il suono "r" in giapponese oggi si pronuncia /ɹ/, senza contatto tra organi come in inglese, ma fino al giapponese moderno degli albori era /r/ e, intervocalico, era monovibrante /ɾ/ esattamente come in italiano.
In giapponese, non è mai esistita la /l/, che nei prestiti cinesi e anche stranieri viene sostituita con la "r" giapponese. Si pensi al kanji 来 (cinese moderno "lai", cantonese "loi2" /lo:y/, giapponese ライ, rai) e al prestito エレバット (erebatto, dall’inglese "elevator", "ascensore").
In questo periodo inoltre la sillaba ツ /tu/ giapponese si pronuncia /t͡sɯ/ non più arrotondato.
Il colpo di glottide a inizio sillaba del cinese medio si è perso nel giapponese: non esistono segni che lo trascrivono.
In giapponese non sono mai esistite le consonanti retroflesse, presenti in cinese medio. Rispettivamente, *tr e *trh sono diventate /t/, *dr è diventata /d/ e *sr è diventata /s/, *zr è diventata /d͡z/: perdono tutte la retroflessione. Tutte quelle rimaste, che sono le affricate retroflesse *tsr e *tsrh, diventano /s/: si perde il contatto tra organi.
In giapponese, le palatali occlusive del cinese medio */t͡ɕ/ e */t͡ɕʰ/ vengono approssimati in /s/ perché questi suoni, eccetto per /t͡ɕi/ (ma che anticamente era /ti/), non sono mai esistiti in giapponese. Si può quindi concludere che nell'odierna /s/ convergono *s, *sr, *ts, *tsh, *tsr, *tsrh e *sy palatale. Un discorso analogo si può fare anche sul suono */t͡s/ del cinese medio, mai esistito in giapponese a parte nel caso /t͡sɯ/, che però anticamente era /tu/.
Le sillabe che in primo cinese medio iniziavano per *mj-, poi perso in cinese moderno (infatti oggi iniziano tutte con /w/-, derivato forse da */v/- o */ɱ/-), in giapponese tendono in parecchi casi a ritenere il suono /m/- o a mutarlo in /b/- o addirittura hanno una doppia versione. La /b/- sembra approssimare */v/-, che da labiodentale diventa bilabiale. Per fare tre esempi, 尾 (wei3, in cinese medio *mj+jX, in giapponese び /bi/) ne ha una (ex. びこう尾行 /biko:/), 味 (wei4, in cinese medio *mj+jH, in giapponese み /mi/) ne ha una (ex. みそ味噌 /misɯ/), mentre 万 (wan4, in cinese medio *mjonH, in giapponese まん mon e ばん ban) ha una doppia versione (ex. 万一, まんいち /monit͡ɕi/; 万能, ばんのう /banno:/).
Un kanji talvolta può avere più pronunce on'yomi, adottate in periodi storici diversi e quindi da varietà diverse dal punto di vista storico o dialettale. Un kanji in isolamento ha quasi sempre una lettura くんよみ kun'yomi, cioè nativa giapponese. Infatti si possono anche usare da soli per rappresentare un concetto. Anche in cinese moderno un sinogramma può avere, in casi sporadici, più pronunce: si pensi a 着, che può essere "zhe, zhao, zhuo".

Questa lunga introduzione è un punto di partenza per chi desidera approfondire anche il giapponese nel corso della sua evoluzione fonetica, per meglio capire da dove deriva la pronuncia on’yomi dei kanji. Per velocizzare la lettura, anche in caso in cui non si abbiano a disposizione l'IPA o il romaji, l'apprendente potrebbe avere la tentazione di imparare il katakana, siccome è composto da pochi segnetti derivanti da sinogrammi o loro pezzi semplificati fino all'osso. In tal caso (ma ancora di più nell'hiragana), quasi metà alfabeto è una ripetizione perché nel momento in cui ai suoni sordi si aggiunge un paio di trattini in alto, si ottiene la versione sonora della consonante. I trattini, detti "nigori"/ 濁 / ニゴリ / impurità, indicano la vibrazione delle corde vocali durante la pronuncia. Quindi da K, T, S, H (eccezione) si ottiene G, D, Z, B e viceversa se si toglie; se invece in quelle che iniziano con aspirazione H (sempre sorda) si mette un cerchiolino (detto "maru", cerchio), si ottiene il suono /p/ sordo perché il cerchio indica la chiusura delle labbra.

Per fare un lavoro simile in coreano, bisogna partire da presupposti simili: se si desidera fare un lavoro molto approfondito che si estende a come è evoluta la pronuncia nella lingua di approdo, bisogna considerare la varietà storica e le sue trasformazioni. Ad esempio, nel coreano antico, quando nel 1443 fu inventato l’hangeul dal re Sejong (1418-1450) della dinastia Joseon (1392-1857), c’erano altre lettere oggi obsolete che trascrivevano suoni oggi scomparsi, inseriti in una tabella appena dopo la spiegazione degli adattamenti dei suoni del Cinese Medio. C’erano anche dei cluster consonantici oggi scomparsi ma reperibili nelle opere antiche e addirittura dei cluster preconfezionati con tre membri (oggi al massimo ne hanno due). C’erano poi altre combinazioni vocaliche oggi sparite. Quindi, se si vuole lavorare col coreano medio (dal X al XVI secolo, ovvero dalla dinastia Goryeo 高麗 (918-1392) fino ai primi tempi della dinastia Joseon 朝鮮 deposta dai giapponesi) e con il coreano arcaico, bisogna conoscere le basi della lingua arcaica a livello fonetico. Sotto alla tabella viene riportata anche una possibile ricostruzione della pronuncia arcaica delle vocali e dei cluster vocalici, che si pronunciavano così come si scrivevano.
Ci sono sempre stati gli stop consonanti –p, -t, -k/kk (che spesso rimangono invariati a parte -t) e anche altre consonanti a fine sillaba, come le nasali –n, -m, -ng (che restano invariate rispetto al primo cinese medio). A fine sillaba ci sono sempre stati anche il suono laterale -l (sostituisce *-t) e il suono –s (oggi si pronuncia come stop senza rilascio di suono in zona dentale -t). Alcuni prestiti aventi -s derivano dal cinese arcaico. Riguardo invece alla sostituzione di *-t con *-l, essa deriva da un cambiamento nel tardo cinese medio settentrionale, in cui la *-t si era addolcita in una *-r, che i coreani hanno reso (e rendono tuttora) -/l/.
Nell'hangeul, in base alla ricostruzione, non è segnata alcuna vocale */e/ (nemmeno */je/), */ɛ/, */æ/ del cinese medio e gruppi vocalici a loro annessi, che quindi si sostituiscono.
Nei gruppi vocalici, in ultima posizione ci poteva essere una *-/j/, ma mai la semivocale *-/w/ del cinese medio, per esempio nella parola 毛 *maw, che in coreano si pronuncia /mo/: il suono che più si avvicina a *-/w/ è la vocale -/o/ oppure la -/u/. In coreano esiste tuttavia il dittongo /ju/, che però termina in vocale. In dei testi, la -/w/ viene traslitterata per rendere al meglio la pronuncia cinese (vedi tabella dei caratteri obsoleti)
In coreano non esistono le retroflesse, quindi i suoni del cinese medio *tsr e *tsrh diventano /tɕ/ o /tɕʰ/ e in più vi convergono anche *tr e *dr, mentre *sr diventa /s/. Invece */tɕ/ e */tɕʰ/ restano suoni palatali in coreano.
Non ha mai avuto /ŋ/ a inizio sillaba (ad esempio, il sinogramma 语, cinese medio *ngjo^X, in coreano si pronuncia 어 /ʌ/) e non è mai esistita una lettera per il suono /ɲ/: entrambe cadono. Siccome in coreano (ma non in Corea del Nord) un prestito cinese non può mai iniziare con /n/, il suono che assomiglia di più a /ɲ/, tutte le sillabe che in cinese moderno sono "ER" o iniziano per "R-" non hanno alcuna consonante in coreano. Si pensi a 二 (cinese medio *ɲij^H, oggi 이 /i/) o 日 (cinese medio *ɲijt̚, oggi 일 /il/ o, se intervocalica, /iɾ/), siccome *-t diventa *-l.
I suoni ㅈ */t͡s/ e ㅊ */t͡s^h/ non avevano la palatalizzazione. In Nordcorea, siccome si pronunciano ancora così, la pronuncia è conservativa. Ad esempio, il sinogramma 字, in cinese moderno zì /t͡sɨ˥˩ / (quarto tono) e in cantonese "zi6" /t͡si:/ (tono piatto grave), in coreano si pronuncia 자 /t͡ɕa/ in Sudcorea, /t͡sa/ in Nordcorea. Nel corso dell'evoluzione linguistica o dell'influsso dei dialetti, è normale che le vocali mutino.
Il suono ㄹ /l/, che oggi si pronuncia /ɾ/ se intervocalico, trascrive la */l/ in cinese (in cinese moderno e cinese medio non esistono consonanti vibranti, al contrario del cinese antico). Tutte le sillabe in cui si trova /l/ all’inizio (che in coreano moderno non si modifica se la sillaba non è a inizio parola) avevano sempre */l/ in cinese medio e tuttora in cinese mandarino /l/, come 路: si pronuncia 로 /lo/ (cinese medio */lu/ con tono già discendente), ma se a inizio parola si muta in grafia e pronuncia in 노 /no/, regola che vale con tutti gli altri casi in Sudcorea. Un esempio è 道路 도로 /doɾo/, "strada", che in cinese mandarino è dàolù e in cantonese dou6 lou6 .
In coreano non avvengono molte palatalizzazioni che esistono nel cinese moderno: per esempio, il carattere 京, in cinese medio *kjæng, in mandarino moderno "jīng" /t͡ɕiŋ/, in coreano è /kjʌŋ/, in cantonese è /giŋ/ e in giapponese on'yomi è /kyo:/ (anticamente /kyou/, di cui resta la grafia in traslitterazione).
La */ɳ/, */ʈ/ e */ɖ/ retroflesse del cinese medio non esistono in coreano.
Gli hanja in casi sporadici hanno più pronunce, esattamente come i kanji; allo stesso modo, hanno tutti quanti una lettura nativa coreana se presi e usati in isolamento.
In coreano non c'è mai stata la distinzione netta tra consonante sorda e sonora senza aspirazione, come in cinese medio e shanghaiano. Quindi, i suoni */p/ e */b/ del cinese medio non hanno particolare distinzione in coreano. Lo stesso discorso si può fare pure sulla coppia */s/ - */z/, */t͡s/ - */d͡z/, */t͡ɕ/ - */d͡ʑ/ (in coreano queste due coppie sono allofoniche: semplicemente, nel nord non avviene la palatalizzazione) e */k/ - */g/ in cinese medio. Quindi, in coreano c'è un unico esito e grafia, che di solito tende a realizzarsi sonora eccetto se a inizio frase. Un esempio chiarificatore di convergenza è *s, *z > /s/, in cui convergono pure *sy, *zy e *sr. Un altro più semplice è *x sorda e *h sonora che convergono in un'odierna /h/.
La *k e *kh del cinese medio in coreano diventano /k/ o un'aspirazione /h/. Quindi questa è l'unica consonante che dal cinese medio non conserva l'aspirazione a prescindere.
Il colpo di glottide a inizio sillaba in coreano è oggi sparito.
Le sillabe colpite da caduta di fono nel caso di *mj- in cinese medio tendono a preservare la /m/- in coreano (o, siccome l'Hangeul è stato inventato nel 1443, durante la Dinastia Ming e quindi quando ormai il Tardo Cinese Medio aveva lasciato posto al Primo Mandarino, la /m/- coreana è una ritenzione arcaica di */mj/- o un'approssimazione della labiodentale */ɱ/-). Per esempio, 文 *mjun, in cinese moderno "wen4" rimane 문 /mun/.
In conclusione, nei testi arcaici e rimari non solo si trovano delle consonanti in più oggi obsolete per rendere la pronuncia, ma si trovano anche due diacritici che, a sinistra del carattere, ne indicano la modulazione tonale (i toni sono poi spariti con la fine del "Coreano Medio" o "Coreano Medievale"): 상성 (上聲, 〯) è un paio di punti che indicano il tono "shang3", cioè un'intonazione crescente in Primo Cinese Medio (dal registro basso si sale verso il registro acuto) ma che in Coreano Medio indica un'intonazione piana acuta, mentre 거성 (去聲, 〮) è un singolo punto che indica il tono discendente sia in Primo Cinese Medio che in Coreano Medio. In assenza di punti, si specifica che il tono è piano/piatto (평성, 平聲) e nel registro grave. In presenza di uno stop senza rilascio udibile di suono, la vocale è sfuggita e interrotta dallo stop. Questo tipo di modulazione si dice "tono entrante" (입성, 入聲). Queste quattro categorie, shang3, qu4, ping2 e ru4, derivano dal Primo Cinese Medio. In Primo Cinese Medio, il tono crescente deriva dalla caduta di un antico colpo di glottide/stacco glottale a fine sillaba in Old Chinese, mentre il tono discendente deriva dalla lenizione e caduta di una *-s a fine sillaba.
Oggi il coreano standard, basato sulla parlata di Seul 서울, non ha toni ed è soltanto presente un contrasto tra vocale breve e lunga non mandatorio. Ad esempio, l'hanja 具 /ku:/ ha la vocale lunga.
I toni in lingua coreana sono descritti con le 4 categorie cinesi, ma non hanno un'origine a causa dell'influsso del Primo Cinese Medio siccome hanno un diverso andamento: il tono discendente/qu4 in Primo Cinese Medio in Coreano Medio/Coreano Medievale equivale a un'intonazione acuta ed è indicato da un punto accanto al carattere; il tono crescente/shang3 上声 è un tono crescente in entrambe le lingue e in coreano è indicato da due punti prima della sillaba; di contro, il tono piatto 平声 in coreano si differenzia dal 去声 siccome ha un'intonazione bassa (non si conosce in modo esatto il registro); il tono entrante è comune alle due lingue, ma il coreano aveva gli stop senza rilascio udibile di suono *-k e *-p già durante l'Old Korean (poi si aggiunse *-t del Primo Cinese Medio, trascritta come *-l perché prese da una varietà di cinese in cui si era lenita in una *-r monovibrante). Pertanto, la descrizione dei toni usa le stesse categorie in entrambe le lingue, siccome i coreani presero a prestito la descrizione cinese, ma non c'è corrispondenza nella modulazione tonale, quindi la tonogenesi in Coreano Medio non si fa risalire al Primo Cinese Medio, ma sarebbero interne alla lingua coreana stessa Per la precisione, in principio nacquero due intonazioni, equivalenti al 去声 e al 平声, a cui si aggiunge l'intonazione sfuggita per lo stop (入声). Infine, nacque l'intonazione ascendente 上声 per la contrazione di due sillabe, la prima con il tono grave e la seconda con il tono acuto, in un'unica sillaba con un'intonazione crescente. I toni, insieme al rigoroso sistema di armonia vocalica nella formazione delle parole, sparirono con l'avvento del Primo Coreano Moderno.

Se si lavora sul coreano antico attraverso l’IPA e non leggendo l’alfabeto hangeul, questo lavoro si può evitare. In alternativa, si può imparare l'hangeul, che è un insieme di segnetti molto snello ed economico. Per esempio, per scrivere gli stop senza rilascio a fine sillaba, si mette in posizione finale la consonante (ex. 디 "di", 읻 "it", il cui cerchiolino a inizio sillaba non ha valore fonetico e in fondo sillaba si pronuncia -/ŋ/); per ottenere il dittongo con /j/- al primo membro si aggiunge un trattino alla vocale (ex. 아 "a", 야 "ya"); per ottenere le doppie, si può usare un insieme di consonanti scritte due volte in piccolo e preconfezionate nell'alfabeto (ex. 꿍 kkung); per ottenere le aspirate, si aggiunge un tratto alle consonanti base (ex. 가 "ga", 카 "ka" come in pinyin). Nella lettura dei caratteri di fila infine, a causa degli stop senza rilascio di suono, si aggiunge il sandhi consonantico, ossia una serie di mutazioni fonetiche. Per esempio, 압고 si pronuncia /ap̚k͈o/ e non */apko/ e nemmeno */akko/, mentre 입늬 si pronuncia /imnɰi/ e non */ipnɰi/ perché lo stop senza rilascio di suono si sonorizza a causa della consonante /n/, che possiede la vibrazione delle corde vocali.

Alcuni caratteri dell'alfabeto Hangeul erano usati più o meno di rado nei testi antichi del Coreano Medio in larga misura per trascrivere dei suoni degli hanja al tempo del cinese medio, per poi cadere in disuso. Alcuni di questi caratteri potevano combinarsi in cluster, anch'essi caduti in disuso. Sempre in passato, erano possibili anche combinazioni vocaliche oggi in disuso, perlopiù per trascrivere la pronuncia degli hanja. Alcuni esempi di cluster antichi usati nel Coreano Medio e oggi in disuso sono ㅳ (assimilatosi poi in ㄸ), ㅶ e ㅾ (assimilatisi in ㅉ), ㅺ (assimilatosi in ㄲ), ㅻ (assimilatasi in ㅥ cioè ㄴ raddoppiata), ㅼ (sempre in posizione iniziale e assimilatasi in ㄸ), ᄱ (assimilatasi in ᄂᄆ) e (assimilatosi in ㅉ). Nel Coreano Medio, potevano trovarsi cluster formati da tre membri, oggi tutti in disuso. Si ricorda che il primo testo a usare l'hangeul (inventato nel 1443) è lo 訓民正音 (훈민정음, Hunminjeongeum), pubblicato dal re Sejong il Grande il 9 ottobre 1446 e messo in coppia con lo 訓民正音解例 (훈민정음 해례, Hunminjeongeum Haerye), che in sei capitoli spiega come si pronunciano i suoni e si combinano le lettere. A questo, è seguita la pubblicazione di numerose opere incentrate sui commenti a opere buddiste, di cui si conservano ancora le copie, e dei primi dizionari di sinogrammi con la pronuncia sino-coreana e/o la pronuncia traslitterata il più fedelmente possibile a quella del cinese medio. Un simile discorso si può fare pure col giapponese, se si considerano i dizionari antichi di kanji.

La vocale ㅓ probabilmente si pronunciava */ɤ/ (labbra non arrotondate), mentre oggi, pur tenendo ancora le labbra non arrotondate, è aperta /ʌ/.
Alcuni suoni vocalici in origine erano dittonghi o altri avevano una pronuncia letterale (ciò è riconoscibile anche dalla grafia): ㅚ oy */oi̯/, ㅐ ay */ai̯/, ㅔ ey */ɤi̯/, ㅙ way, */oai̯/, ㅞ wey */wɤi̯/, ㅒ yay */jai̯/, ㅖ yey */jɤi̯/. Quindi, nella lettura di questi gruppi vocalici, l’hangeul va visto pezzo per pezzo e letto con la pronuncia letterale. Il trattino sotto la "i" disambigua che è semivocale che fa parte di un dittongo o trittongo (altrimenti, nella trascrizione IPA vecchia, si può usare -"j"). La ricostruzione IPA qui offerta è quella che permette di conservare l'armonia vocalica. Un'altra ricostruzione di Lee Ki-Moon (1971) cambia la pronuncia di due lettere e tutti i cluster vocallici che ne derivano, ㅡ */ɨ/ e ㅓ */ə/, tale per cui la pronuncia è più vicina al Primo Cinese Medio. Esistevano molti altri cluster vocalici elaborati dallo studioso Sin Sik-ju per trascrivere la pronuncia del Cinese Medio, ma oggi sono in disuso in coreano. In svariati casi, la lettura non seguiva la scrittura (mentre per tutti quelli ancora in uso, vale il principio contrario).
Esisteva una vocale presente anche nell’inglese moderno e rappresentata da un punto, ᆞ, oggi pronunciata /ɒ/ (vocale posteriore aperta arrotondata, è la versione ancora più aperta di /ɔ/). Questa vocale, la arae-a, è ancora presente nel Jeju, la lingua dell’omonima provincia sudcoreana, Jeju 濟州 (un’isola a sud della Sudcorea). La pronuncia arcaica tuttavia era probabilmente */ʌ/ (labbra non arrotondate) e romanizzazione, ingannevole, è "ə" (una romanizzazione alternativa fa uso della chiocciola, @).
La vocale ᆞ, la arae-a, aveva pure la sua versione dittongo che assomiglia a un punto esclamativo,ᆝ */jʌ/, che si scriveva accanto alla consonante. Esisteva pure la combinazione ㆎ */ʌi̯/.

Dai testi antichi (dal 1446 circa in poi), si ricavano delle pronunce antiche piuttosto utili che in Coreano Moderno sono mutate e che, sia con che senza l'ausilio dei caratteri obsoleti nell'hangeul, in svariati casi riflettono meglio la pronuncia del Primo Cinese Medio (un fenomeno simile avviene anche in giapponese) e in parte del cinese moderno. Si elencano qui sotto alcune trasformazioni, che sbrogliano e disambiguano delle apparenti irregolarità e mancate corrispondenze nella pronuncia.

In generale, la grafia antica, compresa di lettere arcaiche, si chiama "Old Hangeul", 옛한글, di cui esistono degli strumenti di input (입력기) e metodi di input (입력 방법) in tastiere impostabili appositamente nelle impostazioni. Uno dei modi migliori per scrivere le sillabe in Coreano Medio/Coreano Medievale è usare la tastiera Microsoft Old Hangul (si scarica, nelle opzioni "lingua", la tastiera in coreano e, tra i metodi di input nelle opzioni, si aggiunge Microsoft Old Hangul). La tastiera, in qualunque lingua, è visualizzabile su schermo e utilizzabile con il mouse se si attiva la "tastiera virtuale", tale per cui chi non conosce la posizione dei tasti può comunque scrivere. Se la tastiera non lascia scrivere su piattaforme come Wikipedia, si può scrivere su Word o simili e fare copia-incolla. Con la tastiera Microsoft Old Hangul si possono scrivere cluster complessi e le lettere obsolete ᄝᅠ, ᅗᅠ, ᅀᅠ, ᅌᅠ, ᅙᅠ, ᅟᆞ e ᅘᅠ.

Per digitare ᄝᅠ, bisogna digitare ᄆᅠ /m/ e subito dopo ᄋᅠ. Si può scrivere sia a inizio che a fine sillaba, e.g. 가ᇢ ("gau").
Per digitare ᅗᅠ, bisogna digitare ᄑᅠ e subito dopo ᄋᅠ.
Per digitare ᄫᅠ, bisogna premere ᄇᅠ e subito dopo ᄋᅠ.
Per digitare ᄛᅠ, bisogna premere ᄅᅠ e subito dopo ᄋᅠ.
Per digitare ᅀᅠ, bisogna premere il tasto Shift e digitare ᄆᅠ.
Per digitare ᅌᅠ, bisogna premere il tasto Shift e digitare ᄋᅠ (notare la somiglianza grafica, siccome aiuta nella digitazione).
Per digitare ᅙᅠ, bisogna premere il tasto Shift e digitare ᄒᅠ.
Per digitare ᅟᆞ, bisogna premere il tasto Shift e digitare ᅟᅡ.
Per digitare ᅘᅠ, bisogna premere due volte di fila ᄒᅠ.
Per digitare ᄔᅠ, bisogna premere due volte di fila ᄂᅠ.
Tutte le altre consonanti arcaiche (e.g. ᄼᅠ) si ottengono premendo Shift e digitando ᄏᅠ, ᄐᅠ, ᄎᅠ, ᄑᅠ, ᅟᅲ e ᅟᅮ , che sono in fila in basso. Per esempio, ᄼᅠ si ottiene da ᄏᅠ.
Per ottenere la loro versione raddoppiata, bisogna dapprima digitare il singolo carattere, dopodiché riattivare nuovamente lo Shift e ri-digitare il carattere: applicando due volte di fila scrittura di ᄼᅠ da ᄏᅠ, si ottiene ᄽᅠ.
Sempre premendo Shift, si possono digitare i cluster doppi come ad esempio ᄈᅠ e altri suoni vocalici comeᅟ ᅤ.
Per digitare 〮, che indica il tono decrescente (去声) in Primo Cinese Medio e un'intonazione acuta in Primo Coreano Medio, bisogna digitare "302E" (attenzione alla maiuscola), evidenziare la scritta e premere alt+x. La soluzione deriva dal codice Unicode del diacritico, U+302E, HANGUL SINGLE DOT TONE MARK. In alternativa, si usa il "MIDDLE DOT" ·, che però è un surrogato siccome il primo è invece pensato apposta per il coreano. Il middle dot ha codice U+00B7.
Per digitare 〯, che indica il tono crescente "shang3" (上声) in Coreano Medio e Primo Cinese Medio, bisogna alla stessa maniera digitare 302F (U+302F, HANGUL DOUBLE DOT TONE MARK).
Se si preme Shift sulla tastiera su Windows 10, sulla tastiera compaiono le lettere arcaiche, cosa che non accade su Windows 8.1 e Windows 7 (ragion per cui le informazioni riportate sono utili per chi lavora, per esempio, con Windows 8.1).
La tastiera virtuale può sparire o nascondersi se si preme la barra spaziatrice o un altro tasto sulla tastiera reale invece che su quella virtuale. Non è detto che, copincollando dagli inventari di sillabe online e simili, le sillabe siano visibili su Word e altre piattaforme online anche se si è scaricato il font. La tastiera Microsoft Old Hangul funziona a priori.

In primis, delle sillabe che iniziavano in */dj/- sono mutate, per palatalizzazione causata proprio dalla semivocale, in un suono palatale. Il cambiamento è riflesso pure nella grafia, che mostra anche la perdita conseguente della semivocale (la vocale "i" invece resta). Lo stesso fenomeno avviene pure con la stessa consonante in versione aspirata. Accanto all'hanja, viene indicata l'eventuale versione semplificata usata nella Repubblica Popolare Cinese.

In alcuni hanja, la pronuncia originale aveva un dittongo che iniziava con la semivocale */j/-, poi sparita dalla pronuncia e grafia.

Alcune sillabe iniziavano con un colpo di glottide/stacco glottale, indicato con il jamo ᅙᅠ. Oggi è caduto, sostituito con ᄋ, indicante l'assenza di suono.

In Coreano Medievale, alcune sillabe iniziavano con il jamo ᅀᅠ, che presumibilmente indicava il suono fricativo sonoro */z/ (se si pronunciava sempre così anche davanti alla vocale /i/ e alla semivocale /j/, vuol dire che non si palatalizzava in */ʑ/). Si trovava anche in cluster. Oggi queste sillabe iniziano con ᄋ e in cinese moderno iniziano con R-, derivato da un suono nasale palatale */ɲ/, o si pronunciano "ER", sillaba derivata sempre dallo stesso suono. Il suono resta in dei dialetti coreani defonologizzato in /s/. Si indicano 5 esempi e una serie ordinata in base alla chiave di lettura di altre sillabe che sono state colpite dalla caduta di questo suono.

銳 (doppia pronuncia) è 예 (태) (putonghua: rui4, dui4) ma non iniziava in Primo Cinese Medio con *ny- (giapponese: えい ei, だい dai; in vietnamita ha una pronuncia semi-irregolare e ingannevole, nhuệ, duệ, đoái); idem 容 (용), giapponese ゆう yū, よう yō.

橈 (요 + 뇨) non aveva *ny- ma *nr- retroflessa, mentre 襄 iniziava per *s- (putonghua xiang1, cantonese soeng1, Amoy hokkien siong, giapponese しょう shō, vietnamita tương) ma come chiave di lettura ha *ny-.

檽 inizia per *ny- se si tiene in considerazione la pronuncia in putonghua "ruan3" (indica il Loto di Sant'Andrea, che produce un frutto dall'aspetto simile all'uva passa); la seconda è "nou4" (indica un tipo di albero nei testi antichi); una terza pronuncia, "ru2", apparentemente non ha equivalenti in coreano e indica i piccoli assi di legno che sorreggono il tetto di un edificio (梁上短柱).

In alcuni hanja in cui era presente la vocale arae-a, oggi è mutata perlopiù in /a/. Il suono è presente pure in dei dittonghi conservativi (oggi in cantonese non variano, siccome si pronunciano "oi"). In altri hanja, la vocale ㅡ si è trasformata in ㅜ. Altri caratteri ancora avevano direttamente come vocale la arae-a.

Riguardo al vietnamita, l’alfabeto latino è stato introdotto dai missionari europei e sistematizzato nel 1651 da Alexandre de Rodhes (1591-1660), un missionario gesuita francese che ha anche scritto un dizionario di vietnamita. In quel periodo, c’era il vietnamita medio (Middle Vietnamese), di cui è stata ricostruita la pronuncia.

Alcune lettere hanno una diversa pronuncia da quella standard (lo standard sarebbe Hanoi (河内 in caratteri chu nom), ma nel sud, a Saigon (se il nome ha un'origine sino-vietnamita, un modo di scrivere è 柴棍), o Ho Chi Minh City (Thành phố Hồ Chí Minh, "城鋪胡志明"), ce n’è un altro: S era */ʂ/ (resta così nella pronuncia meridionale; i suoni retroflessi furono introdotti per l’influsso del cinese);
X, oggi /s/, era */ɕ/, come se fosse pinyin;
KH, oggi /x/, era */kʰ/;
TR era */ʈ/ (resta simile nel sud, perché è /ʈ͡ʂ/), che rende anche il medesimo suono nel cinese medio in versione sorda e sonora */ɖ/ e anche */ʈ͡ʂ/: si assimilavano tutti in */ʈ/ vietnamita, oggi ʈ͡ʂ/ nel sud;
D era */ð/ fricativa interdentale sonora, oggi approssimata a /z/ nel nord. Le sillabe che in vietnamita hanno questo suono in cinese mandarino iniziano con Y-.
G era un suono fricativo */ɣ/, che si palatalizzava nel caso "GI" */ʝ/ e simili (oggi si palatalizza ulteriormente in /z/); si trova in sillabe che in cinese mandarino iniznao con J- derivato da palatalizzazione dal Primo Cinese Medio;
PH era /pʰ/ così come scritta e oggi è /f/ (una simile mutazione in /f/ è avvenuta anche in bengali). Tutti i prestiti cinesi che in cinese medio avevano *pʰ- quindi nel vietnamita non odierno conservavano questa pronuncia. Il suono bilabiale aspirato è ancora pronunciato da alcuni parlanti nel nord del paese, altrimenti si può sentire come un suono fricativo, cioè una sorta di "f" soffiata, /ɸ/.
Il suono P- /p/ è presente solo in prestiti. Comunque, la *p- del cinese medio diventa un'odierna /b/, che conserva anche la *b-. Non c'è anche distinzione tra *k- e *g- del cinese medio perché /g/ in vietnamita non esiste: diventano entrambi /k/ sorda. Non c'è mai stata distinzione tra aspirazione sorda *x /h~x/ e sonora *h /ɦ~ɣ/ del cinese medio: in vietnamita sono tutte e due sorde /h/. Al contrario, c'è distinzione tra */t/- e */d/-. A parte l'ultimo caso si può concludere che, nel distinguere tra occlusiva sorda e sonora, il giapponese fa confusione, il coreano non fa distinzione perché esiste un'unica versione di consonante occlusiva non aspirata e il vietnamita le rende tutte con un'unica versione.
R non in cluster era /ɹ/ (nel sud è /ʐ/, abbastanza simile; questo suono è identico alla R- in pinyin).
Esisteva poi una "b" in stampatello con uno svolazzo in basso, pronunciata */β/ e che oggi converge con la lettera V /v/, che però in passato era /w/: il suono /v/ in vietnamita medio non esisteva. Quindi, c’erano due lettere e due suoni distinti, oggi diventati un solo suono rappresentato da un'unica lettera (quindi da V si può ricostruire un’antica /w/ oppure /β/, che in vietnamita arcaico, lingua non attestata perché senza alfabeto e dizionari in cui si spiega la pronuncia, era non fricativa ma occlusiva */p/ o */b/). Il suono */β/ comunque non appartiere al lessico sino-vietnamita.
In vietnamita non esistono i suoni */t͡s/ - */d͡z/ e */t͡sʰ/ del cinese medio: si approssimano in /t/ e /tʰ/, da fricativi a occlusivi dentali.
In vietnamita, molti suoni palatali del cinese medio (*/ɕ/, */ʑ/ e */d͡ʑ/) sono diventati /tʰ/. Gli ultimi tre, sono rispettivamente */t͡ɕ/ > /c/, */t͡ɕʰ/ > /ɕ/, e */ɲ/ > /ɲ/, invariato. Il suono /c/, che in vietnamita si scrive "ch" ed è anche a fine parola, si pronuncia come una /k/ che sporge in avanti, individuabile se si pronuncia alla massima velocità "ke-ki-ke-ki-ke-ki-ke-ki". "Ch" /c/ non va confuso con /k/, scritto "c"-, "k", "q"(u).
Nelle finali, c’erano anche il colpo di glottide finale, la –s e la -h, poi spariti. La loro sparizione ha condizionato il sistema tonale.
I sinogrammi sono stati adottati molto tempo prima del vietnamita medio (vietnamita antico/Ancient Vietnamese), in cui sono nati tutti e sei i toni e, ancora prima, vietnamita arcaico/Archaic Vietnamese, iniziato nel X secolo e finito nel XV). Queste varietà tuttavia non si riescono a ricostruire, mentre invece si riesce a ricostruire il vietnamita medio, il proto-vietnamita (dal VII al IX secolo, senza i sinogrammi) e il pre-vietnamita, una lingua detta "Viet-Muong" che ha originato sia il proto-vietnamita sia la lingua Muong.
Il vietnamita medio poteva anche avere tre cluster a inizio sillaba, mentre oggi non ne ha più perché si sono semplificati in un unico suono, convergendo con quelli già esistenti. Per la precisione, */tl/ converge oggi in TR */ʈ/ (in cui converge anche il medesimo suono nel cinese medio */ʈ/ e */ɖ/), */ɓl/ converge in pronuncia meridionale in TR e */ml/, poi /mɲ/, si è oggi semplificata in /ɲ/.
Esisteva già in vietnamita medio /ɲ/-, invariato rispetto al cinese medio, e anche il suono /ŋ/ sia inizio parola (oggi scritto "ng"- o "ngh"-), sia come coda e inoltre -/ɲ/ poteva essere anche a fine parola (oggi, converge in /ŋ/ oppure, al sud, in /nʲ/).
Le sillabe che sono colpite dalla caduta di *mj- dal cinese medio al cinese moderno sono spesso colpite dallo stesso fenomeno anche in vietnamita. Mentre in cinese oggi iniziano con /w/-, in vietnamita iniziano con /v/-. Raramente hanno una doppia versione in cui si preserva la /m/-.
Le finali del cinese medio *-n e *-m sono rimaste invariate, mentre *-ng può conservarsi o mutarsi nell'odierno -nh */ɲ/, che oggi si pronuncia */ʲn/ nel meridione. Gli stop del cinese medio *-p e *-t tendono a conservarsi, mentre *-k si trascrive oggi -c, oppure è diventato -ch (-/ʲk/ nel nord; -/t/ nel sud, molto diverso). Di contro, il colpo di glottide a inizio sillaba si è perso o, se presente, non si trascrive.
Qualora si desideri anche pronunciare l'odierna modulazione tonale, si può leggere il diacritico sopra (o sotto, in un caso) le vocali. I toni sono sei e sono qui spiegati prendendo come punto di partenza la pronuncia meridionale (questa varietà è più conservativa in suoni e più precisa nella differenziazione delle lettere). Innanzitutto, senza forzare la voce, bisogna dividere la propria tessitura vocale in tre registri: acuto, medio, grave. Se non si trova nessun segno, è un tono piatto nel registro medio e assomiglia al primo tono del putonghua, traslato nel registro medio (ex. "ba"); se c'è l'accento acuto è un tono crescente dal registro medio a quello acuto, come il secondo tono nel putonghua (ex. "bá"); se c'è uno svolazzo piegato sopra la vocale, dal registro medio si scende e risale sempre nel registro medio (ex. "bả"), quasi a ricordare una versione monca del terzo tono del putonghua e il suo diacritico ruotato; se c'è un accento grave, è un tono decrescente che dal registro medio si scende al grave (ex. "bà"), quasi a ricordare una versione monca del quarto tono del putonghua; se c'è un punto sotto la vocale, è un tono crescente cupo dal registro grave al registro medio (ex. "bạ"), che si può immaginare come una traslazione del secondo tono del putonghua in un registro più basso; il punto messo in basso sembra suggerire di partire da un'intonazione bassa. L'ultimo tono è il più interessante perché, nella pronuncia curata, coinvolge il colpo di glottide/stacco glottale/glottal stop, in cui si serra la valvola che si ha in gola e si emette un colpetto di tosse che lo spezza in due parti: è il tono crescente glottalizzato. Per la precisione, quando si vede un tilde sopra la vocale, si intona la vocale grossomodo nel registro medio, dopodiché si interrompe il flusso di voce serrando la glottide e, nello stesso momento in cui si emette il colpo di glottide, la vocale è subito pronunciata e intonata nel registro acuto (ex. "bã" ˦ˀ˥). L'andamento a zig-zag del tilde indica come sia spezzato in due parti. Il tono si modula sempre sulla vocale che ha il diacritico.

Un’utile fonte da cui partire per conoscere e approfondire il vietnamita moderno è proprio il già citato dizionario pubblicato nel 1651 dal gesuita francese Alexandre de Rhodes, detto "Dictionarium Annamiticvm, Lusitanvm et Latinvm". Come spiega il titolo, è in vietnamita, portoghese lusitano (europeo, non brasiliano o mozambicano) e latino. Il dizionario contiene anche le parole aventi i tre cluster indicati sopra.

Se si sa leggere il yue (廣東話 Gwong2dung1waa2; varietà standard prestigiosa di Hong Kong), si possono fare analisi, ricostruzioni e paragoni usando anche la versione attuale di questo celebre e prestigioso dialetto di famiglia Yuè (粵語 Jyut6jyu5), che peraltro ha la grande peculiarità di preservare i tre stop senza rilascio di suono a fine sillaba. Riguardo a questo e altri aspetti, è più conservativo rispetto al cinese moderno e assomiglia di più al cinese medio. Questo stesso dialetto viene anche usato nella ricostruzione del Primo Cinese Medio, siccome il Proto-Yue discende direttamente da esso. Questo paragrafo offre un'introduzione sommaria alla sua fonetica per poterlo integrare nei paragoni e/o poterlo imparare.

Se si fa analisi e comparazione filologica della fonetica oppure si studia verticalmente la lingua su grammatiche e dizionari, bisogna necessariamente fare affidamento su un sistema di traslitterazione che comprenda anche i toni, un "pinyin cantonese" alla stregua di quello inventato per romanizzare il putonghua. Ne esistono vari, elaborati nel corso degli anni. Qui si prende come punto di partenza la traslitterazione Jyutping (粤拼), piuttosto comoda ed elaborata successivamente al sistema Yale e Sidney Lau.

Le consonanti al 90% non variano rispetto al pinyin e viceversa: i suoni B, P, D, T, G, K, H, L, M, N, Z, C, S, F e NG non cambiano.

A fine parola ci possono essere i suoni –NG e –N, come in cinese mandarino, ma in più si reperisce ancora la –M insieme agli stop senza rilascio –P, -T, -K (ex. JIP, JIT, JIK, JIN, JIM, JING). All’inizio di una sillaba che inizia per vocale, anche se non c’è segnato nulla, alcuni linguisti nei loro studi indicano la presenza di un colpo di glottide, altri ancora indicano che c’è uno zero-onset ("iniziale-zero").

In cantonese, il suono NG- può ancora trovarsi a inizio sillaba e addirittura "NG" e "M", siccome sono anche due sonanti oltre che due consonanti, sono già due sillabe complete e a sé, dotate di significato e intonabili. Si pensi per esempio alle esclamazioni "…Mh. Capito.", "Mmh!? Cosa!?", "MMMH!!! CHE BUONOOO!!!". Le sonanti esistono anche in lingue come il sanscrito, il proto-indoeuropeo e il lituano; in quest’ultima addirittura si intonano /l/, /m/, /n/ e /r/. le sonanti si trovano pure in Hokkien e shanghainese. La trascrizione IPA delle sonanti avviene con un trattino sotto la lettera (non un punto spesso, per indicare la tensificazione): /m̩/ e /ŋ̩/.

A livello di sole lettere dell’alfabeto, le vocali e semivocali sono indicate dalle stesse lettere reperibili in pinyin: A, E, -I, O, -U, W-, Y-. A livello fonetico, in cantonese ci sono due vocali che hanno una durata molto breve e sfuggita a prescindere dall'intonazione.

Per tracciare un utile parallelismo con il Primo Cinese Medio, innanzitutto lo Yue/cantonese è un dialetto piuttosto conservativo insieme ai Minnan, all'Hakka e allo shanghainese. Ritiene infatti gli stop senza rilascio udibile di suono *-p, *-t, *-k dal Primo Cinese Medio, mentre in altri dialetti si leniscono in uno stacco glottale/colpo di glottide a fine sillaba (in putonghua cadono completamente, facendo sparire anche la categoria detta "tono entrante"). In più, ritiene tutte e tre le codine nasali *-m, *-n e *-ng. Riguardo a *-m, la corrispondenza è perfetta con il Primo Cinese Medio eccetto per una sola casistica, cioè il suono *-m dopo le iniziali *bj-, *pj- e *phj-, cioè le iniziali che oggi si sono lenite in /f/ in putonghua, cioè in un suono labiodentale (labiodentalizzazione): in questo caso, si assimila in /n/. Il suono originale si può recuperare dal dialetto Hakka. Quanto a -n e -ng, in apparenza la corrispondenza può sembrare un dettaglio futile, ma in altre famiglie dialettali queste finali possono confodersi tra loro e/o cadere e nasalizzare la vocale che le precede (e.g. Hokkien, shanghainese). Quanto alle consonanti iniziali, il cantonese non ha le palatalizzazioni che avvengono nel guanhua in varietà di Pechino e nel putonghua e ritiene buona parte delle iniziali *ng- dal Primo Cinese Medio. Gli altri dettagli invece lo differenziano: il cantonese, come tutti i dialetti meridionali, ha perso tutti i suoni retroflessi, nati in Primo Cinese Medio perlopiù per la presenza di un cluster a inizio sillaba. In più, l'iniziale *ny-, da cui deriva R- in puntonghua e la sillaba ER, cade completamente o muta in una semivocale /w/ (e.g. *nyi > ji /i/). In più, perde lo stacco glottale a inizio sillaba, caratteristica comune a tutti i dialetti (in Tardo Coreano Medio, l'alfabeto coreano lo indica con una lettera creata apposta e poi caduta in disuso). In più, talune aspirazioni *h-, *x- in Primo Cinese Medio e putonghua cadono in cantonese o mutano in /f/. Tutti questi tratti si notano già dal primo dizionario di cantonese scritto da un europeo, il dizionario di cantonese-inglese del reverendo Robert Morrison (1828). Il cantonese, stando alle stesse parole di Morrison e di altri tra i primissimi autori europei di dizionari di cantonese,già a inizio Ottocento stava perdendo la differenza tra i suoni dentali e palatali, cioè tra quelli che in pinyin sono J, Q, X e Z, C, S: oggi solo i suoni dentali sono pronunciati, pertanto vi convergono i suoni che prima erano palatali. Questi suoni si trovano invece distinti nel dizionario di Morrison (e.g. "S" vs "SH") in tre volumi e in pochissimi altri dizionari antichi (Morrison ha pure scritto la prima grammatica di cantonese nel 1815). Il cantonese non ha le stesse distinzioni molto precise tra consonante sonora-sorda-aspirata sorda e talune consonanti sonore e la loro controparte sorda: ha molti meno suoni, come anche tutti gli altri dialetti a eccezione del dialetto di Shanghai, che ritiene ancora le doppiette e triplette ben distinte di consonanti del Primo Cinese Medio. Il cantonese poi non ha i dittonghi *ju e *jo da cui deriva /y/ in putonghua, suono nato durante il Primo Mandarino. Tuttavia, il cantonese possiede questa vocale */y/ già dalla sua nascita. La proto-lingua, di cui esiste una ricostruzione del sistema vocalico di Karen Huang e raffinata da Georg Orlandi (entrambe del 2009), si chiama "Proto-Yue". Quanto ai nuclei di sillaba, quasi tutte le vocali e dittonghi hanno subito uno shift che segue un pattern, tale per cui l'aspetto è diverso da quello odierno (ma si può invertire lo shift già rispetto al puntonghua con la scoperta del pattern). Esistono delle ricerche che tentano di spiegare questo shift. L'individuazione di questi pattern permette anche una memorizzazione più veloce della pronuncia in questo dialetto (come anche quella in altri, e.g. il fatto che una nasale in una certa situazione cada a prescindere nasalizzando il nucleo di sillaba). Per capire alcune eccezioni, potrebbe essere utile consultare le pronunce in Primo Cinese Medio. Lo stesso shift vocalico può aiutare a individuare qualche dato della pronuncia in Primo Cinese Medio di una sillaba del cinese moderno standard e/o qualche irregolarità nascosta in un insieme di regolarità apparenti (e.g. trovare delle vocali anomale in un gruppo di sillabe aventi in putonghua la stessa vocale e una serie di trasformazioni regolari in cantonese ma irregolari in dei punti: in questi punti l'esito irregolare potrebbe derivare dalla pronuncia antica).

Quanto alla romanizzazione Morrison, qui si traccia una breve introduzione può essere d'aiuto a chi consulta questo dizionario, che ha i suoi pregi:

la /a:/ e /a:i/ vengono traslitterate con "a" e "ai".
Se è breve, usa un diacritico in alto tale per cui diventa "ă" (si ritrova pure nel dittongo "ăw" e seguita da stop). Ma /ai/, oggi "ai", viene trascritta "ei" e "ey" (delle ulteriori ricerche in dizionari e attraverso il Primo Cinese Medio e simili possono disambiguare se è solo una convenzione ortografica o se è un mutamento dalla pronuncia di inizio Ottocento). A volte, per la stampa difettosa, sembra di leggere "ä".
Il diacritico per distinguere la vocale breve e lunga si usa pure in "o" e "ŏ".
Le semivocali a fine sillaba sono traslitterate con "y" e "w" (l'attuale oi > oy; au > aw; ou > ow).
-"ui" diventa -"ooy".
-"eoi" /ɵy/ diventa -"uy" e viene descritta da Morrison come "un suono presente solo in cinese" (non spiega la pronuncia, reperibile invece oggi in IPA o descrizioni più o meno accurate o approssimate).
-"ey" diventa -"e": curiosamente, sembra che l'attuale semivocale cada (e.g. le attuali 皮 pei, 旗 kei < pe, ke. Un controllo al Primo Cinese Medio dovrebbe sbrogliare meglio la pronuncia originale)
La /œ/, stando alla breve introduzione di Morrison, è trascritta con "u", ma a volte nel dizionario si trova pure "eo", a sua volta confusionaria con lo jyutping (e.g. 香 heong, oggi "hoeng1").
C'è una differenza molto importante tra TS, CH e S, SH, oggi perduta (ma Morrison non trascrive le aspirazioni, tale per cui ipoteticamente la romanizzazione sarebbe ts'- e ch'- oppure tsh- e chh-).
Morrison non solo non trascrive le aspirazioni, ma nemmeno le modulazioni tonali. Con confronti con altre opere antiche e/o i dizionari moderni, il putonghua, gli altri dialetti e i rimari antichi, alcune di queste informazioni sono comunque recuperabili: si tratta sempre di fare ricostruzioni con il materiale già a disposizione.
Nelle parole con più sillabe, Morrison separa le sillabe non con spazi, ma con il trattino/hyphen.
Le consonanti sorde e aspirate vengono universalmente trascritte come "p, t, k, ts, ch", come se non avessero aspirazione. A queste si aggiungono "f, s, h, m, n, l".
Le codine nasali e gli stop a fine sillaba sono uguali a gran parte delle trascrizioni: -p, -t, -k, -m, -n, -ng.
"G"- a inizio sillaba indica la consonante nasale /ŋ/ (se a fine sillaba, la lascia -ng).
"Wu" viene trascritta "oo", mentre "ji" viene trascritta "ee": non ci sono dei cosiddetti appoggi ortografici come in jyutping e pinyin. In più, si nota come l'ortografia sia influenzata dall'inglese. Per fare altri due esempi "jin" viene dunque romanizzata "een"; "wui" invece diventa "ooy".
La "w; y" si usano invece per trascrivere le semivocali /w, j/ sia a inizio che fine sillaba, e.g. ying, yung, yok, yuk, yăw (oggi jing, jung, jok, juk, jau) e kwei (identica), ma non in "ai" (oggi "aai").
"e" aperta diventa "ay" (e.g. in 骑 ke4 > kay, 茄 ke2 > kay). Questa grafia ricorda vagamente la romanizzazione dell'hindi e il dittongo "ai" in lingua francese.
"iu" viene reso come "ew", e.g. 腰 jiu1 e 要 jiu3/jiu1 > "yew".
"Si" e "zi" vengono romanizzate "sze" e "tsze" e vengono descritte come "aventi un suono presente solo in cinese" (forse la vocale non era l'odierna /i/ ma assomigliava a /ɨ/ o /ə/ o era qualcos'altro di simile).
"Jyu" /y/ diventa "U", ma se seguita da stop -t diventa "Uet". /ym/ si rende come "Um". Possiede anche la versione con il diacritico "ŭ".
La sillaba /yn/ invece (oggi "jyun; -yun") viene romanizzata "une; -une": la vocale finale è un falso amico (curiosamente non la rende come "un").
"Joeng" viene resa -"Yaong" e.g. in 洋, 羊, 样, 养.
-"aau" viene resa come -"aou", con una vaga somiglianza non il francese (non è resa "aaw"). Morrison aggiunge che è lunga.
La sonante 唔 "ng2" viene romanizzata "Im", irriconoscibile e scollegata dalla pronuncia originale (se era già sonante, la "I" è solo una sorta di appoggio/sedia ortografica o qualcosa di simile). 五, oggi ng5 e anch'essa sonante, viene trascritto "Ing". Tutte le altre sillabe sonanti vengono rese in modo analogo.
太 taai3 curiosamente, invece di essere traslitterata "tai" secondo le informazioni/istruzioni a inizio dizionario, viene trascritta "tae", come se fosse coreano moderno (*/ʌi̯/ e */ai̯/ > /ɛ/). 今, oggi "gam1", viene resa "gum" forse per evoluzione della pronuncia, mentre 衣 in isolamento viene resa "e" invece che "ee" (Morrison poi spiega che a fine parola ha un allungamento vocalico, mentre in mezzo alla parola no: forse per questo la trascrive in una maniera nuova). 既 oggi "gei3", viene reso come "kay" (doveva essere "kei/key"). 行, oggi "hong4", viene trascritto "hang". 时, oggi "si4", viene resa "she" (dovrebbe essere "shi"). 心 (sam1) viene indicata come "sum". 四 (sei3) viene resa "sze", da cui si dovrebbe ottenere un odierno *si3. 人 jan4 diventa yŭn. Queste sporadiche diversità, se non sono errori, sono indicatori di una pronuncia oggi evoluta.

Le romanizzazioni dello shanghainese (il più prestigioso dei dialetti wu) sono principalmente tre: quella di Qian Nairong, professore all'Università di Shanghai e promotore del dialetto Wu, quella di un dizionario online di dialetto Wu e quella del Wikizionario (Wiktionary). A esse è affiancato l'IPA e una spiegazione dei numerosi suoni e dittonghi. La romanizzazione di Qian Nairong è una base di partenza insieme al pinyin (che già di suo è un sistema di latinizzazione di suoni cinesi ed è riciclabile in altre romanizzazioni), ma non trascrive alcuni stacchi glottali e numerose finali di sillaba. La seconda e la terza invece sono complete, ma solo la terza, quella del Wikizionario, ricicla il pinyin. Con tre lettere doppie, indica una consonante sonora, mentre con l'aggiunta della "h" indica l'aspirazione della consonante (il dialetto Wu infatti conserva le doppiette e triplette di suoni ben distinti in Primo Cinese Medio, cioè alcuni suoni sordi-sonori oggi non più distinti e alcuni suoni sonori-sordi-sordi con aspirazione).

Da un'osservazione dei suoni e di alcuni esempi (a loro volta estendibili tramite ricerche nei dizionari, fanqie e osservazioni di colonne di rimari), si nota innanzitutto che lo shanghainese è, come appena accennato, un dialetto conservativo riguardo alle consonanti a inizio sillaba, tuttavia non conserva i tre suoni retroflessi *tr-, dr-, trh- e la differenza tra -n e -nr retroflessa. In generale, perde tutti i suoni retroflessi del Primo Cinese Medio, come avviene pure in dialetto Yue. Di contro, restano in parte in putonghua. Contiene anche lui le sonanti, come il cantonese, cioè delle consonanti che fungono da vocale e sono intonabili: il cantonese/dialetto Yue ha "ng", mentre l'Wu ne ha due: "mm" e "ngg" secondo la romanizzazione del Wikizionario. Sono entrambi suoni nasali (il sanscrito e lituano possono avere altre tipologie di sonanti, presenti pure in Proto-Germanico e Proto-Indoeuropeo). Il dialetto Wu dopodiché non conserva le bilabiali *bj-, pj, phj, contrariamente al vietnamita antico e al coreano, siccome diventano /f/ e /v/. Il suono /v/ non è presente né in putonghua né in Primo Cinese Medio (ma è presente in Tardo Cinese Medio e si ritrova pure nella pronuncia non-standard del puntonghua di Dalian). Quanto ai suoni velari che in Primo Cinese Medio erano seguiti dalla semivocale */j/-, mentre nelle lingue sino-xeniche sono preservati come pure nel dialetto Yue/cantonese, in dialetto Wu si palatalizzano come avviene anche in putonghua e guanhua. Il suono *ng- resta preservato, ma di fronte a vocali e semivocali anteriori (/i, j/) si palatalizza in ny-, mentre in talune sillabe si trasforma in una sonante siccome cade tutto il resto della sillaba (in cantonese *ng- resta preservato in buona parte delle sillabe). L'antica iniziale palatale *ny- da cui deriva R- in putonghua viene preservata in svariate pronunce colloquiali, ma in quella colta e in alcune in cui non si conserva muta in "z" /z/ (il cantonese non la preserva, il coreano la mutava in */z/ con una lettera apposita poi caduta ma rintracciabile in incunaboli e cinquecentine, mentre il vietnamita le preserva. Il giapponese, nelle pronunce go-on molto arcaiche le preserva). Quanto alle sillabe "ER" in putonghua, che iniziavano proprio con *ny-, in shanghainese si pronunciano allo stesso modo del putonghua. L'iniziale *mj- si rintraccia ancora in shanghainese siccome è "m" accompagnata dalla lenizione più tarda "v" (sporadicamente invece muta in una semivocale arrotondata come in putonghua). La /m/ si ritraccia in cantonese, coreano e anche vietnamita e giapponese (insieme a doppie versioni con */w/ > /v/ in vietnamita e /b/ in giapponese). Quanto agli stop senza rilascio udibile di suono *-p, *-t, *-k, essi subiscono la stessa sorte dei dialetti settentrionali e del Primo Mandarino (khanato mongolo): si riducono infatti a uno stacco glottale a fine sillaba, ma sono preservati in vietnamita, coreano, dialetto Yue/cantonese, negli Hokkien (Minnan), in Hakka e sono ricostruibili dai kanji in giapponese.

Il dittongo *oj, talvolta trascritto "ai" nella romanizzazione del MinDict, si trascrive "e" e pronuncia /e/ lievemente aperta (questa mutazione ricorda vagamente il francese). Sempre ricordando il francese, il dittongo *au (e.g. gao1 高, che in cantonese muta spesso in "ou") si contrae in "au" /ɔ/. Quanto alle tre codine nasali a fine sillaba *-m, n, ng, la *-m si assimila nelle altre code nasali, che al loro volta si scompigliano unificandosi quasi tutte in -ng o cadendo e dando luogo a una nasalizzazione come in francese (nelle romanizzazioni, le nasalizzazioni si segnalano ortograficamente non con i tildi, ma con lettere come "n, ng"). A complicare ulteriormente il quadro, si aggiunge come terza e ultima possibilità una nuova nasale analoga in vietnamita, la -/ɲ/, che in vietnamita sorge per una palatalizzazione di -/ŋ/ in quanto preceduta da vocale anteriore e si scrive con "nh" (in shanghainese ha una pronuncia fissa in determinate sillabe, tale per cui una romanizzazione come "nh" o "ny" non è strettamente necessaria, e sorge anch'essa per una palatalizzazione). In shanghainese compaiono solo dittonghi, quindi tutti i trittonghi in cinese antico e moderno si riducono in dittonghi. Dall'evoluzione di dittonghi e trittonghi nascono nuove vocali non presenti in putonghua (un fenomeno simile avviene pure in cantonese). Infine, lo stacco glottale viene segnalato a fine sillaba con una consonante che, siccome appare a fine sillaba, si pronuncia a priori come stacco glottale e può essere "k", "h" e "q" (quest'ultima è presa dalla romanizzazione del Wikizionario). Lo stacco glottale a inizio sillaba (esisteva solo prima di vocale o semivocale) non viene conservato (ma in coreano antico veniva trascritto con una lettera apposita, poi caduta).

L'Hokkien non ha consonanti retroflesse, come avviene anche in shanghainese, cantonese e Hakka (in generale, è una caratteristica tipica dei dialetti meridionali). Sono perse dunque tutte le retroflesse in putonghua e in Primo Cinese Medio, in cui per la prima volta sono apparse a partire perlopiù da cluster dell'Old Chinese.

Ritiene però *-m come il cantonese, tuttavia in dei casi cade e dà luogo a una nasalizzazione (vedi avanti). Ritiene poi i tre stop senza rilascio udibile di suono *-p, *-t e *-k, tranne in dei casi in cui appena dopo la vocale si riducono in degli stacchi glottali (cosa che invece avviene in toto in shanghainese, dialetto di Fuzhou e nelle varietà dialettali settentrionali).

Le palatalizzazioni del cinese moderno standard, influenzato dalla varietà di pronuncia del dialetto di Pechino non sono avvenute, come anche in cantonese (in shanghainese avvengono svariate palatalizzazioni, ma conserva bene molti suoni oggi persi insieme alla distinzione sonora-sorda-sorda aspirata).

Lo stacco glottale in Hokkien non deriva solo da uno stop lenito, ma si trova pure dopo le sonanti e vocali nasalizzate, ma questi due casi non vengono qui trattati.

Le nasalizzazioni in Hokkien avvengono per la caduta della codina nasale in Primo Cinese Medio *-m, *-n e *-ng, ma non avviene in quasi tutte le sillabe, come pure in shanghainese: alcune si nasalizzano e vedono la caduta della codina, ma altre conservano la codina (ma in shanghainese, laddove sono ritenute, danno luogo a un gran numero di assimilazioni, palatalizzazioni e confusioni: il cantonese è molto preciso, mentre l'Hokkien è meno confusionario). Per dare dei veloci esempi, una sillaba con uⁿ è 张 zhang1, con oⁿ è 翁 weng1, con iⁿ è 圆 yuan2, con eⁿ è {{{2}}} sheng1, con aⁿ è 衫 shan1 (< *-m; ha pure la versione in -m, che è letteraria ed è conservativa siccome in quella vernacolare avviene la nasalizzazione); o͘ /ɔ/, vocale aperta arrotondata, non ha nasalizzazioni.

Quanto all'odierna sillaba "ER" in putonghua, che corrisponde pure in shanghainese, in Primo Cinese Medio deriva da una sillaba che iniziava con *ny- e finiva con /e, i/. In Old Chinese questo suono non esisteva e deriva da una palatalizzazione di *n- (eventuali cluster consonantici sono poi tutti caduti: il Primo Cinese Medio non ne ha). In Hokkien il suono diventa /d͡ʑ/ (senza contatto tra organi a Kaohsiung; alla lontana, assomiglia alla */z/ del Tardo Coreano Medio, usata proprio per trascrivere e adattare la consonante *ny-). L'esito in Hokkien è identico alle pronunce recenti dei kanji in giapponese (ma nelle pronunce go-on, più antiche, è /nʲ/). In Hokkien, sporadicamente come alternativa in delle varietà di pronuncia si trova /n/, che invece è la pronuncia più antica e conservativa e da cui si può ricostruire proprio *ny-. Alcuni esempi sono: 二 jī, 而 jî 耳 hī (jíⁿ a Zhangzhou e ní a Quanzhou), 爾 ní (jíⁿ s Zhangzhou), 兒 jî (pronuncia di Zhangzhou. Iniziava però in *ng- in Old Chinese, quindi si nota una palatalizzazione in Hokkien e Primo Cinese Medio).

Quanto all'odierna R- in putonghua, deriva anch'essa da *ny- in Primo Cinese Medio, derivata da una palatalizzazione di *n- dall'Old Chinese. a parte le pronunce in cui muta in /l/, per esempio quella di Amoy, Quanzhou e Taipei, in quelle semi-conservative ha nuovamente la variante /d͡ʑ/ (a Kaohsiung senza contatto tra organi): si allinea alle sillabe che oggi sono "ER" e alla soluzione delle pronunce giapponesi successive alla go-on. In casi sporadici in Hokkien è /n/, cioè lo stesso suono dell'Old Chinese). Una carrelalta rapida di esempi è: 日 ji̍t (Zhangzhou, Kaohsiung), 入 ji̍p, 如 jî (Zhangzhou) e jû (Kaohsiung), 潤 jūn (Kaohsiung), 人 jîn (Zhangzhou, Kaohsiung), 仁 jîn (Zhangzhou, Kaohsiung), 任 jīm (Zhanghou, Kaohsiung), 然 jiân (Zhangzhou, Kaohsiung), 燃 jiân (Zhangzhou, Kaohsiung), 讓 jiōng (Kaohsiung) e jiāng (Zhangzhou) e straordinariamente niō͘ (Zhangzhou; Tainan a Taiwan), 壤 jióng (Kaohsiung) e jiáng (variante a Zhangzhou e Taiwan; a Taipei più di preciso è lióng), 扔 jêng (Zhangzhou, Kaohsiung), 仍 jiông (Zhangzhou), 軟 nńg (seconda pronuncia a Quanzhou e Amoy) e núi (seconda pronuncia a Zhangzhou), 肉 jio̍k (Zhangzhou, Kaohsiung).

Quanto invece alla /f/ in putonghua, deriva notoriamente dalle bilabiali *bj-, pj-, phj in Primo Cinese Medio, che a loro volta derivano da simili suoni in Old Chinese, in cui non esisteva /f/ (nasce insieme a */v/ durante il Primo Mandarino). Ebbene, le antiche *bj-, pj-, phj- (e simili suoni bilabiali in Old Chinese, non seguiti da semivocale e eventualmente preceduti da un'iniziale blandamente attaccata e poi caduta) in Hokkien si leniscono in /h/ (come in giapponese moderno), ma molti altri caratteri straordinariamente hanno una o più pronunce alternative che hanno la bilabiale sorda /p/ anche con aspirazione. Tutte queste pronunce sono conservative, si avvicinano al coreano e al vietnamita e sono pronunce vernacolari 白 (l'altra in /h/ è letteraria 文. La stessa separazione in lettura bai e wen, con la prima più conservativa, è presente pure in shanghainese). L'Hokkien non ha il suono e lettera /f/, come in putonghua e cantonese. Dalle pronunce vernacolari dei caratteri con doppia pronuncia pertanto si ricostruisce un suono bilabiale. Una carrellata di esempi è: 髮 , hoat; 發 puh / hoa̍t / hoat; 非 hui. 飛 pe / hui / hoe; 反 péng / púiⁿ / pán / páiⁿ / hoán; 凡 hoân / hâm / hoān; 方 hng / png / puiⁿ / hong; 放 hòng / pàng / hàng; 分 pun / hun; 風 hong / hoang; 豐 phong / hong; 否 hóⁿ / hó͘ / hió; 弗 hut; 福 hok; 富 hù / pù.

Quanto alle sillabe che in Primo Cinese Medio iniziavano in *mj- (e *m- in Old Chinese, sporadicamente preceduto da una consonante), mentre in cantonese restano con il suono /m/, in putonghua si sono lenite per poi culminare in /w/ semivocalica per formare un dittongo. In Hokkien, semi-conservativo, si lenisce e modifica in /b/: 未 bē, 味 bī, 晚 boán (pronuncia vernacolare mńg e múi, più conservativa), 亡 bông, 忘 bōng, 望 bāng e bōng, 網 bāng. Anche il giapponese, che ha in dei casi la doppia versione, presenta /b/ (mentre in vietnamita presenta /v/ < */w/); la versione conservativa ritiene /m/. Invece lo shanghainese vernacolare, il coreano, il cantonese e l'Hakka sono conservativi (/m/). Il Teochew, un Minnan che ha un altro sistema di romanizzazione (Peng'im), si comporta in modo analogo agli Hokkien e molto sporadicamente presenta pure /m/, da cui si ricostruisce il suono originale, e.g. 晚 mung2 /muŋ⁵²/, 萬 mog8 /mok̚⁴/ (se usato come cognome), 問 mung7 /muŋ¹¹/, 吻 mug4 /muk̚²/.

Quanto a *ng- in Primo Cinese Medio (deriva dallo stesso suono in Old Chinese/OC o da una /G/ o /q/, cioè una "g" di gatto sonora pronunciata con la radice della lingua contro il velo palatino/la parte morbida del palato, cioè la zona uvulare, e una "c" di cane sorda pronunciata alla stessa maniera e come in arabo moderno), da suono nasale diventa /g/ come in giapponese: conserva in parte la presenza di una occlusiva/plosiva /G/ o /q/ oppure, in molti altri casi, sembra essere un'approssimazione di *ng-, la stessa dei giapponesi. In un numero minore di casi, conserva *ng-, specialmente nella varietà di Zhangzhou: da questa pronuncia si ricostruisce *ng- antico, presente sicuramente in Primo Cinese Medio. Una carrellata rapida di esempi è: 牙 gê (Zhangzhou: gâ. OC *m-ɢˤ<r>a), 芽 gê (Zhangzhou: gâ. OC *m-ɢˤ<r>a), 颜 gân (OC *C.ŋˤrar), 我 góa e alternativa ngó͘ (OC *ŋˤajʔ), 饿 gō (Quanzhou: ngō͘ . OC *ŋˤaj-s), 艾 ngāi (OC *C.ŋˤa[t]-s), 研 gián (Taipei: ngái. OC *[ŋ]ˤe[r]), 鱼 gû (pronuncia alternativa di Amoy. OC *[r.ŋ]a), 玉 gio̍k (Zhangzhou. OC *[ŋ](r)ok), 言 gân (Zhangzhou. OC *ŋa[n], *ŋa[r]), 语 gú (Amoy, Taipei. OC *ŋ(r)aʔ), 牛 ngiû (Zhangzhou. OC *[ŋ]ʷə), 元 goân (OC *[ŋ]o[r]), 原 goân (OC *N-ɢʷar), 月 goa̍t (OC *[ŋ]ʷat), 吴 ngô͘ (OC *ŋʷˤa), 五 (pronuncia alternativa a Zhangzhou e Amoy: ngó͘. OC *C.ŋˤaʔ), 午 ngó͘ (Amoy, Zhangzhou. OC *m-qʰˤaʔ), 瓦 góa (OC *C.ŋʷˤra[j]ʔ), 外 gōa / gōe (OC *[ŋ]ʷˤa[t]-s). In Teochew (è un Minnan, ma non è Hokkien) si trova sia /ŋ/- che /g/- grossomodo in eguale misura (una terza possibilità rara è la mutazione in aspirazione /h/, tale per cui non c'è nessun contatto con organi, a cui si affianca). Anche il Teochew ha la divisione in pronuncia letteraria e vernacolare. Per esempio, 艾 ha hian7 / ngai6 (/hĩã¹¹/, /ŋai³⁵/). La seconda, più conservativa, è quella letteraria (quella vernacolare cioè è meno conservativa). Un altro esempio di pronuncia doppia in base al registro è 我, ua2 / ngo2 (/ua⁵²/, /ŋo⁵²/): la seconda, più conservativa, è sempre quella letteraria, il che lascia presumere una tendenza inversa rispetto allo shanghainese e Hokkien, in cui la pronuncia vernacolare di contro è la più conservativa (tranne nel caso di -m in Hokkien: è letteraria ma conservativa).

Lo specchietto contiene un riassunto di varietà di cinese antico e lingue sino-xeniche con il nome in lingua straniera. La scansione del vietnamita è presa (e in parte ricostruita) dalla classificazione di Henri Maspero in "Études sur la phonétique historique de la langue annamite", 1912. Le date di da Maspero non contengono secoli di inizio e fine o una scansione basata su anni simbolici, ma indicano un momento temporale, un secolo, o offrono informazioni fugaci da cui ricostruire una scansione rudimentale di periodi. La scansione in periodi è stata ricostruita in base ai dati di Maspero e ai dati storici fondamentali aventi la data precisa intrecciati insieme, ma viene rimarcato che è approssimata tenendo il tildo. Quanto alle scansioni di coreano, Lee-Ki Moon non introduce ulteriori divisioni in Coreano Moderno e Coreano Contemporaneo, ma si limita a descrivere il "Coreano Moderno". Le scansioni delle proto-lingue sono le più incerte.

(sono esclusi dalla trattazione il Mancese Settecentesco e Moderno e il mongolo (proto-Mongolo, Mongolo Medio, Mongolo Classico, Mongolo Moderno) per motivi di coerenza, i dialetti minori cinesi e i dialetti delle lingue sino-xeniche, e.g. Dialetto di Okinawa in Giappone)

Nella seguente tabella, i Radicali Kangxi sono ordinabili in base al pinyin o alla pronuncia nel dialetto cantonese in base a un pulsante apposito. In più, si possono fare paragoni tra la pronuncia cinese attuale e quella in Primo Cinese Medio in base alla ricostruzione del Guangyun di Baxter (2011), Laddove il carattere è assente, non è stata indicata la pronuncia. Oltre al Primo Cinese Medio, sono presenti la lettura cinese in lingua coreana, vietnamita e giapponese (con derivazione storica) Go-on e Kan-on (laddove esistono più pronunce, si è optato per scegliere quella più vicina al cinese medio; per esempio, la pronuncia tarda Tang e Song 唐宋音 e le pronunce slang sono state escluse). Quella giapponese è affiancata dalla trascrizione in caratteri romani (roomaji) con il sistema Hepburn. Le vocali lunghe sono state trascritte seguendo l'ortografia invece della pronuncia, siccome la -u finale è ben distinta (e da essa si risale a un dittongo o a una coda nasale velare in cinese). La pulsantiera si può usare anche per aiutarsi a fare comparazioni con il Primo Cinese Medio con delle caratteristiche a inizio sillaba e fine sillaba (per le seconde, è stata impostata una colonna ad hoc). La romanizzazione in cantonese è stata effettuata con il sistema Jyutping. I Radicali Kangxi sono affiancati da tutte le loro variazioni, versioni semplificate e dalle variazioni rintracciabili nei kanji giapponesi e negli Han tu vietnamiti.

La seguente tabella non esaustiva contiene svariate opere per osservare e studiare la pronuncia antica delle lingue sino-xeniche con nome dell'opera, traduzione del nome in inglese (laddove reperibile o eseguibile, siccome molte opere hanno titoli con riferimenti complessi), anno di scrittura e/o pubblicazione/i e le lingue contenute. I dizionari di cinese ottocentesco che non riproducono la pronuncia di Pechino sono classificati ancora sotto "Mandarino Medio". La tabella parte dal Primo Cinese Medio e dalle opere nelle lingue sino-xeniche che contengono i sinogrammi e le pronunce. Include anche dei dialetti meridionali conservativi con i primi documenti che li attestano, spesso opere di missionari e/o colonizzatori. Viene interrotta all'anno 1918. Molte delle opere sono state digitalizzate dai musei o da Google Books e sono scaricabili e consultabili online in formato PDF. La digitalizzazione non solo rende questi testi rari e fragili consultabili facilmente per lettori di ogni tipo (da esperti a curiosi), ma permette di farli circolare ampiamente, stimola l'interesse verso di essi e li salva dal deperimento totale siccome sopravvivranno in forma digitale.

Alcune opere sono escluse, e.g. i diari in coreano e i romanzi vernacolari coreani come il 春香傳 (the Tale of Chunhyang. Anche le raccolte coreane di poesie di genere sijo (時調) sono escluse. Sono pure esclusi lavori che parlano di Idu, come il 羅麗吏讀 나려이두 (1789), 典律通補 전율통보 (fine Settecento) e 儒胥必知 유서필지 (fine Settecento, anonimo).

Anche i lavori nella scrittura antica giapponese, come il Man'yooshu, sono esclusi. Anche opere giapponesi come i romanzi e poesie haiku sono esclusi: senza il furigana nell'opera antica, non si ricava la pronuncia.

Lo stesso avviene in vietnamita: solo dall'introduzione dell'alfabeto latino nella varietà portoghese da parte dei missionari si hanno informazioni sulla pronuncia grazie ai dizionari dei missionari, eccetto dei dizionari cinesi antichi che danno una resa fonetica approssimata delle parole. Lo stesso è avvenuto per la lingua giapponese e coreana.

Sono poi esclusi primi frammenti di scrittura di sinogrammi (ossa oracolari, vasi di bronzo Zhou e simili oggetti) ed è escluso allo stesso modo l'Old Chinese 下古汉. Dalle opere antiche in Wenyan 文言 si può comunque studiare la grammatica, si pensi ad esempio allo Shijing 诗经, Yijing 易经, Daodejing 道德经, Lunyu 论语, Shujing 书经, Mengzi 孟子, Hanfeizi 韩非子, Zhuangzi 庄子, Liezi 列子, Shiji 史记, Liji 礼记, Chunqiu 春秋, Zhongyong 中庸, Daxue 大学, Zuo Zhuan 左转, Nvjie (女诫 di Ban Zhao), Sunzi (孙子), Mozi (磨子), Zhanguo Ce (战国策), Hanshu (汉书); le informazioni sulla pronuncia, siccome i rimari risalgono al Primo Cinese Medio, sono più problematiche pure se presenti (e.g. nello Shuowen Jiezi) o ricostruibili da alcune opere che mostrano delle presunte rime in dei punti.

Anche i primissimi dizionari di Old Chinese sono esclusi (e.g. Erya 尔雅 che forse intendeva dire 迩雅, Fangyan 方言 che tratta pure le varietà regionali, Shuowen Jiezi 说文解字). Dal Fangyan si ricostruisce il Cinese degli Han Orientali o Tardo Cinese Han (Eastern Han Chinese), intermedio tra Old Chinese e Primo Cinese Medio e su cui hanno lavorato Paul Serruys e Weldon Coblin, ma non viene qui trattato.

Pure le varietà più arcaiche in assoluto di lingua come l'Old Korean, l'Old Japanese e il Vietnamita Arcaico non sono trattate perché non in tema o poco documentate (e.g. tavolette di legno mokkan [giapponesi] e mokgan [coreane] 木簡) e difficili da ricostruire.

Uno studioso di varietà storiche di cinese può avere un qualche interesse nella filologia e paleografia dei sinogrammi sia per lo studio delle stesse varietà storiche sia perché è un argomento che riguarda la storia e filologia della lingua a tutti gli effetti. Lo stesso cinese medio, essendo scritto con i sinogrammi, presuppone una conoscenza di come funzionino (ma questo presupposto si può estendere a tutta la lingua cinese e alle lingue sino-xeniche).

Il cinese antico è indissolubilmente legato alla prima attestazione della scrittura cinese (a partire dal 1250 a.C. circa, periodo Shang), ragion per cui la lingua e la scrittura come periodo sono strettamente collegate. I caratteri in origine sono nati per scrivere sulle piastre delle tartarughe e sulle scapole di bue messe a crepare sul fuoco per effettuare predizioni sul futuro più o meno remoto. Dai primi caratteri attestati nelle ossa oracolari (periodo Shang e Zhou) e nei bronzi Shang e Zhou si vedono le versioni originali di molti caratteri diffusi sia in passato che oggi, da cui si può ricostruire la composizione (molti altri caratteri, comunque ricostruibili, sono attestati a partire dal periodo degli Stati Combattenti e periodo Qin e Han e in poi). Le versioni originali permettono di capire meglio la loro composizione, il disegno originario, come sono evoluti e, in dei casi, la pronuncia originaria. Pertanto il cinese antico/Old Chinese è il periodo da cui si parte a fare filologia dei sinogrammi (perlomeno quelli più antichi, come i radicali Kangxi), un'attività direttamente collegata alla paleografia, che a sua volta non è una disciplina isolata da altre come l'archeologia.

Quanto al periodo del Primo Cinese Medio, in questo periodo i sinogrammi assumono grossomodo l'aspetto dei caratteri tradizionali odierni. Questa grafia deriva dall’evoluzione della prima standardizzazione dei caratteri avvenuta durante il periodo Qin (Xu Shen, usando una grafia detta “Piccolo Sigillo”/Xiaozhuan) li descrive nello Shuowen Jiezi. Durante il periodo Tang, le ossa oracolari forse erano state dissotterrate per la prima volta ma i contadini, non capendo cosa fossero e come mai avessero dei segnetti misteriosi incisi sopra, le reinterravano. In un secondo momento, sono state dissotterrate e polverizzate per creare preparati di medicina tradizionale cinese, come avveniva per esempio nel periodo Qing. Il riconoscimento dei caratteri sarebbe avvenuto nel fine Ottocento. L’osservazione delle prime versioni (ossa e bronzi), dell’evoluzione nello stile del Piccolo Sigillo e dell’ulteriore evoluzione nella versione tradizionale (poi eventualmente semplificata nella metà Novecento) permette di capire meglio i caratteri e i loro componenti.

Un'opera da cui si parte a analizzare i caratteri è proprio lo Shuowen Jiezi 说文解字 di Xu Shen 许慎 (100 d.C., scritto in epoca Han, durante il periodo in cui si parlava il Cinese degli Han Orientali, una varietà intermedia tra il tardo Old Chinese/tardo cinese antico e il Primo Cinese Medio, fermo restando che il cinese parlato durante la Dinastia Jin, che precede il Primo Cinese Medio, è ancora in via di discussione). L'opera va letta con spirito critico siccome Xu Shen descrive perlopiù i sinogrammi secondo lo stile del Piccolo Sigillo (Xiaozhuan 小篆) e secondo la prima standardizzazione avvenuta nel periodo Qin. Non ha mai consultato le ossa oracolari del periodo Shang e Zhou (cioè le piastre di tartaruga e le scapole di bue incise e trapanate e mese sul fuoco a crepare per effettuare le piromanzie, dette anche plastromanzie e scapulomanzie) e non ha nemmeno consultato i bronzi Shang e Zhou (vasi, bacinelle, piccoli contenitori, specchi, pettini, bracieri...): entrambi non erano stati ancora diseppelliti, quindi i relativi corpora di caratteri (甲骨文 e 金文), di cui oggi esistono i dizionari, erano inaccessibili. Pertanto i caratteri analizzati non sono le proto-forme/versioni originali ma sono una standardizzazione che contiene già delle stilizzazioni fuorvianti, dei componenti aggiunti o delle disposizioni dei componenti alterate rispetto alla disposizione originale. Xu Shen in dei punti commette degli errori nell'interpretazione o nella suddivisione del carattere per indicare il carattere e la chiave di lettura per la pronuncia, che riflette la sua varietà di cinese (alcune varianti dei caratteri sono varianti popolari o dei rimaneggiamenti delle chiavi di lettura per riflettere dei cambiamenti nella pronuncia tra la prima fase del cinese antico/Old Chinese e il Cinese degli Han Orientali o le varietà del periodo Qin, periodi nei quali peraltro si sono coniati nuovi caratteri). L'opera di Xu Shen è stata arricchita con degli ottimi commentari che glossano il testo. Il più famoso è quello di Duan Yucai, scritto nell'arco di oltre 30 anni e pubblicato nel 1815 (periodo Qing) e di ottima qualità nonostante nemmeno lui abbia consultato le ossa e i bronzi. Alcune glosse correggono delle informazioni di Xu Shen o le arricchiscono. In generale, si evince che lo Shuowen Jiezi va letto e consultato con un sano spirito critico, nonostante i suoi pregi indiscussi. Per esempio, va affiancato alle versioni sulle ossa e sui bronzi, ai commentari, alle varianti dei caratteri (in cui abbastanza spesso restano cristallizzati degli elementi antichi o la disposizione originale dei componenti) e a degli studi paleografici e filologici (non etimologia folk o mnemotecnica) che si intrecciano con storia, archeologia e conoscenze basilari per esempio di tecniche di agronomia, se si pensa ad esempio alla coltivazione del grano, del riso e alla loro lavorazione (la derivazione etimologica delle parole a partire dai suffissi e prefissi morfologici dell'Old Chinese è un altro tipo di ricostruzione che a volte si può intrecciare con quella di stampo paleografico, cioè incentrata sulla grafia). Altre stilizzazioni trasformano dei componenti dei caratteri in dei falsi amici. A questo si aggiunge il fatto non secondario che i caratteri cinesi hanno subito una semplificazione nella metà Novecento, ragion per cui partire ad analizzare i caratteri dalla versione semplificata è un errore in partenza, come anche analizzarli basandosi sulla grafia riportata da Xu Shen laddove il carattere è attestato da secoli prima ed è dotato di una proto-forma. Quest’ultimo comunque riporta i significati originali di ogni carattere, siccome sono evoluti: per esempio, miao4 秒 oggi indica il secondo (unità di tempo), il che rende la presenza del radicale del cereale criptica e insensata. In realtà, in origine il carattere indicava l’arista, cioè un lungo filamento sulla “buccia” dei chicchi di grano sulle spighe, il che rende il radicale subito comprensibile. Da tutte queste informazioni si può ricavare una lista di 7 errori da evitare:

non praticare una distinzione tra da un lato paleografia/filologia con conoscenze storico-letterarie, archeologiche e di tecniche antiche in alcuni campi (e.g. agricoltura, allevamento, metallurgia, produzione di vasellame, settore tessile) e dall’altro l’etimologia folk con mnemotecnica peraltro avulse dalle utili conoscenze di supporto elencate in precedenza;
analizzare i caratteri superficialmente (in base cioè alla loro apparenza immediata, a volte ingannevole per le stilizzazioni, amputazioni o aggiunte e disposizioni dei componenti);
analizzare solo la versione semplificata laddove hanno una versione tradizionale;
non prendere mai in consultazione alcuni utili varianti arcaicheggianti dei caratteri laddove presenti (esistono dizionari appositi);
non consultare mai le versioni sulle ossa oracolari e i bronzi Shang e Zhou laddove il carattere è attestato;
partire ad analizzare sempre e solo dal significato moderno, laddove sono presenti significati arcaici poi evoluti e/o perduti ma recuperabili da dizionari antichi (tra cui lo stesso Shuowen Jiezi);
copiare l’interpretazione integralmente da Xu Shen, che già commette degli errori nell’interpretazione e suddivisione corretti dalla paleografia e da alcune glosse e commentari ben scritti (non tutti i commentari sono uguali. Quelli di Xu Xuan e di Duan Yucai sono tra i migliori in assoluto e le loro glosse sono direttamente affiancate alla definizione originale di Xu Shen). L’opera va quindi affiancata ad altri materiali e conoscenze. L’errore di non leggere Xu Shen con un sano spirito critico si intuisce fin dagli esordi del paragrafo.

Alcune interpretazioni sono incerte o in fase di discussione ma, se non cadono in nessuno dei 7 errori, semplicemente sono indicatori di un dibattito ancora aperto che può essere chiuso con l’avanzare delle scoperte in paleografia, in linguistica storica (e.g. la derivazione morfologica in Old Chinese), in storia e in archeologia (le ossa e i bronzi sono infatti reperti archeologici. Più se ne trovano, più caratteri attestati e/o varianti antiche emergono, con tutto ciò che ne deriva).

Un ultimo errore diffuso sarebbe da includere come l'ottavo errore se non fosse limitato ai soli radicali Kangxi. Tuttavia, il fatto che i radicali Kangxi come grafia, nome e ricostruzione filologica siano il migliore punto di partenza per l'apprendimento dei sinogrammi, lo rende un errore dalle conseguenze pesanti. L'errore, riportato in disparte, è il seguente:

partire a ricostruire e studiare i radicali Kangxi a partire dal nome proprio in cinese, laddove presente.

Si prenda come esempio lampante卩 jie2: è universalmente noto come "il sigillo", in più come radicale ha il nome proprio in cinese traducibile come "l'orecchio singolo". Non solo i nomi propri in cinese indicano perlopiù l'apparenza grafica del carattere, ma non danno informazioni per la filologia. Jie2 non rappresenta in nessun modo un orecchio, ragion per cui questi nomi sono utili per richiamare alla mente il radicale in lingua cinese ma sono fuorvianti per la ricostruzione filologica. Quanto al suo significato, anch'esso è fuorviante perché a livello di origine non rappresenta in nessun modo un sigillo: è un uomo inginocchiato ritratto di profilo. Anche i radicali Kangxi non sono esenti dai 7 errori elencati in precedenza: per esempio, 彐 ji4 è universalmente noto come "muso di maiale" in base alla definizione di Xu Shen, ma in nessun carattere raffigura il muso del maiale, bensì stilizza una mano solitamente impegnata ad afferrare qualcosa.

I nomi dei principali stili calligrafici cinesi sono decisamente utili per dare un nome a una particolare grafia e/o nel momento in cui ci si imbatte nel loro nome in un dizionario di calligrafie o in un libro di filologia dei sinogrammi. I primi due nomi non sono stili, ma un'etichetta alle versioni sulle piastre di tartaruga, scapole di bue e sugli oggetti in bronzo. Anche gli ultimi due non sono nomi di stili calligrafici, ma sono importanti da elencare e tenere distinti quando si vede la scrittura di un carattere e/o si fa filologia. Da questi nomi e una loro successione, si può impostare lo studio della calligrafia base cinese per capire le loro caratteristiche, origini e periodizzazioni (gli stili sono evoluzioni che non partono dall'invenzione di un singolo calligrafo e più stili e proto-stili possono sovrapporsi).

Thurgood, Graham; LaPolla, Randy J (a cura di). The Sino-Tibetan Languages. Routledge, Londra/Canada/New York: 2003 (ristampa 2006).
Baxter, William H.; Sagart, Laurent. Old Chinese. A New Reconstruction. Oxford University Press, New York: 2014.
Matisoff, James A. Handbook of Proto-Tibeto-Burman: System and Philosophy of Sino-Tibetan Reconstruction. University of California Press, USA: 2003.
Axel Schuessler. ABC Etymological Dictionary of Old Chinese. Honolulu, University of Hawaii Press, 2007.
Chen, C.-Y. Tonal evolution from pre-Middle Chinese to modern Pekinese: three tiers of changes and their intricacies. Berkeley, CA: Project on Linguistic Analysis, University of California: 2001.
Newman, J., & Raman, A. V. (1999). Chinese historical phonology: a compendium of Beijing and Cantonese pronunciations of characters and their derivations from Middle Chinese. LINCOM studies in Asian linguistics, 27. Muenchen: LINCOM Europa. ISBN 3895865435
Ulving, T., & Karlgren, B. (1997). Dictionary of old and middle Chinese: Bernhard Karlgren's Grammata serica recensa alphabetically arranged. Orientalia Gothoburgensia, 11. Göteborg: Acta Universitatis Gothoburgensis. ISBN 9173462942
Pulleyblank, E. G. (1991). Lexicon of reconstructed pronunciation in early Middle Chinese, late Middle Chinese, and early Mandarin. Vancouver: UBC Press. ISBN 0774803665
Pulleyblank, E. G. (1984). Middle Chinese: a study in historical phonology. Vancouver: University of British Columbia Press. ISBN 0774801921
Ki-Moon Lee; Ramsey, S. Robert. A History of the Korean Language. Cambridge University Press, Cambridge: 2011.

Lingua cinese
Pinyin
Radicali Kangxi
Ricostruzione filologica dei sinogrammi più diffusi con appendice
Ricostruzione filologica dei sinogrammi HSK1
Ricostruzione filologica dei sinogrammi HSK2
Ricostruzione filologica dei sinogrammi HSK3
Ricostruzione filologica dei sinogrammi HSK4
Dizionario Kangxi
Cantonese
Lingua wu
Minnan
Hokkien
Lingua hakka
Guanhua
Lingua coreana
Hanja (include la lista di 1800 hanja basilari)
Lingua giapponese
Kanji (include i kanji JLPT1-4 con pronuncia in Primo Cinese Medio)
Kana
Katakana (con ricostruzione filologica)
Hiragana (con ricostruzione filologica)
Lingua vietnamita
Alfabeto vietnamita
Chu nom (include una lista di Han tu' diffusi)
Tavola di rima

http://lodel.ehess.fr/crlao/document.php?id=1217 Guangyun (9000 caratteri) con pronuncia in Middle Chinese ricostruita da Baxter (2011, fonte recente)
http://ocbaxtersagart.lsait.lsa.umich.edu/BaxterSagartOCbyMandarinMC2014-09-20.pdf Dizionario di 5000 caratteri con pronuncia in Old Chinese ricostruita da Baxter/Sagart (2014, fonte recente)
https://stedt.berkeley.edu/~stedt-cgi/rootcanal.pl STEDT (Sino-Tibetan Ethymological Dictionary and Thesaurus), a cura di James Matisoff (2015)
http://tangorin.com/kanji/ dizionario kanji Tangorin.com
https://hanja.dict.naver.com/ dizionario hanja Naver.com
https://www.chunom.org/ dizionario chu nom Chunom.org
http://cantonese.org/ Dizionario di cantonese CC-Canto.org (con trascrizione jyutping)
http://wu-chinese.com/minidict/ Dizionario in cinese di dialetti wu (incluso lo shanghainese. Romanizzazione MinDict)
An Etymological Dictionary of Common Chinese Characters, William H. Baxter
Introduction to Chinese Historical Phonology, Guillaume Jacques
Historical Chinese Phonology/Philology at Technical Notes on the Chinese Language Dialects Dylan W.H. Sung
Russian website reconstructing Middle Chinese and Old Chinese as well as intermediate forms, su starling.rinet.ru.
https://encykorea.aks.ac.kr/ Archiviato il 9 ottobre 2019 in Internet Archive. Enciclopedia online di cultura coreana Encykorea.kr
http://dh.aks.ac.kr/sillokwiki/index.php/%EB%8C%80%EB%AC%B8

Sillokwiki (한국학중앙연구원 디지털 인문학 Web Host: Central Research Institute of Korean Studies Digital Humanities Web Host)

https://sites.google.com/site/sachsuvietnam/tu-lieu-tieng-phap Archiviato il 3 novembre 2020 in Internet Archive. Sito n.1 di dizionari vietnamiti
https://sites.google.com/site/tbhbmcb/sach-co Archiviato il 27 ottobre 2020 in Internet Archive. Sito n.2 di dizionari vietnamiti
Piccolo glossario di storia coreana
http://www.buddhism.org/korean-english-dictionary-of-buddhism/ Dizionarietto buddista coreano-inglese
http://buddhism-dict.net/ddb/rad-stroke/radical-index.html Dizionario buddista ordinato per Radicali Kangxi
https://www.branah.com/hanja-to-hangeul Sito per trascrivere gli hanja in hangeul
https://www.pin1yin1.com/ Sito per romanizzare i sinogrammi in pinyin

Text submitted to CC-BY-SA license. Source: Lingua cinese media by Wikipedia (Historical)

Owlapps.net - since 2012 - Les chouettes applications du hibou