自己在意了很久,但都沒有認真下個結論的問題:在臺灣的正體中文網頁裡,到底 <html lang=""> 的值該填什麼?

中文的問題應該找中文的討論吧……但是搜尋到的都只是轉貼文章,或是「我認為」但沒有佐證的說法

只有這個知乎討論看起來靠譜些:网页头部的声明应该是用 lang=“zh” 还是 lang=“zh-cn”? - 知乎

我從裡面揀了幾個答案來看:

然後稍微瀏覽了一下答案裡提到的規格書:

3 Semantics, structure, and APIs of HTML documents — HTML5

Its value must be a valid BCP 47 language tag, or the empty string.

http://www.ietf.org/rfc/bcp/bcp47.txt

從 BCP 47 看來,好像用 zh-Hant 就夠了?

https://www.iana.org/assignments/language-subtag-registry/language-subtag-registry

IANA 的文件指明,比起 zh-cmn-Hant 更建議使用 cmn-Hant。而 zh-Hantzh-Hant-TW 都被標為 redundant

所以目前我的結論是:用 cmn-Hant,然後為了相容再加上前綴 zh- 變成 zh-cmn-Hant 即可。後綴 -TW 可不加,除非是要特別標出與其他地方中文的不同之處,例如「土豆(cmn-Hans-CN)」和「馬鈴薯(cmn-Hant-TW)」

語言分類與定義的規範就不再列在這裡,而這也只是針對文字部份的筆記而已,聲音的部份暫不研究