by shigemk2

当面は技術的なことしか書かない

強いUnicode #kernelvm

@iorivur

先史時代

自分たちの信じるデフォルトエンコードを使っていた。

8bit幅

警察国家、メール到来

メールで世界を統一しよう。英語しか喋れなくしよう

7bit幅

警察国家、メールの氾濫

base64でエンコードするから阿鼻と叫喚の混声合唱

Emoji国家の勃興と破壊的イノベーション

独自の絵文字でバリエーション

民族解放運動 Unicode

別々の文字で殴りあう時代にさよならしたかった

Unicodeについて少し

Unicodeでは文字は直接には1つの表現方法は持たない

Unicodeで禅問答

Aとaは違うのか

文字とはなにか

Unicodeについてはそれぞれの文化で話し合うようにしてみる

コードポイントは、文字を表すうつろなものでしかなかった。

UTF-16とC言語

16bitですべての文字を表す

while(str[i]) { i++; }

有名なnull-terminate問題

wchar、t、fwscanf()が加わったけど、これが扱う文字がUTF-16と決まったわけではない。

PHPが世界を飲み込む

PHPは文字は1バイト

レンダリングの話

レンダリングはどうするのか

モンゴル語は縦書