最強だと思い込むのやめたほうが良い
英文、生のままハフマン符号にしても60%ほどにしか圧縮されない。
ずいぶん前にハフマン符号習ったとき「理論的下界だよ」みたいなこと言われたから、そのときはハフマン最強だと思ってた。
ふつうのハフマンだと記憶のない情報源を仮定する。英単語、『q』の次は『u』くると思う。記憶のない情報源を仮定するハフマンが最強なわけない。いまだと、カジュアルに30%以上の圧縮できる。
論文読んでると、なんだよこれ最強じゃんかよー、みたいに思うこと多い。師匠とかはそういう論文の穴探すの上手いと思う。