CP932

CP932 → UNICODE → CP932 : PHP 5.3.3 も調べてみた

「php も調べてみた - GANAwareはてな版」で PHP 5.3.0 について調査しましたが、その後 PHP 5.3.3 で変更がありました。 http://dl.dropbox.com/u/1340991/cp932_roundtrip/cp932_roundtrip.html U+00A5 と U+203E の変換先が Win32 のものと一致するように…

cygwin 1.7.2 と LANG=ja_JP.CP932

cygwin 1.7.1 で ja_JP.CP932 を使用可能にするパッチ - GANAwareはてな版 が反映された Cygwin 1.7.2 がリリースされました。 Updated: cygwin-1.7.2-1 Updated: cygwin-1.7.2-2 CP932 がサポートされたので、 LANG=ja_JP.CP932 に設定可能です。 LANG=ja_J…

php も調べてみた

id:hnw に協力してもらって php の場合も調査してみました。 http://dl.dropbox.com/u/1340991/cp932_roundtrip/cp932_roundtrip.html U+00A5 と U+203E の変換先が Windows と異なります。おしい。

APR-iconv Unicode ⇔ CP932 Patch

作ったのでバグ報告しました。APR-iconv は例えば Windows ネイティブ版の Subversion で利用されています。(Cygwin の Subversion は libiconv を利用するので、APR-iconv は利用しません)

Python 2.7a Unicode → CP932 Patch

http://dl.dropbox.com/u/1340991/cp932_roundtrip/Python-2.7a3-cp932-patch.txtPython 2.7a3 用に、UNICODE → CP932 の変換時に Windows とは異なる文字へ変換される部分を Windows と一致させるパッチを作ってみました。Python は昔から PyJUG の ML で日…

CP932 → UNICODE → CP932

はじめに 文字列を CP932 から UNICODE へ、UNICODE から CP932 へ変換する必要がしばしば生じますが、その変換テーブルは各々の言語やライブラリでかなり異なっています。そこで、実際にどの程度異なっているのかをまず調査してみることにしました。 調査結…

〜‖−¢£¬ と libiconv と cp932

CP932 と UNICODE の相互変換した時に「〜‖−¢£¬」が期待通り*1 に変換してくれるかどうかを調査してみました。以下のシステムはでは期待通りに変換してくれます: eglibc 2.10.1 (ubuntu 9.10) glibc 2.7 (ubuntu 8.04 japanese) Perl 5.10.0 (osx 10.6.2) Pe…

〜‖−¢£¬

Samba 国際化プロジェクト:ミラクル・リナックス"〜‖−¢£¬" このあたりの文字で CP932 と SJIS と UNICODE 間で起こる問題、現在の libiconv-1.13.1 でもあいかわらず問題なのですね。未だに修正されていないのは、何か強い理由があるのかそれとも誰も本家に…

cygwin 1.7.1 で ja_JP.CP932 を使用可能にするパッチ

以下のパッチを当てて cygwin-1.7.1-1 をビルドし、その結果作成される cygwin1.dll を使用して LANG=ja_JP.CP932 に設定しておけば、Subversion の global-ignores: *~ は問題なく動作するようになりました。 diff -c cygwin-1.7.1-1.orig/newlib/libc/loca…