タグはもうUTF-8でいいや May 5, 2009
WordPressはカテゴリーやタグを内部的にラベルとURL表記で二重に管理している。 これまで日本語のタグに頑張って英語のURL表記を付けてきたのだが、ここにきて崩壊し始めた。 というのも、タグの場合、記事を書きながら新しいタグを追加することが多い。 そこで振られるURL表記はURLエンコードされたUTF-8になる。
ここで同じラベルのタグに対して2つのURLが存在できる状況になり、それぞれ別タグとして管理される。 そのため、整理するためのツールで逆にごちゃごちゃになるという現象が発生していた。
しばらく見て見ぬふりをしていたのだが、このあたりであきらめて手動でタグを統一することにした。 最近はFirefoxなどのブラウザはURLエンコードされた文字列をデコードするので、リンク先のタグを日本語で表記できるようになっていたりして、あえて英語にするメリットがほぼなくなっている。
おそらくWebの分野ではUTF-8のサポートは継続していくのだろうから、変なところで頑張らないアプローチをとることにする。