WordPress with multibyte languages

WordPress uses UTF-8 as a default, so you wouldn`t think that there aren’t any problems using Japanese. But the truth is that there are.

Ther are two main problems. When you use the excerpt tag, the WordPress will automatically show limited number of words, 120 words but default I think, with […] at the end. This is often used on the home index page, just like this Hemingway theme does. The problem is that when the content of the post is in Japanese, the whole of that content is shown. Not an excerpt. The other problem is that the “search” do not work. I type in some Japanese word, which I know it exists in my post, but does not return any result.

So. I searched around on the web, and I found the problems and solutions on Jam’s WordPress page. I am not a progmmer, so I am not sure of the detail, but the both problems seems to be associated with the different in context that the Asian languages use, and WordPress do not take in account of that possibility.

The bit I can understand, because its not to do with programming, is the context. Japanese language do not use whitespace to recognise “word”. I believe that this is also true for other Asian multi-byte language like Korean and Chinese. Apprantly, WordPress’@ excerpt count the words by recognising the whitespaces in between. If the content is in Japanese, it will recognise the whitespace at the end of the paragraph as end of the word. As a result, if the post contain five paragraphs, WordPress sees it as five words, and will looks like it is showing the full content.

The “Patch for WordPress 2.0.1 to support Asian text in its excerpt constructing functions” is in diff format, not as a plugin. Thats because the core files needs to be hacked. So thats a downside of applying this patch, especially for those who are not confortable with PHP. I have no experience with maintaining a UNIX system, so I struggled to appyl the patch at first.

For the solution of the search problem, apply the “Search excerpt plugin supporting Asian text”, which is a modified version of the ylsy_search_excerpt.

Some links:

Note on the files that the patch hacks:

  • wp-trackback.php
  • ./wp-includes/comment-functions.php
  • ./wp-includes/feed-functions.php
  • ./wp-includes/functions-formatting.php
  • ./wp-includes/functions-post.php
  • ./wp-includes/functions.php

asiantextss1asiantextss2

WordPressユーザに聞きたい10の質問

WordPressユーザになってまだ1ヶ月程度の新米ですが、その向こう側にあるもの・・・さんのトラックバック企画「WordPressユーザに聞きたい10の質問」に参加させていただこうと思います。

WordPressを知ったきっかけを教えてください?

半年以上前に、WebDesignやCSS、Webstandardsに関係する情報やHowToを探していたころ、Myerwebにたどり着いたのがWordPressを知った最初です。MTが多い中「このサイトで使われているWordPressって何だろう?」から色々とWordPressについて調べ始めました。

WordPressを選んだ理由を教えてください?

実力はあるけど人気は2番手っぽかったから。以前CGIのブログを使っていたからPHPのを使いたかった(MTはCGI->PHPが面倒)。詳細なCODEXがあった。英語も日本語も大きな問題なく使えそうだった。 他のも試してみて一番気に入ったから。オフ会に参加した!

以前、使用していたブログツールはありますか?

とあるPCゲームのファンサイトを運営していて、sbのブログを組み込んでいた。今はNucleusになってる。他にはgooとDoblog、でも三日坊主。

WordPressの使い心地はどうですか?

全体的にはすごく良い。快適で満足しています。

WordPressで改善して欲しいところはありますか?

・・・とは言え、使用して1ヶ月で早速あります。やはりPHPコードむき出しのテーマは編集しづらい。特にNucleusなんかと比べたら。慣れて来るんだろうけど、PHPが分からないボクのようなユーザーにとっては最初にちょっとした勉強が必要。他には、テーマでも、WP本体でも、アップデートしたときに問題なく成功できたかどうかが分かりづらい。Dashboardでバージョンを表示するとか、テーマ一覧画面で「変更された・作成された」表示をしてほしい。JavaScriptを使ったやつだけでなく。本家のCODEXも整理してほしい。内容に不満は全然ないけど、無限ループの迷宮状態になっているのをどうにかしてくれ~!

知り合いのブロガーにWordPressを勧めたことはありますか?

ありません。

お勧めのWordPressプラグインを3つだけ上げるとしたら?

その他色々と気になるのはある。ちょうどつぼに利くようなプラグインがWordPressにはたくさんありますね。

お勧めのWordPress情報サイトはありますか?

  • 本家のCodex
  • WordPress Japan
  • 特定のサイトじゃないけど、del.icio.usとか、TechnoratiとかでWordPressを検索したらいっぱい引っかかる。大抵タグもある。

よく見に行くWordPressユーザのサイトを3つだけ上げるとしたら?

難しいですねぇ、3つに絞るってのは。

  • detlog.org – 最初に出会った日本語のWordPressサイトでもあります
  • Taste of Wind – ブログの内容もさることながら、なぜか妙に頭に残るブログタイトルです
  • Warpspire – 今使っているHemingwayテーマを作っているとこです。まだまだベータ?アルファ?版の開発途中なので頻繁にチェックしてます。

最後に一言、どうぞ。

去年の大阪オフ会で出会った皆さんお元気でしょうか?・・・ってそんなんブログ見れば分かるやん!

スポーツ好きなんですけど、スポーツ・ジャーナリズムを放棄したような日本メディアのトリノ・オリンピック報道(毎回の事だけど)に辟易してる今日この頃です。

あっ、二言だ。

Hemingway theme

先ほど書いた「Installed a new theme」の日本語版記事です。英語版を書いて、その後で日本語版の新しいポストで書く、と言うスタイルはしないつもりですが、1回くらいは試しにしてみようと思い書いてみます。直訳にはならないと思いますが、内容は同じにするつもりです。

バイリンガル・プラグインや、タグ関係のプラグイン等、是非入れたいと思っているプラグインが多数あるので、落ち着くまでWP2.0のディフォルト・テーマのままでいくつもりでした。デザインいじりはその後でやろう、と。オリジナルのテーマも作ってみたいし。しかーし、先日WarpspireにてHemingwayと言う、すごくシンプルでカッコイイテーマで出会えたのでインストールしてみました。

実を言うと、個人的にはこれまで固定幅の真ん中レイアウト(”wrapper”とか”container”を使ったやつ)で、かつ、2カラムが好きだったんです。なので、Hemingwayも最初はシンプルさに惹かれたのですが、幅の大きいレイアウトに少し違和感を感じました。ダウンロードしても数日そのままにしていたのですが、サイトを見ているうちにだんだんと違和感がなくなってきて、思い切ってインストールしました。

Hemingwayはまだversion0.1なので、色々な箇所が抜けています。Aboutや、Archivesへのページへのリンクや、個別記事表示したときの「1つ前」「1つ後」の記事へのリンクをはじめ、Archives.phpもまだ製作中のようです。これらの最低限必要なリンクやページを作りました。 また、ヘッダーの色も、白系から青系へ変えています。Hemingwayのロードマップによると、これらのバグや未完成部分は以後のリリースで修正予定で、さらにまだまだ面白そうな機能をつけるプランなようです。

Hemingwayのアップデートに注目しながら、WP2.0の勉強がてらにしばらくはこのテーマをいじりながら使っていく事にします。

P.S.変な日本語でスミマセン。英語の方がはるかに書きやすい気がする。あと、最近MSIMEにいらいらしてます。Atok2006買おうかな。

Installed a new theme

I was going to leave the disign of this site as WP2.0 default theme. I wanted to make my own theme, when the things settle with the bilingual plugin, and other goodies. However, I came a cross an excellent looking theme at Warpspire. Its called Hemingway.

To be honest, I preferred fixed and centerd “wrapper”, or “container”, with 2-columns design. But after finding the Hemingway, it glow in my mind, and decided to install it. I like this.

I have tweaked few things like, navigation bar, previous/next links, archives page, dates format, and header color. Still in process, but I think it is ok for now. I will keep tweking around though. Hemingway is actually stil in its version 0.1, and looks like these things are goin to be fixed in the future release, mixed in with some new cool features.

Post slug !

Yes. There was a much simpler solution to the problem from my last post. Type in the custom post slug for those with the Japanese title. I think I will go with that.