Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 「<」をTITLEに含む時に (namazu-bugs-ja#636)
寺西です。
# 古い話ですが。
kiyopii-h@xxxxxxxxxxxxxx wrote:
>
> <TITLE>の中に「<」(ダブルバイト文字の"<")を含む場合、検索結果
> 画面で、文章のタイトルが表示されずにファイル名が表示されます。
...
> しかし例外があり、「<」の後ろに半角のスペースがある場合は正しく
> 解釈されます。
> たとえば、<TITLE>< ほげほげ>ほげ<TITLE>
<TITLE> < ほげほげ>ほげ<TITLE>
のように「<」の前後にスペースがある場合は、大丈夫なようです。
> 内部で「<」が「<」に変換され、タグとして認識されているのでしょうか?
NKF の -Z1 オプションにより「<」が「<」に変換され、タグの区切りと
して認識されています。
「<」の前後にスペースがある場合は、< に変換されるため、タグの
区切りとはみなされず、正しく表示されるようです。
これは、最大マッチングによる誤認で、最小マッチングになるように
修正することで改善できました。(commit 済み)
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E