namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ファイルの命名に規則はありますか



はじめまして、上口と申します。

pdf ファイルを namazu で検索したくログを参考に設定してみました。
ここで、PDFファイルがロングファイル形式である場合とそうでない場合に
nknmz によるインデックスキーワードの作成される個数が異なってくるのですが
何がいけないのか、教えてもらえないでしょうか?

「結果」
同一文書で test.pdf , Tech_WindowsNT5.0 Features & Functions (3_17).PDF
という2つのファイル名で mknmz を行うと

test.pdf -> 124 のキーワードが作成
Tech_WindowsNT5.0 Features & Functions (3_17).PDF -> 100 のキーワードが作成
wdnmz にて確認すると、後者の方は文字化けしています。
ちなみに namazu を通さず pdf2txt を行うと、両者結果は同様となりました。

namazu ではファイル名として使用してはならないコードがあるのでしょうか!?

「動作環境」
WinNT4.0 + ActivePerl 522 + namazu v1.3.0.11 + pdf2txt v0.94
mknmz の HELPER_PROGRAMS にて
    'pdf' => 'perl.exe pdf2txt -s',