Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Word、Excel文書の検索ができません。
山崎です。
いろいろとご教授いただきありがとうございます。
その後、いろいろと試してみたのですが、
やはり、Windows2000からSamba共有がかかっているLinuxのディレクトリに
Word2000、Excel2000で作成したファイルをコピーし、
そのファイルに対して全文検索をかけようとすると
検索結果が文字化けしてしまったり、
MS-WORDファイルがファイル名で検索できません。
試したこととしては
1.メーリングリストの情報を元にmsword.plを編集し、
インデックスを再作成した。
->検索結果のタイトル部分に
ファイル名が表示されるようになりました。
(ただし、ファイル名は文字化けし、
ファイル名で検索を行っても、検索結果にヒットしません。)
2.MS-EXCELとMS-WORDファイルをLinuxサーバーに転送し、
インデックスを再作成した。
->検索結果のタイトルが文字化けしてしまう。
3.MS-WORDとMS-EXCELファイルのファイル名の文字コードをEUCに変更し、
インデックスを再作成した。
->文字化けせずに、検索結果のタイトルにファイル名が表示された。
ただし、Excelファイルはファイル名での検索を行えばヒットするが、
Wordファイルはヒットしない。
4.「+subject:ファイル名」と検索式でフィールドを指定し、
MS-WORD文書の検索を実行。
->ファイル名の文字コードがEUCのファイルのみ
ファイル名で検索結果にヒットしました。
5.namazu.cgiと同じ場所に置いてある「.namazurc」に
Lang ja_JP.SJISを指定し、
インデックスを再作成。
->ファイル名の文字コードがShist-JISであっても、
検索結果のタイトルにファイル名が正しく表示される。
ただし、「+subject:ファイル名」と検索式でフィールドを指定し、
MS-WORD文書の検索を実行すると、
ファイル名がShift-JISのファイルは検索結果にヒットしない。
NMZ.field.subjectを見ると、
ファイル名がShift-JISのものは
全て文字化けしている。
MS-WORD、MS-EXCELファイルをコピーするたびに、
ファイル名をEUCに変更したり
検索をするたびに、「+subject:ファイル名」と検索式に入力するのは
分かりにくいため、ファイル名がShift-JISでも
検索できるようにしたいと思っています。
ファイル名の文字コードがEUC-JPだと出来るのに、
Shift-JISだと出来ないのは何か設定がおかしいのでしょうか。
Naoko Yamazaki
n_yamazaki@xxxxxxxxxxx