« asahi.com : 急がばゆっくり | トップページ | WIRED:ハイテクにまつわる失敗談を集めた実話集 »

2004.08.31

Namazu

http://www.nisimura.info/Namazu検索できるようにしました。ついでなので、ここのログも検索できるようにしました。www.nisimura.infoはレンタルサーバーなのでmknmzはうごかせないので(動かせるとしても、同じサーバーを借りている人に迷惑なような気がするし)、いったんデータをローカルに持ってきて、mknmzでインデックスを作成し、そのインデックスをアップロードする、という手順をとることにしました。細かいコメントを入れる余裕(気分的なそして時間的な)がないので単にスクリプトをコピペします。

(1)wgetにてログを取得

cd /home/nisimura/html/
wget -q -r -nv -np --accept=html,html,jpg,gif,css,xml,xsd,xslt,txt,java \
--domains=nisimura.txt-nifty.com https://nisimura.txt-nifty.com/memo/
wget -q -r -nv -np --accept=html,html,jpg,gif,css,xml,xsd,xslt,txt,java \
--domains=www.nisimura.info http://www.nisimura.info/

(2)mknmzにてインデックス生成

export LANG=ja_JP.ujis
export PERL_BADLANG=0
cd /home/nisimura/html
find nisimura.txt-nifty.com www.nisimura.info -type f -not -name index.html | \
xargs grep -L '<\!-- deny Namazu -->' |\
mknmz --html-split \
--replace 's#/home/nisimura/html/village/#http://member.nifty.ne.jp/village/#;\
s#/home/nisimura/html/nisimura.txt-nifty.com/#https://nisimura.txt-nifty.com/#;\
s#/home/nisimura/html/www.nisimura.info/#http://www.nisimura.info/#' \
-O nmzindex -F -
cp nmzindex/templete/* nmzindex

「/home/nisimura/html」がデータディレクトリ(バックアップも兼ねているので画像ファイルなども取得してます)、「nmzindex」がNamazuのインデックスディレクトリ。
あとはNMZ.*をアップロードするんですがここがあまりかっこよくない(以前、日記をローカルで書いてアップロードしていた時のものをそのまま流用)。

(3)インデックスファイルをアップロード
#! /bin/sh
indexpath=/home/nisimura/html/nmzindex
cd $indexpath
ftp -n < ~/nmz.ftp

※nmz.ftpの内容
open サーバー名
user ユーザー名 パスワード
cd public_html
cd cgi-bin
cd NMZ
bin
put NMZ.field.date
put NMZ.field.date.i
put NMZ.field.from
put NMZ.field.from.i

quit

もっと良い方法があるよという方(特にFTPのあたり)ぜひご連絡を。よろしくお願いします。

|

« asahi.com : 急がばゆっくり | トップページ | WIRED:ハイテクにまつわる失敗談を集めた実話集 »

ウェブログ・ココログ関連」カテゴリの記事

パソコン・インターネット」カテゴリの記事

Linux,Cygwin,UNIX系ツール」カテゴリの記事

トラックバック


この記事へのトラックバック一覧です: Namazu:

« asahi.com : 急がばゆっくり | トップページ | WIRED:ハイテクにまつわる失敗談を集めた実話集 »