お手軽にサイト内検索をしたいけれど、フリーのCGIは動的なサイトに対応していない。
そういった場合には先ず「wget」を使いサイトを丸ごと静的ページとして取り込んでしまいましょう。

$ wget -r -l 0 http://digital.knot-inc.co.jp/

-r を付けて再帰的取得を指定し、-lで再帰の深度を指定。0なら全階層が対象になります。
-R で画像などの不要ファイルを除外しても良いでしょう。

他にも色々オプションはありますので以下のサイトなどで調べてみてください。
http://www.itsenka.com/contents/development/unix-linux/wget.html

CGIの設定についてUnicode版msearchを例に上げると、

genindex150g

インデックス作成フォームの”対象ディレクトリ”にwgetで取得したディレクトリを指定し、”対象ディレクトリのURL”に本来のURLを指定します。

wgetで取得したファイルの拡張子が.htmlになっているのであれば、結果ページのURLの拡張子が.htmlになってしまわないよう拡張子を.phpなどに差し替えましょう。

あとは「cron」を使って定期的にwgetとインデックス作成を実行すればOKです。

動的なサイトがダメなら静的にしてしまえ!といういささか乱暴なやり方ではありますが、とにかく手間が掛からないのでとりあえず検索エンジンを付けてみたい、動的サイトに対応している検索エンジンが導入できない、という場合にはオススメです。