butterfly_search(全文検索フリーソフト)

 

grepgoogleデスクトップ、namazuでは、満足できなかった為、このツール(バタフライサーチ)を作成しました。 

                

 

【概要】

Windowsで動作する個人向けインデックス型全文検索ツールです。日本語全文検索も可能です。

動作イメージは次の様な感じです。


 

【ダウンロード】

【通常バージョン】

日時 バージョン 概要
2013.12.12

V2.5g

お試し版 行表示ペインの修正(表示上限を10000→100000へ。コピペアイテムにファイルパスを追加。)
2013.09.27

V2.5f

お試し版 クリップボード連動をONにした時にクラッシュする問題対応その2
2013.09.21

V2.5e

お試し版 クリップボード連動をONにした時にクラッシュする問題対応
2013.08.03

V2.5c

お試し版 分布表示時のキー連動先としてクリップボードを追加。
2013.06.12

V2.5b

正式版(ベクターHPへ)
2013.06.09

V2.5a

お試し版 分布ボタン押下時の色変更機能を追加。
2013.05.01

V2.4i

お試し版 ビッグデータに対応(2Gバイトを超えるテキストファイルに対応)。特定のフォルダを検索対象から外せるように対応。
2012.07.28

V2.4h

お試し版 ショートカットファイルのショートカット先を検索対象とする様に仕様変更
2012.06.17

V2.4g

お試し版 検索履歴の履歴が冗長表示とならない様にガードを処理を追加
2012.05.27

V2.4f

お試し版 同梱のxdoc2txtフィルターをVer1.41→Ver1.42へ差し替え
2012.05.01

V2.4e

お試し版 コマンドラインからのインデックス作成に対応
2012.02.24

V2.4d

お試し版 画像から文字を認識する機能(OCR)に対応
2012.02.08

V2.3a

お試し版 xdoc2txtフィルターを使用する条件として、拡張子「docm/pptm/xlsm」を追加
2011.01.15

V2.3

正式版 表記をV2.3へ変更。内容はV2.2cと同等
2011.12.11

V2.2c

お試し版 NULLが含まれるファイルをバイナリーファイルとして判定されないことがあるバグ対応
2011.10.01

V2.2b

お試し版 フォルダ名に「.」が含まれると解析エラーになるバグ対応)
2011.09.25

V2.2a

お試し版 xdoc2txt同梱によりword/excel/pdf等のファイルにも対応)
2011.09.03

V2.1b

お試し版 右端での改行する/しないを設定可能に+改行バグ修正)
2011.06.26

V2.0

正式版  ファイル名の判定処理を高速化。AND条件機能を追加
2010.07.29

V1.9c

お試し版 LinxuOSでのファイル名の大文字小文字区別に対応
2010.04.13

V1.9b

お試し版 xdoc2txt.exeとの連携対応

※サーバーの容量の関係で過去の版は削除しております。

 





【ファイル名の大文字小文字】

LinxuOS上でファイル名を大文字小文字で区別している場合のインデックス化手順_



【特徴】

・速い。(と思う)

・ワンクリックで該当行へジャンプする。

・全文検索エンジンと検索ツールが一体で導入簡単。

・インストール不要でお手軽。(ファイルのコピーのみで動作)

・明確なルールにより、理論上検索漏れなし。 (半角英数字と半角アンダーバーの列は単語としてインデックス化。その他の文字(日本語)はN-gram法でインデックス化)

・検索候補の検索が可能。 例:「*tar*」と入力して下矢印キーにより「Start」という候補を見つける事が可能。

・文字コードは Unicode(UTF-16),Unicode(UTF-8),Unicode(UTF-7),Shift-JIS,EUC,JISに対応。(IMultiLanguage2->DetectInputCodepageを使用しているのでBIG5等も含めエクスプローラで表示できる文字は認識する筈です)

Unicodeに対応。

・Linux上で、ファイル名を大文字と小文字で区別している場合でもインデックス化出来る様に対応。(2010年7月29日)

・2GB以上のテキストファイルに対応。

テキストファイル専用!
 

                            


【他ツールとの違い】

■googleデスクトップとの違い

 ・すべての文字をインデックス化出来る。(googleデスクトップは先頭75000文字まで)

 ・検索対象とするディレクトリを指定できる。(googleは自動化されすぎていてユーザーのコントロールが出来ない)

 ・インデックスへ 登録できた /  出来なかったを確認する事が出来る。

 ・駐在型ではないので、Windowsの動作が遅くならない。


■namazu
との違い

 ・細かい設定が不要。(600Kバイト以上のファイルを扱うときはnamazurc$TEXT_SIZE_MAXを修正する必要ある等)

 ・Perlや、KAKASI等の追加インストールが不要。

 ・分かち書きに失敗して検索漏れが発生するのでは?という心配が不要。

 

■grepとの違い

・検索速度が違う。(当たり前ですね。)

 

【インデックスのサイズ、作成時間について】
 インデックス構築例1
  ・マシンスペック
    メモリ         2Gバイト
    CPU Core2    2.66GHz

  ・インデックス対象ファイル
   日本語混じりの英文ファイル  約7万ファイル
   対象ファイルサイズ合計       1.5Gバイト


  ・結果
   処理時間                   5.5時間
   インデックスのサイズ    0.6Gバイト
   検知した単語の数        約700万


【リリース情報】

butterfly_search掲示板


【マニュアル】

butterfly_searchニュアル



【謝辞】

【ご紹介】

以下、紹介して頂いております。ありがとうございます。

・ベクターさんでお勧めソフトとしてPickUPして頂きました。

・雑誌「ネットラン」2009年8月号に収録して頂きました。

・雑誌「IP」2013年9月号に収録して頂きました。

・ベクターさんでレビューをして頂きました。

・教えて君.netさんで紹介して頂きました。


【xdoc2txtについて】
xdoc2txtはhishida氏の作品となります。hishida氏のご好意によりbutterfly_searchに同梱させて
頂いております。ありがとうございます。


【一括検索のデフォルト値について】
デフォルトで表示される下記2つのリストはそれぞれ下記のHPより
借用させて頂いたものです。ありがとうございます。
・四文字熟語
 Mr.凡人様
 http://www.h3.dion.ne.jp/~urutora/yojijukugopeji.htm
・放送コード
 monoroch(モノロク)様
 http://monoroch.net/kinshi
 
※デフォルト値はツールの動作の理解を深める為のものであり、
 著作権は、Mr.凡人様及びmonoroch(モノロク)様にあります。実際に検索する際は、ご自身で
 定義し直してのご利用をお願いいたします。