オプション商品(QuickSolution)

「データスパイダー」はこちら

検索システムの抱える問題を独自のアプローチで克服

ネットワーク社会の進展・ストレージ技術の発展で、膨大な情報を蓄積することが可能になりました。それら大量の情報を活用するには、優れた検索がますます重要になってきています。多くの形態素解析方式を採用した検索システムでは、辞書や文法の情報を用いて検索されます。しかし増え続ける情報には、新しい言葉や言葉の使い方が溢れているため辞書の整備が困難になり、正確な文法に従わない文章も多く、期待した検索ができないという問題が生じます。
QuickSolutionは、言語体系に依存しない独自性の高い統計処理によるアルゴリズムを採用して、この問題を解消。増え続ける情報に真の力をもたらすエンジンです。

柔軟かつ強力な検索力と分析力

・ 10GB(1000万件)のテキストを0.1秒で類似検索
・ 1テラバイト1億件のテキストも検索可能
・ パーソナルユースから大規模コーポレートユースのデータまで幅広い用途に適用可能
・ 3つの検索(類似・キーワード・属性検索)をひとつのエンジンで提供
・ キーワード抽出・関連語抽出を用いて検索効率を劇的に向上
・ キーワード抽出・クラスタリング・可視化等、テキストマイニングやナレッジマネジメントに展開可能な機能もサポート

辞書が不要でクイックスタートが可能、TCO削減に寄与

・ 専門用語・製品名・型番等の特殊用語や新語を含むドキュメントにも即対応
・ 辞書チューニング・メンテナンスの運用コストを削減
・ 簡単な設定でXMLデータベースやRDB、ファイルサーバ上の各種文書ファイルを検索対象化
・ Lotus Notes/Dominoや、MS Exchange Serverにもオプションで対応
・ 英語、中国語等の他言語や、それらが混在する多彩なドキュメントにも対応

組込み・システム連携も容易でありながら機能拡張性も確保

・ Javaで実装、幅広い動作環境をサポート
・ Java / RMI / COM APIを用いたサーバ型の検索システムを容易に構築
・ エンジン部をJavaクラスライブラリとして組込むことも可能
・ APIを使用して更新データのリアルタイム検索を実現
・ 新たなデータ形式への対応はデータリーダのカスタマイズのみで吸収

検索機能

類似検索

自然文による類似ドキュメントの検索

キーワード検索

キーワードを指定して全文検索

属性検索

Enum型、数値型、日付型等のフィールド検索

これらを組み合わせた絞込み検索を繰り返し実行して、効率的に検索を行うことが可能です。更に、利用分野・用途に合わせて、同義語、類義語等を関連語辞書に登録することにより、関連語も含めた検索を行う等、様々な拡張検索機能をサポートしています。

統合検索機能

横断検索 : 種類や構造の異なる複数データベースの横断検索
分散検索 : 複数サーバ間の協調による分散検索

キーワード抽出・関連語抽出機能

従来のキーワード自動抽出は、辞書を用いた形態素解析により入力文を単語に分解し、その後、品詞情報、頻度情報をもとにキーワードを抽出するという手法が一般的でした。しかし、辞書を用いる手法は、インターネット上に日々出現する新語や、企業における製品名・型番等の特殊用語を扱う上では問題になります。
QuickSolutionでは、辞書を用いないで、文字列の出現頻度、出現集中度を用いてキーワードを抽出するアルゴリズムを採用しています。

クラスタリング機能

蓄積されたドキュメント群(Q&Aデータ、メール等)を類似度をもとに、分類しグループに分けること(クラスタリング)ができます。また、クラスタリングしたグループ毎に典型的な代表ドキュメントを選出することが可能です。この機能を利用して、例えば蓄積されたQ&AデータからFAQ(Frequently Asked Questions)を作成することができます。

類似情報検索エンジン [クイックソリューション]

類似検索とは

ドキュメント群の中から自然文で入力された質問文と類似するドキュメントを検索する技術で、質問文と完全一致しなくても検索が可能です。

■ 検索例

類似検索の処理フロー

対象データ(対応データ形式)

・CSVファイル(複数CSVファイル対応)、テキストファイル
・文書ファイル(Word、Excel、PowerPoint、PDF、一太郎、HTML、DocuWorks)
・RDB(Oracle、DB2、SQL Server、Access、PostgreSQL、MySQL)
・XML-DB(NeoCore XMS、Sonic XIS、EsTerra XSS)
・XMLファイル
・Net-It Central
・AL-Mailメールボックス
・Lotus Notes/Domino、MS Exchange OPTION
・AutoCAD OPTION

※データリーダの追加により、その他のデータベース、データ形式にも対応可能です。 
 最新の対応状況はお問合せください。

管理ツール

・対象データ設定(各種データ形式に対応)
・インデックス管理(スケジューラ)
・関連語辞書編集(同義語、類義語の登録)
・ユーザ辞書編集(重要語、不要語の登録)

クライアントGUI

・Struts版サンプル画面
・サンプル画面(Javaアプリケーション版) OPTION
・サーブレット版サンプル画面
・クラスタリングGUI OPTION

シソーラス OPTION

・基本語 ・経済・法律 ・公共 ・企業名称 ・団体名称 ・化学・石油 ・電力エネルギー
・非鉄・金属 ・自動車 ・機械 ・情報通信・コンピュータ ・土木建築 ・医療・薬学
・放送・時事

アクセスランキング OPTION

・アクセス頻度情報を考慮した順序付けで検索結果を表示

適用例・拡張性

ナレッジポータルへの適用 Webサイト内検索への適用

・類似検索によるナレッジ共有
・様々な種類・形式の既存DBをまとめて横断検索
・分散検索によるスケーラビリティ確保・全社展開
※QuickSolution Portal Tera Editionの場合

・利便性の向上
・専門用語や製品名などをチューニングなしで検索
・膨大なコンテンツ(資産)を活性化

Webサイト内検索への適用 その他

・検索条件により絞り込んだ検索結果を可視化
・キーワード抽出、関連語抽出、クラスタリングを利用
・辞書が不要のため、新語、先端・専門用語も漏れなく分析

・検索条件により絞り込んだ検索結果を可視化
・キーワード抽出、関連語抽出、クラスタリングを利用
・辞書が不要のため、新語、先端・専門用語も漏れなく分析

拡張性

※動作環境、製品構成はWebサイトを参照してください。Windows/Linuxで動作可能です。

ページのトップへ