Upload
basis-technology
View
1.336
Download
3
Embed Size (px)
DESCRIPTION
Rosette® 基本言語解析モジュール(Elasticsearch向け) 多言語テキスト解析プラグイン Elasticsearch を使用して新しいアプリケーションを開発するにあたって、多言語コンテンツにおける形態素の複雑性を考慮していますか? Basis Technology の Rosette はアジア、ヨーロッパ、および中東の言語の強力なテキスト解析機能 (トークン化、基本形化、複合語分解、品詞タグ付、さらに、固有表現抽出、固有表現関連付け) を提供します。
Citation preview
Elasticsearch向け
多言語解析プラグイン
本社:Basis Technology Corporation所在地: 米国マサチューセッツ州
業務内容:言語処理ソフトウェアの開発および提供
主な顧客:
Basis Technology概要
Carl Hoffman(CEO)
Takashi Eguchi
Elasticsearch Boston
http://www.hackreduce.org/
Rosette基本言語解析モジュール
Search Essentialsfor
3Does
Neatthings
1
多言語対応!
Japanese
Chinese
English
Korean
Arabic
German
Russian
For 24 languages!
2
Rosette Search Essentials
1. プラグインとしてドロップするだけで使用可能!
2. 分かち書きの正確性、未知語にも対応!
3. High performance!
3
言語処理のサポート
● 複合語分割(Decompounding)例)水泳大会 → 水泳 + 大会
● 基本語化(Lemmatization)例)行われ → 行う
● 正規化(Normalization)例)ステイタス → ステータス
サポートされる予定の機能
● etc...
● 正規化機能の拡張例)百 → 100
● Many to 1 (表記揺れ対応)例)ベイシス、BT → ベイシステクノロジー