|
|
GENPACとは
・ライフサイエンス専門用語辞書と高度な自然言語処理技術を用いて、MEDLINEアブストラクト内の概念(遺伝子/蛋白質、化合物、疾患、生命現象、器官、組織、細胞内器官、等)の関係情報をデータベース化したものです。
GENPACの特徴
・すぐれたデータ品質: 機械+人手による「偏りが少なく教科書的でない」質の高いデータ。
・フレキシブルな対応が可能: 辞書の追加やデータ表示の変更などお客様のリクエストに応じたカスタマイズが可能。
価格・機能
| 製品名 |
GENPAC |
GENPAC (アカウント作成版) |
GENPAC-Premium |
| 価格・ライセンス形態 |
無料 |
無料 (要アカウント作成) |
年間8万円/サイト ライセンス (研究室単位) |
機 能 |
関係検索 |
○ |
○ |
○ |
| Network Viewer |
○ |
○ |
○ |
| 検索履歴 |
× |
○ |
○ |
| 関係表ダウンロード |
× |
× |
○ |
| バッチ+関係検索 |
× |
遺伝子:100個まで 文献:200件まで |
最大500個 ※これ以上の件数の解析をご希望の場合はお問い合わせください。 |
Features
GENPACの特徴は、充実した専門用語辞書と高度な自然言語処理技術(Natural Language Processing)を利用した「教科書的でない網羅性の高いデータ」にあります。
専門用語辞書
当社は専門用語辞書構築の第一人者である高木利久東京大学教授の研究成果を用い、質・量ともに他に類を見ない網羅的な遺伝子、化合物、疾患の専門用語辞書を用意しています。
自然言語処理技術
当社は自然言語処理の世界的権威である辻井潤一東京大学教授の研究成果を用い、高機能コンピュータを使った深い構文解析(Deep Parsing)を行っています。
他のテキスト・マイニングシステムでは統計処理(出現頻度や共起関係に依存)や浅い構文解析(Shallow Parsing)によって情報を抽出している為、抽出精度が低い。また、マニュアル(人手)キュレーションのみを行っているものは既知の教科書的な情報に偏りがちとなります。
マニュアルキュレーション・システムとGENPACの違い
| | マニュアルキュレーション システム | GENPAC |
| データの特徴 |
信頼性が高い |
最新で網羅性が高い |
| 対象文献 |
IFの高いジャーナルの論文が中心 |
MEDLINEに登録される1,300万件の論文 |
拡張性、機能の カスタマイズ |
限定的(例:生物種、対象文献) |
フレキシブル(例:11種類の生物種、任意の文献) |
| 短所 |
教科書的なあたりまえの知識を収録(データに偏り有) |
抽出結果にエラーを含む。ただし、正解率= 0.8以上 |
| 得意とする用途 |
実験の解釈、バリデーション |
新規知識の発見、実験のデザイン、論文の分類、整理 |
データの 更新頻度 |
頻度は低い |
月1回 |
Specification
- 生物種
- ヒト、マウス、ラット、ゼブラフィッシュ、ショウジョウバエ、線虫、シロイヌナズナ、分裂酵母、出芽酵母、枯草菌、大腸菌の11種類
- 辞書
- 遺伝子、タンパク質名辞書: 180,000 / 1,000,000以上*
- 化合物名辞書: 400,000 / 1,700,000以上*
- 疾患名辞書: 23,000 / 64,000以上*
*: シノニムを含んだ総ターム数
- 情報抽出データ数:100万件以上(自然言語処理による抽出分)
-
- データ更新:毎月
- 対象文献
- 公的データベースへのリンク
- PubMed, EntrezGene, UniProtKB/Swiss-Prot, MeSH, GeneOntology,
ChemIDplus, OMIM, etc.
|