NalaPro Technologies
 
お問い合せCutting Edge Natural Language Processing Solution
GENPAC相互作用データベース
情報抽出・ソフトウェア開発
受託解析
アノテーション
ナレッジベース
What is GENPAC
Japanese | English
Home » Products » GENPAC

GENPACとは
・ライフサイエンス専門用語辞書と高度な自然言語処理技術を用いて、MEDLINEアブストラクト内の概念(遺伝子/蛋白質、化合物、疾患、生命現象、器官、組織、細胞内器官、等)の関係情報をデータベース化したものです。

GENPACの特徴
すぐれたデータ品質: 機械+人手による「偏りが少なく教科書的でない」質の高いデータ。
フレキシブルな対応が可能: 辞書の追加やデータ表示の変更などお客様のリクエストに応じたカスタマイズが可能。

価格・機能

製品名 GENPAC GENPAC
(アカウント作成版)
GENPAC-Premium
価格・ライセンス形態 無料 無料
(要アカウント作成)
年間8万円/サイト
ライセンス
(研究室単位)

関係検索
Network Viewer
検索履歴 ×
関係表ダウンロード × ×
バッチ+関係検索 × 最大100個 無制限
(推奨1000個以内)
 

Features

GENPACの特徴は、充実した専門用語辞書と高度な自然言語処理技術(Natural Language
Processing)を利用した「教科書的でない網羅性の高いデータ」にあります。

専門用語辞書

当社は専門用語辞書構築の第一人者である高木利久東京大学教授の研究成果を用い、質・量ともに他に類を見ない網羅的な遺伝子、化合物、疾患の専門用語辞書を用意しています。

自然言語処理技術

当社は自然言語処理の世界的権威である辻井潤一東京大学教授の研究成果を用い、高機能コンピュータを使った深い構文解析(Deep Parsing)を行っています。

他のテキスト・マイニングシステムでは統計処理(出現頻度や共起関係に依存)や浅い構文解析(Shallow Parsing)によって情報を抽出している為、抽出精度が低い。また、マニュアル(人手)キュレーションのみを行っているものは既知の教科書的な情報に偏りがちとなります。

Comparison in performance

マニュアルキュレーション・システムとGENPACの違い

 マニュアルキュレーション
システム
GENPAC
データの特徴 信頼性が高い 最新で網羅性が高い
対象文献 IFの高いジャーナルの論文が中心 MEDLINEに登録される1,300万件の論文
拡張性、機能の
カスタマイズ
限定的(例:生物種、対象文献) フレキシブル(例:11種類の生物種、任意の文献)
短所 教科書的なあたりまえの知識を収録(データに偏り有) 抽出結果にエラーを含む。ただし、正解率= 0.8以上
得意とする用途 実験の解釈、バリデーション 新規知識の発見、実験のデザイン、論文の分類、整理
データの
更新頻度
頻度は低い 月1回

 

Specification

  • 生物種
    • ヒト、マウス、ラット、ゼブラフィッシュ、ショウジョウバエ、線虫、シロイヌナズナ、分裂酵母、出芽酵母、枯草菌、大腸菌の11種類
  • 辞書
    • 遺伝子、タンパク質名辞書: 180,000 / 1,000,000以上*
    • 化合物名辞書: 400,000 / 1,700,000以上*
    • 疾患名辞書: 23,000 / 64,000以上*
          *: シノニムを含んだ総ターム数
  • 情報抽出データ数:100万件以上(自然言語処理による抽出分)
  • データ更新:毎月
  • 対象文献
    • MEDLINEに登録された論文のアブストラクト
  • 公的データベースへのリンク
    • PubMed, EntrezGene, UniProtKB/Swiss-Prot, MeSH, GeneOntology,
      ChemIDplus, OMIM, etc.
Genpac Search
Add to Firefox SearchFirefox 検索バーにインストール