NalaPro Technologies
 
お問い合せCutting Edge Natural Language Processing Solution
GENPAC相互作用データベース
GENPACについて
GENPAC活用事例
提供サービス
ナレッジベース
Technology
Japanese | English
Home » Company » Technology

“ポストゲノム時代”においてゲノムという生命の共通言語解析が進んだために、バイオ研究者は自身の専門分野を越えて広範囲な領域に分散する知識・情報の獲得が必要とされています。
さらに、ゲノム解読と並行して進められたさまざまな解析技術の急速な進歩が大量の実験データを研究者にもたらし、それらを解釈し報告する文献の量も膨大なものとなっています。

Technology in stream, IMAGE

私たちは、東京大学で研究された最先端の研究成果をもとに、

  1. 豊富なシノニムの情報と用語の関係を整理するためのオントロジを登録した
    独自の専門用語辞書
  2. 正確で深い自然言語解析プログラム
  3. 健康や医療における興味ある情報の記述され方について蓄積されたナレッジ

を活用した情報処理システムを構築し、情報・知識の抽出・整理・統合を推進します。

GENPAC ユーザインターフェイスと情報抽出結果のネットワーク表示例

このようなシステムを、創薬やゲノミクス・プロテオミクスを推進する研究現場に提供し、興味ある疾患に関わる遺伝子情報、遺伝子が他の遺伝子とどのように関係するかといったパスウェイ情報、遺伝子に作用する化合物に関する情報などへの、効率的なアクセスを強力に支援していくことが、ナラプロ・テクノロジーズのミッションです。

 

ナラプロ・テクノロジーズのテキストマイニング技術は、東京大学の情報生命科学専攻・高木利久教授率いる高木研究室と、コンピュータ科学専攻・辻井潤一教授率いる辻井研究室の研究成果を元にしています。

Prof. Takagi

高木研究室では、「知識処理技術を用いた生命システムの再構築とその解析」をテーマに、文献やゲノム配列からの知識・情報抽出とそれを基にした知識の表現・発見・解析などの研究に長年取り組んできました。それらの研究の中から特に、知識抽出の元になる辞書の開発、知識理解の為のオントロジー利用、生命科学分野における情報抽出技術などの研究成果を基盤技術として、ナラプロ・テクノロジーズのシステムは構築されています。

 

Prof. Tsujii

辻井研究室では「人間の言語(自然言語)をコンピュータで理解する」ことをテーマに研究に取り組んでいます。これは、自然言語処理(Natural Language Processing)と呼ばれる研究分野で、広く機械翻訳・検索・質問応答などに応用される技術です。膨大なテキストから有用な情報を発掘することを目的として、広く機械学習や文法理論などに基づく情報抽出、構文解析、テキストマイニングなどの研究を進めています。ナラプロ・テクノロジーズでは、この研究室の最新の研究成果である構文解析ツールEnju(深い構文解析を行うパーサ)を利用して、情報抽出を行っています。

 

Prof. Natsume

また、ユーザーの視点から、技術開発にアドバイスしているのは、産業総合研究所・蛋白質ネットワーク解析チームの夏目徹チームリーダーです。
夏目チームは、「蛋白質複合体の構成タンパクの解析、タンパク質相互作用の翻訳後修飾による調節」などをテーマに、プロテオミクスの最新技術を使った大規模蛋白質ネットワーク解析に取り組んでいます。実際の研究現場でどのような支援がシステムとして可能なのか、私たちは常にこの視点を忘れずに開発を進めます。

Genpac Search
Add to Firefox SearchFirefox 検索バーにインストール