Home  プロジェクト一覧  ゲノム情報統合プロジェクト

詳細情報

プロジェクト名 ゲノム情報統合プロジェクト
分野 ゲノムインフォマティックス
目的

# ヒト遺伝子の完全なカタログを作成 # H-InvDBを基礎としたアノテーション技術開発 # 疾患、遺伝子発現、タンパク質間相互作用など情報統合

紹介

本プロジェクトは、経済産業省のモデル事業として平成17年度から平成19年度までの3年間にわたり、バイオ産業情報化コンソーシアムを中心としてその他6つの共同研究機関が実施した。ヒト完全長cDNAを詳細にアノテーション(注釈付け)したH-Invitational Database(H-InvDB)を基礎として、その構築のための技術をさらに高度化し、世界最高水準のヒト全遺伝子データベースを構築して公開した。

キーワード ゲノム|遺伝子|アノテーション|統合|データベース
開始-終了年度 2005-2007
代表者 五條堀 孝
代表者所属組織 国立遺伝学研究所 生命情報・DDBJ研究センター|産業技術総合研究所 バイオメディシナル情報研究センター
予算(百万円) 1641
代表委託機関 バイオ産業情報化コンソーシアム|産業技術総合研究所 バイオメディシナル情報研究センター
参加機関 バイオ産業情報化コンソーシアム|産業技術総合研究所|国立遺伝学研究所|国立がんセンター研究所|北海道大学|東京大学|東京医科歯科大学|慶応大学|ビッツ(株)|(株)日立製作所|(株)日立ソフト|(株)ダイナコム|(株)シーズラボ|(株)メイズ|(株)富士通|(株)NECソフト|(株)ホロニクス
論文等(PubMed ID) 18089548 | Yamasaki C, et al. The H-Invitational Database (H-InvDB), a comprehensive annotation resource for human genes and transcripts. Nucleic Acids Research 36, Database issue D793-D799, 2008 17982176 | Matsuya A, et al. Evola: Ortholog database of all human genes in H-InvDB with manual curation of phylogenetic trees. Nucleic Acids Research 36, Database issue D787-D792, 2008 17130147 | Takeda J, et al. (2007) H-DBAS: Alternative splicing database of completely sequenced and manually annotated full-length cDNAs based on H-invitational. Nucleic Acids Research 35, Database issue D104-D109, 2007 五條堀 孝(2007)「ゲノム情報と統合データベース」 蛋白質核酸酵素52(15):pp. 2006-2011
特許(日本、海外) JP2006323830(A) | JP2008097189(A)
アーカイブ
平成17年度-19年度 ゲノム情報統合プロジェクト に関する報告書

成果物 (データベース、解析ツール)

Evola

要約 Evola (Evolutionary annotation database)はH-InvDBのサブデータベースの1つとして、ヒト遺伝子の分子進化アノテーション情報を格納しています。ヒトと14のモデル生物とのオーソログについて、アラインメントや系統樹、正負の自然選択情報を提供しています。オーソログ解析対象の生物はヒト、チンパンジー、オランウータン、マカクザル、マウス、ラット、イヌ、ウマ、ウシ、オポッサム、ニワトリ、ゼブラフィッシュ、メダカ、ミドリフグ、トラフグです。
主な対象データ 比較ゲノム

G-compass

要約 G-compassは比較ゲノム解析研究のためのツールとして開発され、進化的に保存されたゲノム領域とオルソログ遺伝子のデータを提供しています。解析対象はヒト+12生物種です(チンパンジー、マカクザル、マウス、ラット、イヌ、ウマ、ウシ、オポッサム、ニワトリ、ゼブラフィッシュ、メダカ、ミドリフグ)。ゲノムの極保存領域(UCE)とコピー数多型領域(CNV)の情報を提供するとともに、ウィンドウ解析やドットプロットを表示するツールを備えています。
主な対象データ 比較ゲノム

H-ANGEL

要約 H-ANGELは、ヒトの遺伝子発現についての情報を提供するデータベースです。H-Invitationalプロジェクトの構築した転写産物データに対する遺伝子発現パターンを表示します。遺伝子発現パターンは複数の測定プラットフォームを統合した組織特異的発現データに基づき、実用的な組織分類で表現しています。H-ANGELはまた、遺伝子の発現情報をヒトゲノム上の対応する物理的位置上に表示します。これらの情報は、H-InvDBに蓄積された対応する転写産物あるいは遺伝子座のアノテーションデータにリンクされており、こうした統合を通じて、プラットフォーム横断的に遺伝子発現データを比較して眺めることができます。
主な対象データ 遺伝子発現

H-DBAS

要約 H-DBASはヒトの選択的スプライシングのデータベースです。H-InvDBのデータを基に、ゲノムワイドで検出されたヒト選択的スプライシングの様々なアノテーション情報を提供しています。選択的スプライシングバリアントは全長性が保証され、冗長性のないユニークなもの(代表選択的スプライシングバリアント;RASV)が選ばれています。Flashでインタラクティブに操作できるビューアーを実装し、選択的スプライシングのパターンとタンパク機能の関係、ヒトとマウス・ラット・チンパンジー・アカゲザル・イヌの各モデル生物との比較ゲノム解析による選択的スプライシングバリアントの種間保存などを視覚的に表示します。
主な対象データ ヒト・マウス完全長cDNA、ヒト・マウスmRNA、ラット・チンパンジー・アカゲザル・イヌRNA

H-Exp

要約 iAFLP によるヒト組織特異的転写物発現頻度データのDBで、H-InvDB と連携しています。本DBには3つの特徴があり、①表示対象遺伝子クラスター・アイソフォームの検索・参照・ソート、②遺伝子クラスター・アイソフォームに結び付けられた発現頻度パターンデータの比較、③遺伝子単位の発現情報の詳細情報をはじめとする各種関連情報の表示を高速に実行することが可能となっております。
主な対象データ 遺伝子発現

H-InvDB

要約 H-InvDBはヒトの遺伝子と転写産物を対象とした統合データベースです。 ヒトのすべての転写産物の配列をあらゆる手法で解析することにより、ヒト遺伝子の構造、選択的スプライシング、タンパク質としての機能などの精査されたアノテーション(注釈付け)情報を提供しています。
主な対象データ RNA ヒト完全長cDNA, mRNA

HEAT

要約 H-InvDB遺伝子リスト特徴抽出ツールH-InvDB Enrichment Analysis Tool (HEAT)は、ヒト遺伝子の集合(遺伝子リスト)に対して、その特徴を機械的に判定するデータマイニング・ツールです。H-InvDBのさまざまなアノテーション項目について、ユーザが入力した遺伝子リストの中に平均より有意に高い頻度で出現する項目を見つけ出します。この手法は一般にGene Set Enrichment Analysis(GSEA)と呼ばれ、マイクロアレイ実験のデータ解析等によく使われます。統計学的な検定にはフィッシャーの正確確率検定を用いています。
主な対象データ アノテーション

LEGENDA

要約 Legendaは、MEDLINE文献に書かれた遺伝子、遺伝子機能、疾患、または基質のうち、2つが共起した文献を探すシステムです。遺伝子2つのような同じタイプでも検索できます。独自の遺伝子名辞書をもっています。
主な対象データ 文献 、遺伝子、疾患、基質

MDV

要約 Motif Distribution Viewer (MDV)は、プロモーター・モチーフの転写開始点(TSS)付近の位置分布を表示するツールです。プロモーター群をユーザーが指定できます(オリジナルサイトからの訳)。ツールはオリジナルサイトでも利用できますし、ダウンロードしてローカルマシンで利用することもできます。
主な対象データ DNA-モチーフ

PPI view

要約 PPI viewは、ヒトのタンパク質間相互作用 (PPI:Protein-Protein Interaction)情報を表示しています。主要な5つのPPIデータベース(BIND, DIP, MINT, HPRD, IntAct)から、データの収集・統合を行い、H-InvDBの独自予測されたタンパク質についてPPIの割り当てを行いました。その結果、9,268件のタンパク質からなる32,198件のヒトのタンパク質間相互作用情報が得られました。 (H-InvDB version 5.0時点)PPI viewはユーザーの興味あるタンパク質(遺伝子産物)と相互作用するタンパク質を表示し、そのタンパク質の遺伝子の位置(Locus view)や遺伝子の機能情報(cDNA view)へのリンク、そしてデータ元PPIデータベースへの参照情報や、文献、実験手法を表示します。PPI view: http://www.h-invitational.jp/hinv/ppi/ PPI view サンプル画面:http://www.h-invitational.jp/hinv/ppi/ppi_view.cgi?hip=HIP000084307
主な対象データ タンパク質-プロテオーム

TACT

要約 Transcriptome Auto-annotation Conducting Tool (TACT)は相同性検索(BLASTX, FASTY)、ORF予測、モチーフ検索解析(InterProScan)を統合し、真核生物遺伝子の機能を自動予測できる統合的自動アノテーションシステムです。TACTはH-Invitationalプロジェクトの一環として開発され、 ヒト遺伝子アノテーション統合データベースH-Invitational Database (H-InvDB)の構築・発展に貢献しています。
主な対象データ DNA-配列

VarySysDB

要約 VarySysDBは、ゲノム統合プロジェクトによって、H-Inv転写産物に関連付けられる形で注釈付けられたヒト多型情報を、公開する目的で作成されたデータベースです。つまり、転写領域やスプライス・サイト上の一塩基多型、挿入欠失多型、STR多型、単一アミノ酸多型、構造多型、連鎖不平衡領域について、それぞれH-InvDBの転写産物と機能ドメインに関連づけて、情報整備して公開しています。VarySysDBでは、個々の多型情報ごと及び転写産物ごとに整備された情報を、検索し表示ができる他、キーワードによる検索も可能になりました。検索した情報はダウンロードもできます。
主な対象データ DNA-多型

関連プロジェクト