Overview

AgriSoil Microbe Atlas は、最先端技術を用いて、多様な土壌に生息する微生物ゲノム情報の収集・解析を行い、それらをデータベース化しています。 本ドキュメントは、AgriSoil Microbe Atlas の構成および操作方法に関して記述したものです。

Quick Start

データ解析

データ閲覧ページでは、選択されたデータに対していくつかのデータ解析を行うことが可能です。 下図は、16S rRNA 解析における一部データに対し、オンデマンドでβ多様性を行った結果となります。

Dataset

データベース中で取り扱うデータの種類は、下記に示すように大きく2種類あります。 メタデータは、解析データを説明するために使用するデータです。サンプルの情報や、解析パイプラインの情報、実験情報などが含まれます。 解析データは、各種現象を測定したデータになります。16S rRNA 解析にて測定した細菌叢の相対存在量や、メタゲノム、シングルセルゲノムデータなどが含まれます。
  • メタデータ
  • 解析データ

メタデータ

本データベースで取り扱うメタデータは下記の通りです。
Data Type 16SやSAG, MAGなど、本データベースで取り扱うためのデータタイプを記述します。
Analysis Pipeline データ解析が行われたときに使用した解析方法を記述します。
Sample サンプルの情報を記述します。
 Plant 宿主植物を記述します。
 Fraction サンプルの採取位置(根表面、根圏など)を記述します。
 Locations 圃場の場所(都道府県(市町村))を記述します。
 Plant Genotype サンプルの遺伝型を記述します。
 Growth stage サンプルの成長段階を記述します。
 Inactivations サンプルの滅菌の有無を記述します。
 Cover crops サンプルの前作条件を記述します。
 Soil Treatment サンプルを採取した土壌の施肥条件や燻蒸処理などを記述します。
 Growth Condition サンプルの生育状態を記述します。
Experiment 実験条件を記述します。主にサンプルシートと等価です。
Run ラン条件を記述します。主にFastqと等価です。

解析データ

本データベースでは、下記の解析データを取り扱います。
Amplicon 16SやITSなどの領域を増幅して解析した、生物系統の存在量の相対比率データを取り扱います。
Metagenome 環境中から直接回収したDNAを解析したデータや、複数の微生物個体の混合産物を解析したデータを取り扱います。
Genome 単離培養された菌株のゲノムデータや、シングルセル単位で単離したゲノムデータ、 メタゲノム等から分別されたゲノムデータ (e.g. Metagenome-Assembled Genome: MAG) を取り扱います。
Gene Function メタゲノムおよびゲノムに対する、遺伝子機能の保有率データを取り扱います。

Release

データベースに登録される解析データは、サンプルの追加やツールのバージョンアップにより、再解析が行われる場合があります。 とくに16Sなどは、サンプルの追加により毎回再解析を行う必要性がありますし、MAGなどはツールの性能向上などによる再解析が発生しやすいです。 本データベースでは、ユーザが閲覧するデータの1まとまりをリリースという単位で関連付けて管理します。 1つのデータは複数のリリースに関連付けることができます。 一方で、1つのリリースに同じデータを重複して関連付けることはできません。

16S rRNA 解析の例

16S rRNA 解析やITS 解析は、サンプルの追加ごとに再解析が発生するため、その都度リリースを作成します。 下図は、N個のサンプルで解析したデータセットをリリース1として公開。 その後、2つのサンプルが追加され、リリース2を作成した例となります。

SAG 解析の例

MetagenomeやSAG, MAGは、ツールや解析パイプラインのバージョンアップなどにより再解析が実施されます。 16Sなどのアンプリコン解析とは異なり、それぞれのデータがそれぞれのタイミングで再解析されるため、 下図に示すSAG4ように、1つのデータが複数のリリースに紐づけられるようになっています。

View

データベースに登録されているデータを閲覧するための、基本的なビューに関する記述となります。

リストビュー

リストビューは、データを一覧で表示するビューです。 これらは、リリースやサンプルの条件で表示するデータをフィルタリングするパネル、ページ遷移操作、表示部位で構成されます。 下図は、アンプリコンデータの16S rRNAデータの一覧表示を表しています。 16Sのデータは、サンプル条件に加え、細菌叢のパターンを割合グラフで表示します。 細菌叢の割合グラフは、phlyumのデータを使用しています。

フィルタリングツール

アンプリコン、ゲノム、およびメタゲノムのデータ一覧ビューには、サンプルメタデータによるフィルタリング機能が備わっています。 「Filter」をクリックすることで、フィルタリングツールが展開します。 リリースデータ選択、各メタデータのデータ数とメタデータのチェックボックス、キーワード検索を行うことが可能です。 ゲノムにおいては、コンプリート率とコンタミ率によるフィルタリングも行うことが可能です。

Analysis Function

β diversity analysis

本データベースは、β 多様性解析機能を実装しています。 β 多様性解析機能は、アンプリコンデータに対して実施できます。 アンプリコンの一覧ページを表示している状態で、各種フィルタリングを実施後、「UMAPを作成」ボタンをクリックします。 選択されたデータの菌叢パターンを使用し、サンプルを類似度に従い2次元上に配置します。 下図は、β 多様性解析を行った例です。
β 多様性解析の結果に対して、投げ縄ツールを使用して興味対象のサンプルを選択することができます。 選択されたサンプルは、「選択結果でリストを更新」ボタンをクリックすることで、リストビューに表示されます。

Genome/Metagenome Statistics

ゲノムおよびメタゲノムで表示されているデータに関して、各種パラメータの統計情報をヴァイオリンプロットとボックスプロットで表示します。

Gene function analysis

本データベースは、メタゲノムまたはゲノムが保有する遺伝子機能の保有率をヒートマップとして表示することができます。それぞれのタイルの色は機能に基づく大分類、透明度は関連遺伝子の保有率(%)を表しています。

Authentication

本データベースは、管理者により登録されたユーザだけが利用できます。 ユーザがアクセスできる機能は、権限によって制御されます。 例えば、研究者は測定データの登録や更新、削除が可能ですが、ユーザの登録や削除はできません。
画面右上にある login リンクをクリックし、emailアドレスおよびパスワードを入力することで、データベースにログインします。 ログインすることで与えられた権限により各種機能へアクセスすることが可能となります。
データベースの利用を終える場合は、画面右上から Log Out してください。

Role

本データベースでは、主に Admin, Developer, User の3つの権限が存在します。 各権限がアクセスできる機能は下表のようになります。 ユーザはデータベースに登録されるときにこれらの権限を割り振られます。
Admin Developer User
ユーザ管理
メタデータ管理
解析データ管理
リリース管理
データ閲覧