The large-scale organization of metabolic networks.
Jeong H, Tombor B, Albert R, Oltvai ZN, Barabási AL.
Nature. 2000 Oct 5;407(6804):651-4.
【まとめ】
43種類の生物(古細菌、細菌、真核生物)の細胞内代謝ネットワークを、酵素反応の基質を「頂点」、反応を「枝」で表したネットワークと考えたところ、これらの代謝ネットワークは、
生物種によらずスケールフリー・ネットワークの特徴を示したことを報告する。これにより、細胞の代謝ネットワークが示す頑健でエラー耐性があるという特徴は、それがスケールフリー・ネットワークであることに基づくと考えられる。
【論文内容】
生命現象の過程に見られる頑健性(robustness)は、蛋白、DNA、RNA、小分子などといった構成要素の動的な相互作用による。この相互作用は極めて複雑なネットワークであるが、それを複雑系(complex system)としてとらえることが可能になりつつある。複雑系は以前より、古典的な
ランダムネットワーク理論(Erdös–Rényiモデル)で考えられてきた。これは、構成要素を頂点とし、それらがある確率pをもってランダムに連結されたグラフである。このネットワークは図1aのようなものであるが、その結合性は図1bで表されるような均一なポアソン分布となる。すなわち、頂点から出る枝の数kは平均値〈k〉をピークとして、その確率分布P(k)は指数関数的に減少する。
一方、World-Wide Webやインターネットなどが示す現実のネットワーク(図1c)は、このようなランダムな構造ではなく、P(k)がベキ法則(power-law)で減少する
スケールフリー・ネットワークである。スケールフリー・ネットワークは、非常に多い数の枝を持つ少数の頂点(ハブ)と枝の数が少ない大多数の頂点からなるという、極めて不均一なトポロジーを示すネットワークである。これは、少しずつ頂点が加わっていくというネットワークの「成長」と、新しい頂点がハブに優先的に結合するという「優先的選択」によって形成されることが分かっている。
図1 2種類のネットワーク構造の特徴
a, 指数関数的(Exponential)ネットワーク。ランダムネットワーク、Erdös–Rényi モデルとも呼ばれる。b, ネットワークの頂点がk本の枝を持つ確率はP(k)は平均値〈k〉をピークに指数関数的に減少する。そのため、枝の数が極端に大きい頂点は存在しない。c, フリースケール(Scale-free)ネットワーク。「ハブ」と呼ばれる、枝の数が極端に大きい頂点(灰色の●)が少数存在する。d, スケールフリー・ネットワークでは、P(k)はピークを持たず、ベキ法則に従って減少する。P(k) ≈ K^-γであり、これは両対数グラフで傾きが-γの直線で表される。e, E. coliの代謝反応の一部をグラフ理論で表示したもの。このグラフにおいて頂点(四角で囲まれた部分)は酵素反応における基質である。いくつかの基質(educt)が複合体を作り、酵素によって反応を起こし、産物(products)となる。productはさらなる酵素反応のeductになっている。酵素反応はこれらの頂点を結ぶ枝であり、その反応をつかさどる酵素はEC番号で表示されている。
細胞ネットワークの大規模構造を理解する手始めとして、43種の生物の主要代謝ネットワークのトポロジー特性を検討した。ここでは、代謝パスウェイとゲノムの統合データベースである
WIT databaseを用いた。代謝ネットワークにおける反応は、図1eのようなグラフで表した。ここでは酵素反応の基質が頂点で、酵素反応が枝、代謝をつかさどる酵素がEC番号で表示されている。さまざまな代謝ネットワークをこのようなグラフで表すことにより、グラフ理論と統計学を用いてそのトポロジー特性を検討したり定量化したりすることが可能になる。
代謝ネットワークは、ランダムで均質な指数関数的モデルと、非均質なスケールフリーモデルのどちらで表されるのだろうか?結果は図2に示すように、酵素の基質(頂点)がk個の酵素反応(枝の本数がk本)である確率はベキ法則P(k) ≈ K^-γに従っていた(図2のa、b、cはそれぞれ古細菌、細菌、真核生物の代表例、dは43種すべての平均)。すなわち、
代謝ネットワークはスケールフリー・ネットワークであった。頂点あたりの枝の数kは、頂点に入ってくる枝と出ていく枝でそれぞれk_inとk_outと表わされ、それぞれのベキ指数γ_inとγ_outはいずれも2.2であった。
図2 さまざまな生物の代謝ネットワークの結合性分布
a: 古細菌(Archaeoglobus fulgidus)、b: 細菌(E. coli)、c: 真核生物(C. elegans)。代謝における酵素反応の基質を頂点とし、酵素反応を枝としたとき、頂点あたりの枝の数kと、その枝数をもつ確率P(k)の関係を両対数グラフで表したもの。Inは頂点に入ってくる枝、Outは頂点から出ていく枝についてkの確率分布を表している。a、b、cのいずれも、両対数グラフでマイナスの傾きを持つ直線で表されるため、P(k)がベキ法則に従っていることが分かる。dは、検討した43生物のすべての結合性分布の平均を表す。
多くの複雑ネットワークでは、2つの頂点は比較的短い距離(=少数の枝の数)で連結されている。このようなネットワークを
スモールワールドであるという。図3aはE. coliの代謝ネットワークがスモールワールドであることを表すヒストグラムである。図3aの横軸は、E. coli代謝ネットワークの2頂点間の距離(2つの頂点が最短でいくつの枝で連結されているか、
lはpathway
length)、縦軸は任意の頂点間の距離の頻度Π(
l)を示す。これによると頂点間の距離は3であることが最も多く、
代謝ネットワークはスモールワールドであることが分かる。
また、2頂点の最短距離を全部の頂点間で平均したもの(グラフ理論における平均距離)を、ここではネットワークの直径(diameter)と呼ぶ。直径が小さい方が、ネットワーク内の伝達が速いことになる。単純な細菌(例えば
Mycoplasma genitalium)に比べるとより複雑な細菌(
E. coli)は酵素や基質が多い(頂点や枝が多い)のだから、代謝ネットワークの直径は大きくなるように思われる。ところが図3bに示したように、
43種類の生物すべてで代謝ネットワークの直径は同じであった(大体3程度)。この結果は予想外であったが、生物が複雑になり頂点数が増加しても、その分連結も増加するのであれば、2頂点間の経路は増大せず、ネットワークの直径は一定になりうる(頂点数が増えてもその分経路も増えれば、頂点から頂点への行きやすさは全体的にあまり変わらないということ)。実際、図3cとdで見るように、生物が複雑になって酵素反応の基質の種類(頂点の数 N)が増加すると、基質あたりの反応数(頂点あたりの枝の数 L/N)が増加していることが分かる。なお、cは入ってくる枝、dは出ていく枝であり、赤が古細菌、緑が細菌、青が真核生物での結果を示している。
図3 生物種によらず、代謝ネットワークの直径は一定である
a, E. coliの代謝ネットワークで、代謝産物を頂点としたときの2頂点間の距離(最短経路、pathway lengthのl)のヒストグラム。縦軸のΠ(l)は、任意の2つの頂点がlの距離を取る頻度を表す。これによると頂点間の距離は3であることが最も多く、代謝ネットワークはスモールワールドであることが分かる。 b, 43種類の生物の代謝ネットワークの平均距離 (直径)。エラーバーは標準偏差σであり、aの説明にあるΠ(l)により求められたlを用いて〈l^2〉-〈l〉^2で近似される。ネットワークの頂点数Nが大きくなっても、ネットワークの直径dは変わらない。c, d,生物が複雑になって酵素反応の基質の種類(頂点の数 N)が増加すると、基質あたりの反応数の平均(頂点あたりの枝の数の平均 L/N)が増加することが分かる。cは入ってくる枝、dは出ていく枝についてであり、赤は古細菌、緑は細菌、青は真核生物。e, E. coliの代謝ネットワークから基質を除外した場合の直径に及ぼす影響。赤は枝の多い頂点(関わる酵素反応が多い基質)から順に除外した場合、緑はランダムに頂点を除外した場合。除外する頂点数M=60で、代謝に見られる基質の約8%を除外したことに相当する。f, 43種の生物の代謝ネットワークにある基質のうち、平均のランク順〈r〉とその標準偏差σの関係。ランクが高い(横軸で数値が小さい)基質は、普遍的に多くの生物で用いられており、その基質のランクは生物間のばらつきが少ない。
スケールフリー・ネットワークは、少数のハブによってネットワーク全体の結合が保たれているので、ハブが外部から攻撃されたときはネットワークは脆弱である。枝の数が多い頂点(大きなハブ)から順番に取り除いていくと、ネットワークの直径が急速に増加し(=結合性が弱くなり)、非連結のクラスターに分解されてしまう。しかしその一方で、スケールフリー・ネットワークにはハブが存在するそのことにより、ランダムに起きるネットワークのエラーには予想外の頑健性を示す。
そこで、
E. coliの代謝ネットワークにも、このような
「攻撃に対する脆弱性とエラーに対する耐性」が見られるかをコンピュータ・シミュレーションで検討した。図3eの赤い△のように、最も多く連結している頂点(基質)から順に除外していくと、代謝ネットワークの直径は急速に増加した(Mは除外する基質数、横軸右に行くにしたがい徐々にはハブを除外)。しかし、緑の□のようにランダムに基質を除外していっても、ネットワークの直径は変わらない。仮にランダムな酵素の変異が起きていくつかの基質ができなくなったとしても、これによってネットワークの連結性はほとんど影響を受けないことが分かる。なお、ここでハブとなる基質はごく少数なので、ランダムに起きる酵素の変異によってハブが消失する確率は非常に低いのだろう。このようなE. coli代謝ネットワークの変異に対する耐性は、
in silicoと
in vivoで変異を起こす研究で詳細に検討されている (
Edwards JS, PNAS 2000)。なお本研究では、43種類の生物すべてに同様のエラー耐性が認められた。
代謝ネットワークの大規模構造の特性はネットワークがハブを持つことによると考えられるが、全生物で同じ基質がハブとして働いているのか、それともハブは生物ごとに違いがあるのか?これを検討したところ、43の生物でハブとして働く基質のランキングは事実上同じ(論文の
supplementary Table 1)であった。43の生物で認められる全種類の基質の中で、ハブとなる基質は4%のみである。すなわち、
生物はごく少数の基質を普遍的に利用していることが分かる。一方、生物に特異的な違いの見られる基質は、反応の枝の数が少ない。これを定量的に表すために、43の生物で認められた基質ランキングr の標準偏差σ(r)を図3fに示した。ハブとなる基質のランク順の平均〈r〉が大きくなるほど、σ(r)が大きくなっており、これは基質としての利用ランクが高いもの(〈r〉が小さいもの)ほど生物間のばらつきが少ない(σが小さい)ことを表している。以上より、43の生物種の代謝ネットワークにおいて、多くの枝を持つ頂点は生物間で普遍的に用いられており、枝の少ない頂点は生物によってばらつきがある。
生物が現在示す代謝ネットワークのトポロジーは、
内部からのエラーと外部からの攪乱に対する頑健性や、ある特定の生物が環境のニッチに占めるための特性を得るために長い進化の過程において獲得してきたものと思われる。その結果、このようなネットワークはランダムなものではなく、頑健性とエラー耐性を持つスケールフリー・ネットワークになったのだろう。また、
ここで検討したすべての生物でネットワークの直径は同じであり、これも進化の過程で保存されたものなのだろう。もし直径がもっと大きいと内的エラーや外的変化に効率よく対応できず、生存に不利だったのかもしれない。また、スケールフリー・ネットワークは他の細胞内ネットワーク(例えば、アポトーシスや細胞周期ネットワーク)に普遍的に存在するものだろうか?現時点では代謝以外のネットワークは分かっている頂点数や枝の数がまだ小さいので、本研究のように数学的ツールで統計学的に解析するのは難しい。しかし、代謝経路以外の細胞内ネットワークでも結合性の分布がベキ法則に従うことが予想され、上記のようなスケールフリー・ネットワークになっている可能性を今後検討したい。