一人抄読会

syodokukai.exblog.jp
ブログトップ

2型糖尿病患者は3つのサブタイプに分けられる―トポロジカルデータ解析に基づくprecision medicineの試み

Identification of type 2 diabetes subgroups through topological analysis of patient similarity.

Li L, Cheng WY, Glicksberg BS, Gottesman O, Tamler R, Chen R, Bottinger EP, Dudley JT.

Sci Transl Med. 2015 Oct 28;7(311):311ra174.

【まとめ】
2型糖尿病は臨床的にも遺伝的にも複雑多様であり、さまざまなサブタイプから成ると考えられている。本研究ではトポロジカルデータ解析という手法を用いて、2型糖尿病患者集団が、臨床的なデータの類似性に基づいて「どのような形の」ネットワークを形成しているかを検討した。その結果明らかになったネットワークの形から、2型糖尿病患者は3つのサブタイプに区別されることが示された。サブタイプ1は糖尿病合併症(糖尿病腎症と網膜症)と関連があり、サブタイプ2はがんと心血管疾患、サブタイプ3は心血管疾患、神経疾患、アレルギー、HIV感染症と関連があった。次に、これらの患者サブタイプの臨床的な表現型とSNPsの関連のデータを解析したところ、各サブタイプに特有の「表現型と遺伝型の関連」が区別して認められた。このように複雑な疾患の新たなサブタイプを見出す本研究の方法は、現在進行しつつあるPrecision Medicine(注1)を推進するものであると考えられる。

トポロジカルデータ解析 (topological data analysis; TDA):
「トポロジカル」という語は、古代ギリシアで普通名詞として使われた「トポス(場所)」に由来する。18世紀以後、トポロジーは数学の一分野として発展した。トポロジカルデータ解析は、一つ一つのデータがネットワーク全体の中で占める「場所」を明らかにし、ネットワークの「形」すなわち「幾何学的な構造」を描き出す解析手法である。大量の複雑なデータから的確な洞察(insight)を得る(意味のあるサブグループを発見する)方法として、Ayasdi(注2)によって開発された。詳しくは、Lum PY, et al. Sci rep 2013を参照。

【論文内容】
2型糖尿病は、その臨床像も遺伝的構造も非常に複雑かつ多様であり、本質的にはさまざまなサブタイプから成ることが想定されている。本研究では、電子診療録(electronic medical records; EMRs)に記録された臨床データを用いて、2型糖尿病の患者集団のネットワークを幾何学的な「形」として表し、そこから臨床的・遺伝的特徴に基づいた2型糖尿病の新しいサブグループを同定することを試みた。対象は、ニューヨークにあるマウントサイナイ病院(Mount Sinai Medical Center)のBiobankに登録された11,210名の患者で、それらの患者のEMRs上の臨床データと、臨床データと遺伝型のデータを結合させたデータセットを用いた。11,210名の患者の内訳は、人種は46%がヒスパニック、32%がアフリカ系アメリカ人、20%がヨーロッパ白人、2%がその他。 性別は61%女性、39%が男性で全体の平均年齢は55.5歳であった。

2型糖尿病の「患者-患者ネットワーク」の作成
まず、EMRの臨床データを用いて、患者の類似性に基づいて患者集団のネットワークを類推する方法を開発した。このネットワークは、患者をグラフ理論でいう「頂点(node)」とし、多種類の臨床指標における類似性に基づいて「辺(edge)」で結んだものである。(臨床指標の種類のことを、ここでは次元(dimension)と呼ぶ。このネットワークでは、非常に多次元の臨床指標に基づいて高度な類似性を示す患者の集団が単一の頂点として示される。) このようにして患者-患者ネットワークを作成したところ、11,210名の患者は図1Aのような2つのクラスターに区別できることが明らかになった。図1Aで左側のクラスター(n=3889)は内分泌代謝異常、免疫異常、感染症、精神障害、循環器系および下部尿路系疾患を有意に多く含んでおり、右側のクラスター(n=7321)は妊娠合併症、呼吸器疾患を多く含んでいた。図1Aの患者-患者ネットワーク上で、2型糖尿病患者がどの場所に多く存在するか(topological enrichment)を調べるため、2型糖尿病患者の多さを色で示した。図1Aでは青→緑色→黄色→赤になるにしたがって2型糖尿病患者が多い頂点であることを表している。これによると2型糖尿病患者はある特定の部位に多く見られたため、2型糖尿病患者集団は複数のクラスターからなることが予想された。そこで次に、2型糖尿病患者2551名を対象として、「2型糖尿病患者のネットワーク」の形を検討した。

その結果、2型糖尿病の患者集団は73の臨床指標をもとに図1Bのようなネットワークの形をしており、3つのクラスターに完全に分離されることが明らかになった。これらをサブタイプ1(n=762)、サブタイプ2 (n=617)、サブタイプ3 (n=1096)と名づけた。なお、図1Bの色分けは頂点の色が赤→黄色→緑色→青になるにしたがって、女性が多い集団から男性が多い集団としている。図1Bを見て分かるように、3つのクラスターは性別には関連がなかった。
d0194774_21452442.jpg

図1A 対象患者全体のネットワークの形(上図)
マウントサイナイ病院のBiobankに登録された11,210名の患者の、臨床指標の類似性に基づくネットワークを示す。ネットワークの頂点(node)は類似性の高い患者の集団を表し、それらを類似性に基づいて辺(edge)で結んでいる。これによると、患者は2つのサブグループに分かれることが分かる。色分けは、青→緑色→黄色→赤となるにしたがって2型糖尿病患者が多い頂点を表しており、2型糖尿病患者はいくつかのサブグループに分けられる可能性があることが分かる。

図1B 2型糖尿病患者のネットワークの形(下図)
次に、上記の患者のうち2551名の2型糖尿病患者について、臨床指標の類似性に基づくネットワークの形を検討した。その結果、2型糖尿病患者集団は3つのサブタイプに分けられることが明らかになった。頂点は類似性の高い患者の集団を表すが、その色分けは赤→黄色→緑色→青となるにしたがって女性が多い集団から男性が多い集団になることを表している。これによると3つのサブタイプで性別の偏りは見られない。


以上で明らかになった3つのクラスターの再現性を検証するため、確認のための訓練事例集合(training set)とテスト事例集合(testing set)のランダム抽出を行った。2型糖尿病患者集団2551名をランダムに2/3をtraining setに、1/3をtest setにと振り分け、上記と同じ73の臨床的指標によって、患者-患者ネットワークを再構築した。このステップを10回繰り返し、10回の検証の適合率と再現率(positive prediction valueとsensitivity)の平均値を求めたところ、training setでの適合率の平均はサブタイプ1、2、3で100%、91%、98%、再現率の平均は99%、96%、94%、同じくtest setでの平均適合率は100%、90%、97%、平均再現率は99%、96%、93%であり、このネットワークのクラスターの高い正確性が確認された。

2型糖尿病患者の各サブタイプに特徴的な臨床指標
この3つのサブタイプにおいて、サブタイプ1に特有な臨床指標は29種、サブタイプ2に特有な臨床指標は3種とサブタイプ3に特有な臨床指標は11種存在した。
サブタイプ1の患者は、最も年齢が低く(59.76±0.45歳)、BMI が高値で(33.07±0.29 kg/㎡)、診察時の血糖が高値(193.69±11.45 mM)であった。そのほかにも、白血球数・好中球数・好酸球数・平均血小板容積が低値で、血小板数は患者の約半数が正常参照値より低値という興味深い特徴が見られた。さらに、診察時のプロトロンビン時間延長、血清アルブミン高値、クレアチニン低値が認められた(なお、サブタイプ1患者の推定GFRは正常参照値よりは低値であった)。さらに、サブタイプ1の患者は血中CO2分圧が高値、1分当たりの呼吸数が少なく、処方ではカルシウム拮抗薬、アンジオテンシン受容体拮抗薬(ARB)/アルドステロン変換酵素阻害剤(ACEI)、DPP4阻害剤、メトフォルミンの投与が少なかった。サブタイプ2 の患者は他のサブタイプに比べて体重が少なく(85.17±1.14 kg)、サブタイプ3の患者は収縮期血圧が高値(135.7±0.7 mmHg)、血清Cl値およびトロポニンI値が高値で、ARB/ACEIとスタチンの投与が多かった。

2型糖尿病患者の各サブタイプに特徴的な併存疾患
次に、ICD-9-CM (国際疾病、傷害および死因統計分類)に基づいた疾患分類ソフトウェアClinical Classification Softwareを用いて、サブタイプごとの併存疾患について検討した。その際、7000以上あるICD-9-CMの詳細な疾患コードを、281の単一疾患または18の広いカテゴリーとして用いることとした。
その結果、サブタイプ1は他のサブタイプと比較して、ICD-9-CMの「その他の上気道呼吸器感染症」、「感染症の予防接種およびスクリーニング」、「合併症のある糖尿病」、「その他の皮膚異常」、「失明および視覚障害」と有意に強い関連があった。サブタイプ2は「気管支および肺の癌」、「部位を特定しない場合の悪性新生物」、「結核」、「冠動脈硬化およびその他の心疾患」、「その他の循環器疾患」と関連があり、サブタイプ3は「HIV感染症」、「外的原因による傷害」、「大動脈および末梢動脈の血栓塞栓症」、「合併症を伴う高血圧および二次性高血圧」、「冠動脈硬化およびその他の心疾患」、「アレルギー反応」、「貧血」、「物質乱用および精神疾患の既往」と関連があった。

2型糖尿病患者の各サブタイプに特徴的な「遺伝子-疾患関連」
次に、3つのサブタイプがそれぞれどのような遺伝的多様体(genetic variant)、すなわち遺伝子上の一塩基多型(SNPs)と関連しているかを検討した。図1Bの「患者-患者ネットワーク」は臨床的な表現型(phenotype)に基づいて決定したものであるため、このサブタイプ分類にはSNPsについての情報は含まれていない。しかし、各サブタイプに特異的なSNPsが明らかになれば、各サブタイプの遺伝的マーカーの同定につながるかもしれない。検討の結果、サブタイプ1、2、3に特有のSNPsが1279、1227、1338認められた。これを遺伝子領域にマッピングすると、各サブタイプで有意に関連のある遺伝子がそれぞれ425、322、437同定された。ここで、ヒトの疾患とSNPの関連についてのデータベースであるVarDiを用いて、サブタイプごとに特徴的な遺伝子-表現型関連(gene-phenotype association)を明らかにした(図2)。なお、ここでの表現型とは、「糖尿病腎症」などの診断に基づくものと「血清クレアチニン値」などの検査結果に基づくものを含んでいる。

・サブタイプ1に特有の遺伝的多様体は27の遺伝子-表現型関連に認められた。これらの多くは2型糖尿病に関係することが知られているものであり、血清レチノール値の増加 (関連する遺伝子はFFAR4)、B細胞数の増加(LAMB4)、アルブミン・クレアチニン比の増加(ACE)、ALTの増加(ZNF827)、レプチン受容体の増加(LEPR)、血清マンノース結合レクチン(MBL2)の増加、血清ビタミンD濃度の増加(GC)、および呼吸機能における1秒率の増加(ZSCAN31TNS1)、さらには表現型としての「糖尿病」(BTN2A1)、「糖尿病腎症」(ACE)などの遺伝子-表現型関連が認められた。
・サブタイプ2に特有の遺伝子-表現型関連は25あり、そのうち4つはがんおよびがん治療に関連するものであった。それらは、bleomycin感受性(関連遺伝子はSAMD12)、epirubicinによる薬物副反応(MCPH1)、幹細胞移植(NLRP3)、濾胞性リンパ腫(SV2B)であった。サブタイプ2に多く関連する表現型は、サブタイプ2の患者の併存疾患と合致しており、併存疾患とその遺伝的特徴の関連が示唆された。
・サブタイプ3に特有の遺伝子-表現型関連は28あり、そのうち10は精神疾患及び神経学的疾患と関連があった。それらは、脊髄小脳失調症1型(関連する遺伝子はATXN1)、心室中隔肥厚(EXT1、CERS6)、不安障害(SDK2、FHT)、認知欠損(CNTND2)、認知症(ABCA1)、遊びスキルの障害(DCC)、知能(CNTN4)、抑うつ(FHIT、BICC1)、脳波におけるθ波のパワー(ST6GALNAC3)、HIV関連神経認知障害(SLC8A1)である。さらに、3つは心血管系と関連があるものであり、心電図RR間隔(GPR133)、周産期心筋症(AKAP13)、心房細動(C9orf3、FNDC3B)であった。最近2型糖尿病の危険因子と考えられるようになってきた血清ビタミンD濃度の増加(関連する遺伝子はGC)は、サブタイプ1でも3でも関連が認められた。アレルギー(FHIT)およびスタチンへの反応(ASB18)の2つの表現型は、サブタイプ3に特有の併存疾患と合致するものであった。
d0194774_21413310.jpg

図2 2型糖尿病の3つのサブタイプにおける「遺伝子-表現型の関連」ネットワーク
サブタイプ1が青、サブタイプ2がオレンジ、サブタイプ3がピンクで、内側の楕円形の頂点はそれぞれ表現型、外側の菱型の頂点はそれぞれ多様なSNPsが認められた遺伝子名を表している。表現型と遺伝子名の関連を、関連の有意水準(P値)によって太さを変えた辺で結んでいる。楕円形や菱型の大きさは、関連している表現型や遺伝子の種類の多さを表す。緑色の楕円(「ビタミンD濃度」など)は、複数のサブタイプに共通して関連のある表現型を示している。このような視覚化によって、3つのサブタイプによって関連する表現型と遺伝子の関連が、ほぼはっきりと区別されることが分かる。


2型糖尿病患者の各サブタイプに特有なシグナル伝達と毒性関連のパスウェイ
さらに、各サブタイプに特有なシグナル伝達パスウェイと毒性関連のパスウェイについてIngenuity Pathway Analysisソフトウェアを用いて検討した。その結果、サブタイプ1、2、3に特有な古典的な(canonical)パスウェイが、それぞれ5種類、2種類、6種類同定された。
サブタイプ1で亢進していたパスウェイは、fatty acid β-oxidation III(糖尿病に伴う肝疾患で亢進する)、acetateからacetyl CoAへの変換(糖代謝で重要)、cAMPを介するシグナル伝達(インスリン分泌に関連)であり、さらにnetrinシグナル伝達(糖尿病腎症に対する保護作用が知られる)、GABA受容体シグナル伝達(糖尿病網膜症の早期に認められる)の2つは、サブタイプ1の併存疾患とも関連があるものであった。サブタイプ2で亢進していたパスウェイには、細菌やウイルスの認識における「パターン認識受容体」のシグナル伝達(これは2型糖尿病における結核の有病率高値に関連している可能性がある)、およびトロンボポイエチンシグナル伝達(細胞生存や増殖分化の活性化に関与し、これはサブタイプ2における冠動脈疾患の増加に関連があるのかもしれない)があった。サブタイプ3で亢進しているパスウェイは、αアドレナリン受容体シグナル伝達、シナプスの長期抑圧、ニューロンにおけるCREBシグナル伝達(神経の可塑性、脳の長期記憶形成、アルツハイマー病の治療との関連が示唆されている)、グルタミン酸受容体シグナル伝達(脳神経疾患、肝線維症、肝星細胞活性化および精子運動能に関連するとされる)であった。

毒性関連のパスウェイとは、肝毒性、腎毒性、心血管毒性および臨床的な病理学的エンドポイントなどを指す。これには、サブタイプ1、2、3に特有なパスウェイが、それぞれ9種類、3種類、3種類同定された。サブタイプ1で亢進している毒性関連パスウェイのうち4種類が腎障害に関するものであり(糸球体障害、腎の肥大、腎の増殖、腎の変性)、これらはサブタイプ1に糖尿病性腎症が多いことと関連があると考えられる。他の5つの毒性関連パスウェイは肝機能障害に関連しており、サブタイプ1における肝酵素の増加と一致していた。なお、サブタイプ2と3は関連する遺伝子は異なるのに、どちらも心血管毒性のパスウェイが亢進していた。EMRsからの併存疾患の情報とVarDiによる遺伝的多様体の情報も含めて考えると、サブタイプ2と3はいずれも心血管疾患のリスクが大きい可能性が示唆された。

トポロジカルデータ解析の特長
本研究には、(1) サンプルサイズが中程度であること、(2)疾患の発症や診断からの時間経過が深く考慮されないこと、(3)疾患の診断がICD-9-CM診断コードに基づくことなどの限界がある。しかし本研究は、遺伝的なマーカーが分からなくても、臨床的な表現型のみから患者のネットワークの形を発見できるトポロジカルデータ解析の方法が有効であることを示している。従来言われてきた「オーダーメイド医療」や「個別化医療」の方法では、疾患分類に重要な分子のような表現型の情報やSNPsのような遺伝的多様性の情報が先に分かっていて、それに基づいて患者集団を層別化する必要があった。しかし、本研究のトポロジカルデータ解析では、臨床データのみから、データに駆動される方式で(data-driven)、機械学習における教師なし(unsupervised)の方法によって、患者集団のネットワークの形が自動的に発見できる。本研究は、多因子疾患の新たなサブグループを同定し、それらに対する新たなバイオマーカーの発見や治療の選択を可能にするPrecision Medicineの有効な方法を提示するものと言える。

注1: Precision Medicine
個々の患者を生物学的にまたは疾患の経過によってサブグループに分類し、それぞれにふさわしい的確な予防や治療を考える医療を指す。以前は「個別化医療」(personalized medicine)という用語が類似の考えを表していたが、個別化医療という用語には「遺伝的情報をもとに患者個々人に対して特有の治療をデザインする」というようなイメージがあった。しかし実際の個別化医療の実現は、次世代シーケンサー技術によって個人の複雑な遺伝的背景が明らかになるにつれ非常な困難を伴うことが分かり、かつ高度な医療資源の投入が必要となるため医療コストの高騰につながるという二つの点が問題になっていた。それに代わる「Precision Medicine」という用語は、患者の臨床データや遺伝的データに基づいて、特定の疾患の患者をより細かい「サブグループ」に分類することによって的確な予防と治療を目指すという意味合いがある。

この用語は、2015年1月にオバマ大統領が発表したPrecision Medicine Initiativeへの予算の大幅増額によって一般に広まった。オバマ大統領はこの演説で、「これまでにも各人の血液型を合わせることで、輸血が可能となったのです。これからは、各人にふさわしいがんの治療法や薬の投与量が、体温を測るのと同じくらい簡単に決められたらどんなに良いでしょう」と呼びかけ、従来型の平均的な患者をもとにデザインする「one-size-fits-all」医療から新しい医療への脱却を目指した。

Precision Medicineの日本語訳としては「精密医療」、「的確医療」、「高精度医療」などいくつかの訳が試みられている。中国語でも「精准医疗(jīngzhǔn yīliáo)」、または「精确(jīngquè) 医疗」(いずれも「精密で正確な」医療)と訳される。

注2: Ayasdi社は、スタンフォード大学数学科の博士課程の学生だったGurjeet Singhと指導教官のGunnar Carlsson、ソフトウェア開発者Harlan Sextonの3人によって2008年に設立されたベンチャー企業である。トポロジカルデータ解析を用いて大量のデータから意味のある洞察(insight)を見出すAyasdi Coreの他、臨床的に最適なクリニカルパスウェイを作成するAyasdi Care、ドラッグディスカバリーを行うAyasdi Cure を開発している。なお、ayasdi (アイヤズディー)とは、アメリカ先住民族チェロキーの言葉で「探す」という意味とのこと。
[PR]
# by md345797 | 2015-11-09 21:48 | その他

β細胞は初期分泌顆粒の分解とそれに伴うオートファジー抑制により空腹時インスリン分泌を低下させる

Insulin secretory granules control autophagy in pancreatic β cells.

Goginashvili A, Zhang Z, Erbs E, Spiegelhalter C, Kessler P, Mihlan M, Pasquier A, Krupina K, Schieber N, Cinque L, Morvan J, Sumara I, Schwab Y, Settembre C, Ricci R.

Science. 2015 Feb 20;347(6224):878-82.

【まとめ】

① 生体における空腹時や、培養細胞をアミノ酸なしまたは低グルコースの培地に置いた状態は、栄養飢餓(nutrient depletion)の状態と呼ばれる。膵β細胞は栄養飢餓の状態では、インスリン分泌を低下させる。では、β細胞では栄養飢餓時にオートファジーが起きるのだろうか?

通常の細胞なら栄養飢餓時にはオートファジーが誘導されて、細胞質蛋白や細胞内小器官を消化して、それにより細胞生存のためのエネルギーが供給される。(このオートファジーを限定してマクロオートファジーともいう。ここでは単にオートファジーとする。)ところが、β細胞には生理的にオートファジーがほとんど観察されず、空腹時にもオートファジーファジーが誘導されないことが知られている。2008年に発表されたオートファジー関連蛋白Atg7のβ細胞特異的欠損マウスの報告(Ebato C, 2008Jung HS, 2008)では、β細胞でオートファジーを欠損させるとインスリン分泌障害が起こることが示された。そこから、「β細胞にはbasal autophagyともいうべき、低レベルの恒常的なオートファジーが起きており、そしてそれが欠損するとβ細胞のインスリン分泌低下が起きるのだろう」という説明がなされている。β細胞では栄養飢餓の状態であってもオートファジーは起きないが、通常観察されないようなbasalなオートファジーは維持されている、というのが現時点での考え方だろう。

② では、β細胞でオートファジーを亢進させるとインスリン分泌は増加するのか?
本論文では、低グルコース培地に置いたβ細胞に(mTOR阻害剤またはオートファジー誘導ペプチドtat-beclin1により)強制的にオートファジーを亢進させると、インスリン分泌が増加するという結果を示している。

これは非生理的な状況を作っているだけで、この結果だけからβ細胞にオートファジーが生理的なインスリン分泌を促進しているとは言えないだろうが、それでもオートファジーを強制的にでも亢進させればインスリン分泌は促進されるようである。なお、なぜオートファジー亢進がインスリン分泌を増加させるかのメカニズムは不明のままである(ATP感受性Kチャネルを介することは示されるがそれ以上は不明)。

③ 従来から下垂体プロラクチン産生細胞などの神経内分泌細胞で、分泌顆粒がリソソームに融合して分解される現象は観察されていて、crinophagyと呼ばれることもある (crinは、endocrineのように分泌を表す語)。これは、古い分泌顆粒が分解されるオートファジーのようだが、オートファジーとの関係はよく分かっていない。

それに対し、本研究で同定したのは、新しいインスリン初期分泌顆粒がリソソームによって分解されるSINGD (starvation-induced nascent granule degradation)というものである。これは通常のオートファジー(マクロオートファジー)ではない。オートファジーは細胞内蛋白を非選択的に分解するものだが、SINGDはβ細胞ではインスリン初期分泌顆粒のみを分解する。そして、SINGDが起きると、オートファジーは抑制されることを示した。

④本研究の内容は下図のように要約される。β細胞は、栄養飢餓時(図の左側)にはp38δMAPキナーゼが活性化され(そのメカニズムは不明)、p38δによってPKD1がリン酸化され不活性化される。(PKDは食後などの栄養があるとき(図の右側)には、活性が上昇しインスリン分泌を促進する(Sumara G, 2009))。栄養飢餓時には、PKDの不活性化を介して、インスリンの初期分泌顆粒がリソソームで分解される(SINGD: starvation-induced nascent granule degradation)。その時、分解産物としてアミノ酸が増加するのでリソソーム膜でmTOR活性が上昇し、それが通常のオートファジーを抑制。オートファジーは前述のようにインスリン分泌を促進する作用があるので(右下の上向き矢印がそれを表している)、栄養飢餓時はSINGDによるオートファジー抑制によってインスリン分泌は抑制される。この仕組みは、空腹時にβ細胞がインスリン分泌を抑制するのに役立っている。

d0194774_10402473.jpg


【オートファジーの経路とその調節機構】

 オートファジーは細胞質成分をリソソームに輸送し分解する現象であり、栄養飢餓時の細胞の生存に重要な役割を果たしている。オートファジーの段階を以下の図に示す。

d0194774_10421616.jpg



オートファジーは、細胞質中に隔離膜(isolation membrane, phagophore)が出現するところから始まる。この隔離膜が細胞質成分を取り囲んで延長し、成熟した二重膜のオートファゴソームを形成する。次にオートファゴソームはリソソームと融合し、オートファゴソームの内膜と隔離した細胞質成分がリソソーム由来の酸性加水分解酵素により分解されて、一重膜のオートリソソームとなる。こうして分解された細胞内蛋白由来のアミノ酸が細胞に供給され、栄養飢餓時の細胞生存のために用いられる。なお、増加したアミノ酸はmTORを活性化し、これがオートファジーを不活性化させる負のフィードバックのシグナルとなる。

また、オートファゴソーム形成と成熟の調節機構は、下図のようなものである。

d0194774_10431411.jpg
飢餓状態(starvation)では、mTOR活性が抑制され、それによりULK1が活性化される。これがオートファゴソーム形成(膜の核生成:nucleation)を促進するシグナルとなる。逆に、アミノ酸などの栄養素やインスリン刺激は、mTORを活性化して、オートファゴソーム形成を抑制する。
② また、bectin1を含むBeclin-1-interacting complexというオートファジーの調節プラットフォーム が刺激されると、この中にあるVPS34 (class III PI 3-kinase )の活性化によってPI3Pが生成され、オートファゴソーム形成が促進される。
③ 次のオートファゴソームの延長・成熟には2つのユビキチン様結合システム、すなわち「ATG5-ATG12結合システム」と「LC3-ATG8結合システム」が必要である。前者のシステムで産生されるATG16L1はオートファジーに必要である。
④ 後者のシステムにおいては、細胞質のLC3-Iがオートファゴソーム膜に結合するLC3(phosphatidylethanolamine結合型:LC3-II)へと変換される。成熟したオートファゴソームは、その膜上にあるLC3 puncta(免疫蛍光染色の斑点)として可視化できる。そのため、GFP-tagを付けたLC3の蛍光顕微鏡で観察される斑点(GFP-LC3 puncta)は、オートファジー活性を評価するときのマーカーとして一般に用いられている。


【論文内容】

(1) β細胞では、栄養飢餓時にオートファジーが抑制される
本研究では、膵β細胞におけるオートファジーを観察するモデルとして、ラットインスリノーマ由来のβ細胞株であるINS1細胞に一過性にLC3B-GFPを過剰発現されたものを用いた。この細胞を、通常の栄養培地GC (growth culture)または栄養飢餓培地で一定時間培養した。栄養飢餓培地は、アミノ酸 (amino acid, AA)やグルコース(glucose, Glc)と血清 (fatal calf serum, FCS)なしの培地で、論文ではno AA/FCS、no Glc/FSCなどと略している。

LC3B-GFP発現INS1細胞を、2時間または6時間の栄養飢餓培地 (no AA/FCSまたはno Glc/FCS)に置いたところ、LC3B-GFP puncta の減少が認められた(Fig S1A, B)。ただし、血清だけを除いた培地(no FCS)では、このようなLC3B-GFP puncta の減少は起こらなかった(Fig S1C)。したがって、β細胞株では、栄養飢餓の状態でオートファゴソーム形成が減少する、すなわちオートファジーが抑制されることを示された。

β細胞のような栄養感知性の分泌細胞ではない他の細胞の例として、HEK293細胞(ヒト胎児腎臓由来細胞)を取り上げ、同様の栄養飢餓培地に置いた。HEK293細胞では、栄養飢餓によってLC3B-GFP punctaは増加した(Fig S1D,E)。すなわち、通常の細胞は栄養飢餓状態でオートファジーが誘導されるのに、β細胞では逆であることが分かる。

次に、LC3B-GFPを内因性に発現させた「LC3B-GFP ノックインINS1細胞」を、CRISPR/Cas9 systemを用いて作製した(Fig S2A-C)。このLC3B-GFP ノックインINS1細胞を1時間、栄養飢餓培地(no AA/FCS)に置いた場合も、LC3B-GFP puncta(オートファゴソーム)の減少が認められた(Fig A1, Fig S2D-F)。

LC3Bの減少は、単にリソソームによるLC3Bの分解が亢進しているためなのか?その可能性を除外するために、リソソームの蛋白分解の阻害剤Bafilomycin A1 (BafA1)を添加して、同じ実験を行ったが、栄養飢餓状態によるLC3B-GFP punctaの減少に、BafA1添加の影響は見られなかった(Fig S2D-F)。

次に、LC3BにRFP(赤色蛍光蛋白)とGFP(緑色蛍光蛋白)を直列につないだtandem fluorescent-tagged LC3 (tfLC3)というコンストラクトをINS1細胞に発現させた(FigにあるptfLC3はレポータープラスミド名)。このとき、オートファゴソーム膜上のtfLC3はRFPとGFPの両方で標識されるため、オートファゴソームは赤色と緑色が重なって黄色蛍光で確認できる。これが次のオートリソソームにまで進行すると、GFPはリソソームの酸性で退色するのに対しRFPは退色しないため、オートリソソームは赤色に観察される。これにより、オートファゴソーム(黄色)と オートリソソーム(赤色)を区別し、オートファジーの進行を判定することができる。

tfLC3を発現させたINS1細胞を2時間の栄養飢餓培地(no AA/FCS)に置くと、多くのRFP-GFP斑点(オートファゴソーム)がRFPのみの斑点(オートリソソーム)へと変化した。さらに時間がたつにつれてオートファゴソームは消失し、オートリソソームも減少した(Fig S3)。さらに、CLEM (correlative light and electron microscopy)を用いて蛍光顕微鏡と電子顕微鏡の相関を取って比較することにより、オートファゴソームの始まりも電顕像で確認できた(Fig 1B)。

さらに、通常のINS1細胞を1.5時間の栄養飢餓培地(no AA/FSC)に置いた後、細胞のlysateで界面活性剤可溶性画分 (soluble fraction)を見ると、膜結合型LC3B (LC3B-II)は減少していた(Fig 1C)。これは、BafA1添加によっても影響はなかった(オートリソソームでの分解が亢進しているのではない)。これに対し、同様の栄養飢餓培地に置いても、HEK293細胞ではLC3B-IIが増加していた(Fig S4)。
(Fig 1Cの界面活性剤の不溶性画分(insoluble fraction)は、変性蛋白の凝集体(aggresome)にあるLC3-IIを表すが、これについては特に述べていない。)

p62は、ユビキチン化された蛋白凝集体に結合し、その凝集体をオートファゴソームへ導くアダプター分子である。INS1細胞を栄養飢餓培地に置くと、可溶性画分のp62の量は軽度増加した。これはBafA1添加によって変化しなかった(Fig 1C)。また、栄養飢餓によりp62の免疫染色の斑点が集結するのが見られた。しかし、LC3B-GFP(オートファゴソーム)とp62の共局在は減少した(Fig S5A)。INS1細胞では、栄養飢餓によってオートファジーが低下するので、オートファジー依存性のp62の消失も抑制されたことが分かる。

ATG16L1は、オートファゴソームに結合し、オートファゴソームの延長と成熟に不可欠な因子である。栄養飢餓時のINS1細胞の免疫染色で、ATG16L1およびATG16L1/LC3B-GFPの斑点は軽度減少した(Fig S5B)。

また、マウス単離培養膵島を2時間の栄養飢餓培地 (no AA/FCS)に置いた場合、β細胞のオートファジーの細胞内コンパートメントは減少した。これは定量的電子顕微鏡(quantitative electron microscopy; QEM)によって定量的に確認した(Fig S6)。

さらに、LC3B-GFPを発現させたトランスジェニックマウスでは、空腹時はβ細胞のオートファゴソームは減少していた(Fig 1D, Fig S7)。なお、栄養素が分泌に関係しない他の分泌細胞、例えばマウスの形質細胞を栄養飢餓培地 (no AA/FCS)に置いても、IgGの分泌は低下するが、オートファジーの細胞内コンパートメント(autophagic compartment; AC)は増加した(Fig S8)。

以上のように、通常の細胞では栄養飢餓によってオートファジーが起きるが、β細胞は逆に飢餓状態でオートファジーが抑制される。したがって、β細胞は、他の多くの細胞とは違うメカニズムを用いて栄養飢餓を乗り越えていると考えられる。

(2)β細胞では栄養飢餓時に、オートファジーではなく初期分泌顆粒の分解が亢進する

下垂体前葉のプロラクチン産生細胞では、分泌顆粒が多く産生され過ぎると、分泌顆粒はリソソームに移行して分解されており、このような分泌顆粒のリソソームによる分解がプロラクチン分泌の調節につながることが報告されている。そこで、β細胞でも、生成初期のインスリン分泌顆粒がリソソームによって分解されることでインスリン分泌が調節されている可能性がないかを考え、以下の検討を行った。

実験では、INS1細胞を栄養飢餓状態に置いた場合、インスリンの初期分泌顆粒がリソソームによって分解される現象があるかをまず確認することにした。これは、リソソームが、分解する分泌顆粒を含んだ顆粒含有リソソーム(granule-containing lysosomes; GCLs)になっていることを確認する。このGCLsの確認のために、「リソソーム膜蛋白Lamp1と分泌顆粒蛋白Phogrinがゴルジ体(pGolgi-CFPで可視化)の近くに共局在する斑点(puncta)」を蛍光顕微鏡で観察・定量化した。

INS1細胞を30分間栄養飢餓培地(no AA/FCS)に置いたところ、Lamp1とPhogrinがゴルジ体の近くに共局在するのが確認された(Fig S9)。リソソーム阻害剤を添加すると、この共局在は増加した(リソソーム阻害剤により、顆粒分解が抑制されたためリソソーム内の顆粒蛋白が増加したということか?)。

この栄養飢餓状態に置いたINS1細胞で顆粒含有リソソームが増加する現象は、QEM、CLEM、免疫金標識によっても確認できた (Fig S10)。

NS1細胞を30分の栄養飢餓培地(no AA/FCS)に置いてそのlysateを濃度勾配で分画したところ、Phogrin (=分泌顆粒蛋白)とLamp (=リソソーム膜蛋白)は、顆粒含有リソソームを含むと考えられる重い分画の方に移行した。この移行した分画にはLC3B (=オートファゴソーム膜蛋白)はほとんど検出されなかったので、初期分泌顆粒がリソソームにて分解される現象はオートファジーとは独立であることが示唆された。

また、栄養飢餓培地に置いたINS1細胞では、LC3B-GFP/Phogrinの共局在は増加しないことが免疫染色で確認された(Fig S11) 。すなわち、栄養飢餓によって分泌顆粒のオートファジーが増加するわけではない

さらには、siBeclin1やsiATG5による遺伝子サイレンシングや、オートファジー阻害剤3-methyladenineを用いてオートファジーを不活性化させた状態で、INS1細胞を栄養飢餓培地に置いた場合は、顆粒含有リソソームの量は変化しなかった (Fig S12)。これらの結果は、オートファジーが分泌顆粒のリソソームによる分解に関連しないことを示している。

インスリンの初期分泌顆粒のマーカーはプロインスリンだが、INS1細胞を6時間栄養飢餓培地(no AA/FCS)に置くと、細胞全体のlysateにおいてプロインスリンのimmunoblotのシグナルが著明に減少した(Fig 2A)。このプロインスリンの減少はリソソーム阻害剤によって部分的に回復した。

マウス膵島の初期培養で、β細胞をex vivoで2時間栄養飢餓(no AA/FCS)にすると、ゴルジ領域に分泌顆粒含有リソソームが電顕像(QEM)で多く確認された (Fig 2C) (分泌顆粒はゴルジ体で産生される)。

GFP-LC3B発現マウスを空腹にすると、Lamp2(=リソソーム膜蛋白)とプロインスリン(=分泌顆粒蛋白、インスリンも含むので論文では(Pro)insulinと記載)の共局在は増加したが、GFP-LC3B(オートファゴソーム膜)と(Pro)insulinの共局在は増加しなかった(Fig 2D)。

以上の結果より、β細胞は栄養飢餓時には、インスリン初期分泌顆粒(マーカー:(Pro)insulin)は、オートファゴソーム(マーカー:LC3B)内でオートファジーを受けるのではなく、直接、リソソーム(マーカー:Lamp2)で分解されるのである。新しく同定したこの現象を、「栄養飢餓によって誘導される初期(分泌)顆粒の分解」(starvation-induced nascent granule degradation, SINGD)と呼ぶことにする。

(3) β細胞では栄養飢餓時であっても、mTOR活性を阻害すれば、UKL1脱リン酸化(活性化)を介して、オートファジーは促進される

リソソーム由来のアミノ酸によって、mTOR complex 1 (mTORC1)がリソソーム膜に移行して活性化され、これによりオートファジーの抑制が起きる。Rapamycinまたはtorin 1でmTOR活性を阻害すると、2時間栄養飢餓培地に置いたINS1細胞のLC3B-GFP punctaの数(オートファゴソーム形成)は増加した (Fig 3A)。すなわち、INS1細胞は栄養飢餓状態ではオートファゴソーム形成が低下するはずなのに、mTORを抑制しておけば栄養飢餓状態であってもオートファジーが起きることが分かる。

さらに、INS1細胞を1時間の栄養飢餓培地(no AA/FCSまたはno Glu/FCS)に置くと、ゴルジ体(マーカー:giantin)の近くのPhogrin/Lamp1の斑点(顆粒含有リソソーム)にmTORが局在した (Fig 3B)。

さらに、栄養飢餓状態に置いてもリン酸化ULK1 (S757-ULK1)は多いままだったが、rapamycinでmTORを阻害するとリン酸化は消失した (Fig 3C)。栄養飢餓でもmTORを阻害すればULK1脱リン酸化(活性化)は起きる。(なお、mTORを介するS6K1のリン酸化 (T389-S6K1)は栄養飢餓によって減少していた。これにより、S6K1リン酸化にはULK1リン酸化よりもmTORの高い活性が求められるためと思われる。)

そして、INS1細胞を栄養飢餓培地に置くと、顆粒含有リソソーム(Lamp1/Phogrinの斑点)と共局在するリン酸化ULK1(S757-ULK1)の斑点の形成が増加した (Fig S14)。

以上の結果から、栄養飢餓状態であっても、mTOR活性を阻害すれば、ULK1脱リン酸化(活性化)を介して、オートファジーが活性化されることが示された。実際はβ細胞は、栄養飢餓状態で、リソソームによる初期分泌顆粒分解(SINGD)によってアミノ酸が供給されてmTORが活性化され、ULK1リン酸化(不活性化)を介してオートファジーは抑制されているのだろう。

(4) β細胞が空腹時にインスリン分泌を低下させるのためには、SINGDを介するオートファジーの抑制が必要


上記のように栄養飢餓時であってもmTORを阻害すればオートファジーが誘導されるのなら、それによって(栄養飢餓時でも)インスリン分泌は増加するのか?

低グルコース培地に置いたINS1細胞に(グルコース濃度はインスリン分泌を刺激しない2.8 mMとした)、rapamycinを添加しmTORを阻害し、栄養飢餓にもかかわらずオートファジーが促進されるようにすると、インスリン分泌は40%程度増加した(Fig S15)。すなわち、低グルコース状態でも、オートファジーを強制的に亢進させるとインスリン分泌は増加する。

さらに別のオートファジー誘導方法として、tat-beclin1を用いた。tat-beclin1は、一部のアミノ酸を置換したbeclin1に、HIV tatタンパクのtransduction domainを結合させて細胞膜を透過性を持たせたオートファジー誘導ペプチドである。

マウスの初代培養膵島を低グルコース培地(2.8 mM glucose)におき、そこにtat-beclin1を添加してオートファジーを特異的に惹起させた。この場合も、低グルコースにもかかわらず、Tat-beclin1によるオートファジー惹起が原因で、インスリン分泌は高グルコース刺激時(16.7 mM glucose)に見られるのに近づく程度まで増加した(Fig S16C、一応有意差がないという程度だが・・・)。この時細胞の生存には変化はなかった。すなわちインスリン分泌が増加したのは、細胞死によってインスリンが培地中に放出された現象などを見ているのではない(Fig S16B)。

なお、ヒト膵島をex vivoで低グルコース濃度(2.8 mM)の培地に置き、そこにtat-beclin1を添加した場合、同じ膵島をグルコース16.7 mMの濃度で刺激した場合に近い程度までインスリン分泌が亢進した(Fig 3D)。

ではこのような「β細胞におけるオートファジー亢進によるインスリン分泌促進」は、ATP感受性Kチャネルの閉鎖を介するものだろうか?

β細胞において細胞内ATPの増加 (これは通常はGLUT2を介するグルコース取り込みによってミトコンドリアでATP産生が増加することによる)によって起こるATP感受性Kチャネルの閉鎖は、膜の脱分極、Ca2+流入を介して分泌顆粒のエクソサイトーシス、インスリン分泌の増加をもたらす。ATP感受性Kチャネル開口剤であるdiazoxideを添加すると、Kチャネル閉鎖すなわち膜の脱分極が起きなくなり、上記の効果は消失する。

上記のマウス膵島を低グルコース濃度(2.8 mM)培地でtat-beclin1によってインスリン分泌が増加した効果は、diazoxide添加で消失した。

さらに、マウス膵島をインスリン分泌を刺激する程度の高濃度グルコース(16.7 mM)培地に置いた時も、tat-beclin1添加によってインスリン刺激がさらに増加した (Fig S16E)。このtat-beclin1によるインスリン分泌増強効果もdiazoxide添加で阻害された(Fig S16F)。

すなわち、オートファジー誘導によるインスリン分泌促進は、低グルコース濃度でも、高グルコース濃度でも起こり、それはどちらもATP感受性Kチャネル閉鎖を介していることが示唆される。

以上の結果から考えると、空腹時にβ細胞で見られるSINGDは、空腹時のβ細胞のオートファジーを抑制する。これにより「オートファジーがもし起きれば亢進させてまうはず」のインスリン分泌を、空腹時に抑制しているのだろう。

(5) 栄養飢餓時は、PKD活性低下を介してSINGDが惹起される

最後に、β細胞で栄養飢餓時にSINGDが惹起される分子機構を検討する。以前、この研究グループは、β細胞のprotein kinase D (PKD)が活性化されることがインスリン分泌やβ細胞生存を促進するという結果を報告している。β細胞においてPKDの活性化は、ゴルジ体でのインスリン分泌顆粒の生合成を促進することが分かっている。ではPKDの不活性化は、インスリン初期分泌のターンオーバーに影響するのだろうか?

まず、INS1細胞にPKD阻害剤(CID755673)を添加すると、細胞lysate中のプロインスリンのimmunoblotの濃度が時間依存的に減少した(Fig 4A)。PKD1の発現をノックダウンINS1細胞(shPKD-INS1)ではプロインスリン生合成自体は変化していなかった(Fig S18AB)。しかし、新しく生成されたインスリンの蓄積は減少していたので(35S-methionineのpulse-chase法で確認、Fig S18C)、de novo合成されたインスリンの分解が亢進していたと考えられる。

PKDノックダウンINS1細胞のQEMおよび免疫金標識による観察で、ゴルジ領域に顆粒含有リソソームが増加していることが分かり、それはさらに細胞分画によっても確認された(Fig 4B、Fig S19)。PKD阻害剤を添加すると、PhogrinとLamp1の共局在(顆粒含有リソソーム)が減少したが、その効果はリソソーム阻害剤の場合よりも強力だった(Fig S19)。そして、PKD阻害剤添加によって、Phogrin/LC3B-GFPの共局在(分泌顆粒のオートファジー)は変化しなかった(Fig S20)。PKD1ノックアウトINS1細胞では、mTORは大部分はLamp1(リソソーム膜蛋白)と共局在し(Fig 4C)、細胞lysateでのリン酸化ULK1量は増加していた(Fig 4D)。またPKDノックアウトINS1細胞に、BafA1(リソソーム蛋白分解阻害剤)を添加すると、LC3B-II量が減少した(Fig S21A)。なお、PKD阻害剤によってLC3B-GFP puncta(オートリソソームの形成) が減少したが、BafA1添加を添加してもこのLC3B-GFP puncta 減少が認められた(Fig S21B)。

上記より、PKDがインスリンの初期分泌顆粒のリソソームでの分解を調節していることが分かる。では、栄養飢餓によって、PKD活性が低下し、SINGDに至るのかどうか?これを以下の実験で検討した。

INS1細胞およびMIN6B細胞(マウスインスリノーマ由来β細胞株)を栄養飢餓培地(no AA/FCSまたはno Glc/FCS)に置いた場合、時間依存的にゴルジ体におけるPKD活性は減少していた(G-PKDrep-liveをtransfectした各細胞でのFRETアッセイにて確認、Fig S22)。PKDは、p38δMAPキナーゼによってリン酸化されることによって不活性化される。そして、p38δ欠損マウスでは、β細胞におけるPKD活性が増加していることはこのグループが以前報告している。

そこで、p38δ欠損マウスの膵島をex vivoで栄養飢餓培地に置いたところ、β細胞における顆粒含有リソソームは、電顕像で著明に減少していた(Fig 4E)。同様に、栄養飢餓培地に置いたp38δ欠損β細胞ではLamp2と(pro)insulinの共局在(インスリン初期分泌のリソソームによる分解を示す)は減少していた(Fig S23CD)。したがって、p38δによってPKDがリン酸化され不活性化されるとSINGDが抑制されると考えられる。それに対し、栄養飢餓培地におけるp38δ欠損β細胞でオートファジーの細胞内コンパートメントは増加していたため、SINGD依存性のオートファジー抑制は低下していたと考えられる(Fig 4E)。以上より、β細胞においてPKDはSINGDとオートファジーの主要な調節因子であることが示された。

【結論】
β細胞では、栄養飢餓の状態ではp38δ活性化を介してPKD不活性化が起こり、それによりSINGD、局所でのmTOR活性化、オートファジーの抑制が起きる。オートファジーはもし強制的に起こせばインスリン分泌を促進するが、それは上記の仕組みで栄養飢餓時には抑制されている。これが空腹時におけるインスリン分泌抑制につながっている。

そしてこのSINGDが、栄養飢餓時にオートファジーのないβ細胞が栄養飢餓を乗り切るための栄養供給の方法だろう。また、SINGDによって分解されるインスリン初期分泌顆粒がなくなってくると、それまでSINGDによって起きていたオートファジーの抑制は解除されるので(derepress)、インスリン分泌が増加せずにオートファジーが起きることも可能なのだろう。この「インスリン初期分泌顆粒がいつなくなってくるか」というタイミングが実験モデルやプロトコールによって大きく変わるので、結論も変わり、そのために従来の報告ではβ細胞のオートファジーとインスリン分泌の関係について一貫した説明がなされなかったのだと思われる。

なお、本研究はβ細胞にオートファジーを誘導することがインスリン分泌の増加につながるという結果を示したが、これが治療に役立つかは今後まだ検討が必要である。例えば、空腹時にインスリン分泌を促進してしまって低血糖を起こすようでは問題がある。また、オートファジーは一般に細胞における恒常的な機能、いわゆるhousekeeping機能を果たしていると考えられている。しかし、本研究の結果からは、オートファジーには例えば「インスリン分泌を調節する」というような特異的な役割もあるのかもしれない。ただし、これについてもさらに詳細な検討を待ってからの結論になるだろう。

[PR]
# by md345797 | 2015-03-15 14:27 | インスリン分泌

Points of significanceコラム 3 :統計学における検出力、エフェクトサイズ、サンプルサイズ

Points of significance: Power and sample size.

Krzywinski M, Altman N.

Nat Methods. 2013 Nov;10: 1139–1140.

【総説内容】
科学研究では、ある現象が観測されたとき、それが偶然によるのか、ある作用によるのかを検討する必要があるだろう。その際、その観測値がもともと含まれる母集団からの標本なのか、それとも別の母集団からの標本なのかを判断するという統計学的手法を用いる(注1)。

注1:ここでの「母集団」は、何らかの実体をもった集団ではなく、抽象的な概念であり架空の存在である無限母集団を想定している。

その際、まず「これら2つの母集団の間には差がない」というnull hypothesis (帰無仮説)を立て、帰無仮説が起きる確率は非常に小さいことを示して帰無仮説を棄却し、alternative hypothesis (対立仮説)を採択するという方法を取る。対立仮説は、「2つの母集団間には差がある」(注2)というもので、これは結局「今回観測された現象は、ある作用によって起きたものであり、偶然のばらつきによるものではない」ことを示す。これをeffect (効果)があったと表現する。

注2:厳密には、2つの母集団間に「差がないとは言えない」というべきだが、以下では分かりやすくするため「差がある」とする。

研究においてeffectは必ず正しく検出されるわけではなく、effectが正しく検出される確率というものがあり、それが今回述べるstatistical power (統計学的パワー、検出力)である。この検出力は非常に重要な概念であるにもかかわらず、医学・生物学研究でしばしば見落されている。しかし、検出力が低い研究では重要なeffectが検出できない可能性がある。そのため、検出力不十分の研究は実験費用や人員の無駄になったり、結果的に有害な条件下に被験者を置く非倫理的な研究になったりする危険がある。そのため、Nature Pulishing Groupの投稿チェックリストでも、「事前に設定したエフェクトサイズ (後述)を検出するための十分な検出力を確保するサンプルサイズ(標本数)を選んでいるか」ということが記載されている。

(1) Sensitivityとspecificity
検出力について述べる前に、疾患と検査の関係でよく用いられるsensitivityとspecificityについて述べる。「実際に疾患があるかないか」と「検査で陽性になるか陰性になるか」の割合は、図1の4通りが考えられる。
d0194774_22276100.jpg

図1 疾患と検査におけるsensitivityとspecificity

この4通りとはTrue/False Positive/Negativeであり、これをもとに、

Sensitivity (感度)=a/(a+c) 疾患があるときに検査で正しく陽性になる率
Specificity (特異度)=d/(b+d) 疾患がないときに検査で正しく陰性になる率

と定義される。ここで、

False Positive率=疾患がないのに検査で誤って陽性になる率 α=b/(b+d)  
False Negative率=疾患があるのに検査で誤って陰性になる率 β=c/(a+c)

というものが考えられる。

(2) Type I errorとtype II error
最初の「観察された標本が、もともと想定される母集団からの標本なのか、それとは異なる母集団からの標本と考えられるのか」という問題についても同様の表ができる。ここでは、2つの母集団間で「実際に差があるか、ないか」と「差があると推測されるか、ないと推測されるか」で図2の4通りに分けられる。
d0194774_2228349.jpg

図2 母集団間の差の有無と推測による判断

ここでは、

False Positive率 α= 正しいH0を誤って棄却する割合
False Negative率 β= 正しくないH0を誤って採択する割合

となっている。このように、前者の本当は差がない (帰無仮説が正しい)のに、「差がない」という帰無仮説を誤って棄却することをType I errorといい、後者の本当は差がある (帰無仮説が誤りである)のに、「差がない」という帰無仮説を誤って採択することをType II errorという (それぞれの確率はαとβ)。

(3) Power (検出力)
図1疾患があるときに検査で正しく陽性になる確率をpower(検出力)といい、感度と同じa/(a+c) である。これは図2では、母集団間に実際に差があるときに、推測によって差があると正しく判断される確率が検出力(1-β)である。

図3では例として、ある蛋白の発現量の観測値がxであったとき、それが単なる偶然のばらつきの結果なのか、それとも何らかのeffectがあった結果なのかを考えている。これは統計学的には、観測値xがもともと想定される正規母集団(平均µ0=ここでは10)からの標本なのか、それともそれとは違う正規母集団(平均µA=12とする)からの標本なのかという問題である。このとき、2つの母集団間に差がないとする帰無仮説H0と、それに対する対立仮説HAを立て、H0が棄却できるかどうかを検討する(注3)。

注3:2つの母集団に差がない場合、平均µ0の母集団とそれと違う平均µAの母集団で、µ0とµAどちらが大きいかは決められていない。しかしここでは便宜上、図3のように後者の方が大きいとする片側検定 (one-tailed test)について考える。µ0とµAの大小が予測できないときは両側検定(two-tailed test)になるが、ここでは省略する。

図3aのように限界値x*を設定し、観測値xがそれより大きければH0は棄却できるとする。H0がx*より大きい確率はαであり、これは例えば0.05のように非常に小さいのでここに観測値が入ると帰無仮説H0は棄却するとする。このとき、帰無仮説が正しいのに棄却してしまう確率(本当は差がないのに、誤って差があると判断してしまう=Type I errorの確率)はα、正しい帰無仮説を正しく採択する確率(本当は差がなく、差がないと正しく判断する確率=specificity)は(1-α)である。
d0194774_22283821.jpg

図3 帰無仮説(a)と対立仮説(b)、推測のエラーと検出力(c)
 
ここでxが限界値x*より大きい時は、観測値xは対立仮説HA母集団からの標本と考えられるとすると、図3bのようにx*より小さいとき、本当は帰無仮説H0は正しくないのに、H0を採択してしまう。したがって、帰無仮説が正しくないのに採択してしまう(本当は差があるのに、誤って差がないと判断してしまう)Type II errorの確率はβ、帰無仮説を正しく棄却し対立仮説を採択する確率(本当は差があり、それを差があると正しく判断できる確率=sensitivityおよび検出力)は(1-β)である。

(4) Effect size
なお、H0の正規母集団とHAの正規母集団はどちらも標準偏差がσで同じとする。そのとき、d=(μA-µ0)/σをエフェクトサイズと呼ぶ。σ=1の標準正規分布のとき、dはμA-µ0である(図3c)。初めに対立仮説の分布を設定する時に、このd (effectがあるとき、どのくらいの差ができるはずなのかという量)を事前に決めておく必要がある。もしこれが医学研究なら、「医学的・生物学的に意味のある差dとはどれくらいなのか」を医学的観点からあらかじめ設定しておかなければならない。

注4:なお以上の議論で、母集団というのは全く未知のものであるはずなのに、その平均や標準偏差の数値があらかじめ分かっているというのはおかしな話だが、ここでは説明のため分かったことにして話を進めている。

(5) 陽性的中率(PPV)
ここで、やや本題からはずれてPPVについて述べる。図1のような疾患と検査において、「ある検査が陽性のとき、本当にその疾患がある割合」を陽性的中率(positive predictive value, PPV)という。「ある疾患が陰性のとき、本当にその疾患がない割合」は陰性的中率(negative predictive value, NPV)である。図1では、

陽性的中率(PPV)=a/(a+b)
陰性的中率(NPV)=d/(c+d)

である。図2の場合は、PPVは「母集団間に差があると推測されたとき、本当に差がある確率」、NPVは「母集団間に差がないと推測されたとき、本当に差がない確率」であり、図2に色で示した通りになる。
d0194774_22291986.jpg
図4 Effectがある割合(a)、検出力が上がると陽性的中率も増加する(b)

図4aでは、上段は50%effectがある(疾患と検査の関係で言うと、疾患がある割合=有病率が50%ということ)、下段は10% effectがある(有病率10%に相当する)場合を表している。青がeffectあり=母集団間に差がある、緑がeffectなし=差がないという帰無仮説を表す。

図4b上段で、検出率0.2で推測した場合(左上)、母集団間に本当に差があるとき、差があると正しく推測される確率が0.2だから、実際にeffectがある点線から右半分のうち、灰色(「差がない」と誤って推測される=false negative)ではなく水色(「差がある」と正しく推測される=true positive)の割合が0.2になっている。検出率0.5(中央上)や0.8(右上)の場合も、同じように青の部分の割合が0.5、0.8になっている。また、帰無仮説を5%の棄却域で棄却するとすると、帰無仮説(点線から左半分) のうち5%(赤い部分)は母集団間に差がないという帰無仮説が誤って棄却されてしまう。すなわち、緑(「差がない」と正しく推測される=true negative)ではなく、赤(「差がある」と誤って推測される=false positive)の部分が左半分の5%になっている(注5)。

注5:元論文のこの図では5%がちょっと大きめに描いてある。

このとき、陽性的中率は「差がある」と推測された場合の本当に差がある確率なので、図4bのようにtrue positive/(false+true positive)、青/(青+赤)で表されるので、検出力が0.2、0.5、0.8と上がると、PPVも0.80、0.91、0.94と上昇する。

実際の生物学実験では、図4下段のように10%しかeffectが見られないことも珍しくない。このときは、検出率0.2の実験では陽性的中率が0.31しかなく、通常求められる検出率0.8であってもその実験の陽性的中率は0.64である。これでは、実験で差があると認められてもその3割以上はfalse positiveである。

検出力の低い実験では、このように陽性的中率が低くなるので、研究の前に十分な検出力のある実験を行っているか注意が必要である。多くの研究では、統計学的に検出力不足(underpowered)であり、そのために再現性の低い結果しか得られていないことが報告されている。

(6) Specificityとsensitivity (検出力)の関係

次に(4)の例に戻って、specificityとsensitivity(検出力)の関係について述べる。

図5aでH0は平均µ0=10、σ=1の正規分布とし、その棄却域αを0.05に決めると、H0を棄却できる限界値x*は11.64になる。ここでHAの正規分布を見ると、観測値xがカットオフ値x*(11.64)より小さい時は、観測値は本当はHAの母集団からの標本なのに、誤ってH0が正しいという判断を下してしまう。これは実際は差(effect)があるのに、差がないとしてしまうtype II errorであり、その確率はβ=0.36)で表される。したがって、1-β=0.64が、差があるときにH0を正しく棄却する(差があると判断する)という検出力(およびsensitivity)である。

ここで、H0の棄却域αを0.05から0.12に引き上げると、観測値xのカットオフ値は11.17に下がり、検出力は上記の0.64から0.80に上がる。この検出力の増加は、αの低下すなわち、本当は母集団間の差(effect)がないのに誤って「差がある」と判断してしまうfalse positiveの増加を犠牲にしていることになる。

注6:なお、原文ではWe can increase power by decreasing sensitivity.と書いてあるが、原文のsensitivityはspecificityの誤植。

図5bでは、2つの母集団H0とHAはそのままで、観測値のカットオフ値が小さくなると ((x*-µ0)が小さくなると)、それにしたがってαが大きくなるが、そのとき検出力(1-β)はどのように変化するかを示している。
d0194774_22295563.jpg
図5:限界値x*が小さくなると検出力が上がる(a)。この関係を示すグラフ(b)。

x*-µ0を小さくすると、検出力 (1-β、図5aの青い部分の面積)はS字カーブを描いて大きくなる(図5bの赤い矢印)。しかしそれに伴って、α (false positive率、赤い部分の面積)も大きくなってしまう。なおそれはspecificity (1-α、緑の部分の面積)が小さくなることにもつながる。研究において真のpositiveを検出するために、検出力は大きくしたいが、しかしfalse positiveは減らしたい。この場合どうすればよいだろうか?

まず、図5aの分布が狭ければ2つの母集団のオーバーラップが減り、HAの分布においてx*より大きい部分(青い部分)が増えて検出力は上昇する。しかし、分布を狭くする、すなわち標準偏差σを小さくする、すなわち実験精度を上げてばらつきを減らすというのは難しいことも多い。より直接的な方法は標本をx一つだけでなく、数多く観察することである。それにより標本分布(標本平均x bar、標本標準偏差σ/√n) を得るようにする。

(7) サンプルサイズとエフェクトサイズが検出力に及ぼす影響
最後に上記のように、標本をn個取ったときの平均値の分布(標本分布)を考える。

図6aにおいて、左の正規分布曲線は標本分布を表している。H0は帰無仮説の母集団から得た標本n個の標本分布であり、HAは対立仮説から得た標本n個の標本分布である(図5のように母集団そのものではないことに注意)。

ここで、標本の大きさnが増えても、標本分布の平均は変わらない (nが大きくなると、それは母集団平均に等しくなるので、ここではいずれも10と12としている)。しかし、標本の大きさnが増えると、標本分布の標準偏差は(母集団の標準偏差σ)/√(標本の大きさn)の式にしたがって小さくなる

これらの分布において、帰無仮説を棄却する棄却域αが0.05になるように、標本分布の平均値のカットオフ値(点線)を決める。そうすると、nが大きくなるにしたがって分布は狭くなり、そのαが0.05になるためのカットオフ値は図6aのように小さくなり、検出力(1-β)は大きくなる。あらかじめ設定した エフェクトサイズd (2つの母集団間にこれ以上差があれば「母集団間に差があった、effectがあった」と考えてよいとする差)が1だったとする。標本の大きさ(サンプルサイズ) nが大きくなると、検出力は図6a右のグラフのように大きくなる。この例では、α=0.05、d=1のとき、有効な検出力0.8以上を確保するためにはサンプルサイズは7個以上必要ということになるだろう。なおグラフのようにαをもっと低く、すなわち棄却域を厳密にすると、同じ検出力を得るにはもっとサンプルサイズを増やす必要が出てくる。
d0194774_22303090.jpg
図6:サンプルサイズを大きくすると(a)、またはエフェクトサイズを大きく設定しておくと(b)、検出力は大きくなる

サンプルサイズがそれ以上増やせない場合に検出力を上げる方法は、エフェクトサイズdをあらかじめ大きく設定しておくことである。図6b左のように、nが一定で、dが大きくなると2つの標本分布の幅 (標本標準偏差)は変わらないが、2つの標本分布の平均の差が大きくなり、分布のオーバーラップは小さくなる (エフェクトサイズの定義のd=(μA-µ0)/σの式による)。図6左でdが大きくなってもαは0.05で変わらないとカットオフ値(11の点線)は変わらないので、検出力(1-β)は大きくなる。エフェクトサイズを大きくすると、検出力が大きくなるのは図6右のグラフの通りである。

逆に言えば、エフェクトサイズを小さく設定すると、同じ棄却域αでも検出力は小さくてよいことになる。しかし、あまりにエフェクトサイズを小さくすれば、医学的には無意味な差が統計学的には有意となるので注意が必要である。さらに詳しくは、『新版 医学への統計学』(古川俊之監修、丹後俊郎著)の第14章「医学的に意味ある差を積極的に評価する検定ーΔ検定」を参照。

(8) サンプルサイズ設定の注意点

なお、以上の議論ではH0とHAの母集団分布は未知のものであるので、本当はそれらの正確な標準偏差は分からない。そのため標本分布から母集団標準偏差σを推定するが、それでは検出力が小さくなるので、必要な検出力を確保するためにやや大きめのサンプルサイズnを設定する必要がある。

よい研究デザインのためには、サンプルサイズ、エフェクトサイズ、検出力の3つのバランスを取ることが非常に大切である。そのために、まずtype I errorの確率(帰無仮説の棄却域)αを0.05検出力(1-β)を0.8にすることが伝統的に行われる。次に、医学的・生物学的に望ましいエフェクトサイズdをあらかじめ設定しておく

これらのα、1-β、dの値を使って最低限必要なサンプルサイズnを求めてから、研究を開始する必要がある。もし必要なnがあまりに大きく計算された場合は、母集団のばらつきを減らすため、研究開始前に対象や実験条件を再検討する必要があるだろう。

注7:論文のSupplementary Table 1で、検出力などの計算やグラフ作成ができるExcelファイルが利用できる。

【参考】
このような仮説検定理論、帰無仮説を棄却するアイデア(ネイマン=ピアソンの公式)を構築したのは、イェジ・ネイマン(1894-1981)とエゴン・ピアソン(1895-1980)である。エゴン・ピアソンは記述統計学の大成者であるカール・ピアソン(1857-1936)の息子で、ワルシャワ(ポーランド)の数理学者であったネイマンは、ロンドンのエゴン・ピアソンと意気投合し、直接会えない時も郵便のやり取りを通じて1928-1938年にわたって推測統計学を作り上げた。『統計学を拓いた異才たち』(D. サルツブルグ著、竹内惠行・熊谷悦生訳)によると、ネイマンは親切で誰に対しても思いやりのある性格、エゴン・ピアソンは慎重な紳士であった。しかし、父カール・ピアソンの論敵であったやはり統計学の巨人ロナルド・フィッシャー(1890-1962)は彼らを嫌悪し激しく攻撃したという。

[PR]
# by md345797 | 2014-09-30 21:56 | その他

サッカリン含有人工甘味料は腸内細菌叢を変化させ耐糖能異常を起こしうる

Artificial sweeteners induce glucose intolerance by altering the gut microbiota.

Suez J, Korem T, Zeevi D, Zilberman-Schapira G, Thaiss CA, Maza O, Israeli D, Zmora N, Gilad S, Weinberger A, Kuperman Y, Harmelin A, Kolodkin-Gal I, Shapiro H, Halpern Z, Segal E, Elinav E.

Nature. 2014 Oct 9;514(7521):181-6.

【まとめ】
ノンカロリー人工甘味料(Non-caloric artificial sweeteners, NAS)は、世界的に広く用いられている食品添加物の一つである。NASは低カロリーであるため肥満者や糖尿病患者に有用と考えられてきたが、その安全性については以前から議論が続いている。

本研究では、C57 Bl/6マウスに市販の「サッカリン含有人工甘味料(5%がサッカリン、95%がグルコースの混合物である)」を、ヒトにおけるFDAの1日許容最大摂取量(体重あたり)をマウスに換算して摂取させた。その結果、マウス腸内細菌叢の組成や機能が変化し、それに伴って耐糖能異常が起きた。このようなNAS摂取に伴う耐糖能異常は、これらのマウスに抗生剤を投与すると起こらなくなった。また、NAS投与マウスから採取した便の細菌叢やNASを加えてin vitroで培養した便細菌叢を無菌マウスに接種しただけで、レシピエントのマウスに耐糖能異常が起きた。NAS摂取後の腸内マイクロバイオームでは、グリカン分解パスウェイの遺伝子発現が亢進しており、それにより短鎖脂肪酸(SCFAs)の増加が惹き起こされるなどして、耐糖能異常が起きた可能性が示された。ヒトにおいても、長期的なNAS摂取者はメタボリックシンドロームを示す数値が高値を示しており、健常者ボランティア7名に6日間NASを摂取させた場合にも4名に腸内細菌叢の変化を伴う耐糖能異常が起きた。このようなNAS摂取に伴う耐糖能異常は、おそらくその個人の腸内細菌叢によって、起きやすい者とそうでない者(レスポンダーとノンレスポンダー)がいると考えられた。

以上より、NASの摂取は、腸内細菌叢を変化させて耐糖能異常を起こす可能性があることが示唆された。肥満者や2型糖尿病患者がNASを大量に摂取することについては、今後再考の必要があるだろう。

【論文内容】
ノンカロリー人工甘味料 (NAS)は、高カロリー食品である砂糖を用いずに食品に甘味を加える手段として100年以上前に開発された。NAS摂取によってカロリー摂取を減らすことにより、体重減少と血糖値の正常化という健康上の有用性がもたらされると考えられている。砂糖を使わないカロリーオフの清涼飲料水やシリアル、デザートなどでよく用いられ、肥満者および耐糖能障害、2型糖尿病患者には推奨されることもある。しかし、NASは血糖を上昇させないという有用性を示す研究結果がある一方で、NASは体重を増加させ2型糖尿病のリスクを増加させるという有害性を示す結果も報告されてきた。このように相反する結果が報告されてきたことには、すでにメタボリックシンドロームを持つ患者がNASを多く摂取しているという背景もある。このような議論があるにもかかわらず、アメリカ食品医薬品局 (FDA)は現在、アメリカ合衆国において6種類の人工甘味料製品の使用を承認している。

多くのNASは摂取後分解されることなく消化管を通過し、腸内細菌叢に直接作用する。腸内細菌叢は健常人と肥満者糖尿病患者では組成や機能が異なり、逆に腸内細菌叢の違いがメタボリックシンドロームに関連することが分かっている。そこで本研究では、NASが腸内細菌叢の組成や機能を変化させて宿主の耐糖能に影響するかを検討した。

長期のNAS摂取は耐糖能異常を起こす
NASの糖代謝に対する影響を検討するため、10週齢のC57 Bl/6マウスの飲み水にサッカリン、スクラロース、アスパルテームを含有する市販の人工甘味料を添加して摂取させる実験を行った。これら3種類のNASは、約5%の人工甘味料と約95%のグルコースからなるものである。対照群には水のみ、水にグルコース、水にショ糖(sucrose)を混ぜたものを摂取させた。人工甘味料の商品名はそれぞれ、「Sucrazit」 (5% サッカリンと95% グルコース)、「Sucralite」 (5% スクラロース含有)、「Sweet’n Low Gold」 (4% アスパルテーム含有)であり、いずれも10%溶液として水に混ぜたものを摂取させた。対照群には水、10%グルコースまたは10%ショ糖の溶液を摂取させた。

摂取開始11週目には、水、グルコース、ショ糖を摂取させたマウスは同様の耐糖能曲線を示したのに対し、上記3種類のNASを摂取したマウスは著明な耐糖能異常を示した。NASの中ではサッカリンが耐糖能障害を起こす作用が最も大きかったので、以後の人工甘味料の作用の検討では市販のサッカリンを用いることとした

また、肥満の状態でのNASの影響を調べるため、高脂肪食(HFD、脂肪が総カロリーの60%を占める)を負荷したC57 Bl/6マウスに、市販のサッカリン含有人工甘味料またはコントロールとしてグルコースを摂取させた。その結果HFD負荷マウスにおいても同様に、サッカリンは耐糖能異常を起こすことが明らかになった。次に、0.1 mg/mlの純粋なサッカリンを水に加え、HFDを負荷した10週齢マウスに摂取させ耐糖能への影響を検討した。サッカリン濃度は、ヒトにおいてFDAで認められている1日許容最大摂取量 (5 mg/kg体重)をマウスに換算して用いた。この濃度は市販のサッカリン含有人工甘味量よりもサッカリン濃度としては少ないが、それでも耐糖能異常を示した。この結果は、C57 Bl/6マウスの代わりにSwiss Websterマウスを用いた実験でも同様だった。

なお、以上のマウスで摂餌量、摂水量、酸素消費量、運動量、エネルギー消費などは正常食、HFDマウスにおいてNAS投与とコントロールで同様であった。また、空腹時血清インスリンとインスリン負荷試験による血糖低下も同様の結果であった (インスリン抵抗性の程度に差がないことを示唆する)。以上から、NASはヒトと同様の人工甘味料の組成または体重あたりの量において、マウスの種類や肥満かどうかによらず耐糖能異常を起こすことが示された。

以下、本論文では「サッカリン5%、グルコース95%からなる人工甘味料」を「市販サッカリン」と呼び、100%のサッカリンを「純粋サッカリン」と呼ぶことにする。

NAS摂取による耐糖能異常は腸内細菌叢を介して起こる
食事は腸内細菌叢の組成や機能を変化させ、腸内細菌叢の変化は宿主の代謝に大きく影響することが分かっているので、NASによる耐糖能異常も腸内細菌叢の変化を介しているのではないかと考えた。そこで、正常マウスまたはHFDマウスにまずグラム陰性菌を標的とした抗生剤 (シプロフロキサンとメトロニダゾール)を投与し、NASを含む水またはコントロールの水のみを摂取させた。その結果、抗生剤A投与4週後には両者の耐糖能障害の差は消失した。グラム陽性菌を標的とした抗生剤 (バンコマイシン)を投与した場合も、同様の効果が認められた。これらの結果からNASによる耐糖能障害は、腸内常在細菌叢しかも幅広い細菌群が関与していることが分かった。

次に、市販サッカリンまたはグルコース(コントロール群)を含む水を摂取させた正常食負荷マウスの便を正常食負荷無菌マウス(germ-free mice)に移植する実験を行い、腸内細菌叢が原因になっているかどうかを検討した。その結果、便移植6日後には、市販サッカリンを摂取させたマウスから便を移植されたレシピエントマウスは、コントロール群から便移植されたレシピエントマウスと比較して耐糖能異常を示した。この結果は、HFD負荷マウスに水または純粋サッカリンのみを摂取させた場合の便移植実験でも同様の結果であった。したがって、NAS摂取による耐糖能異常は、腸内細菌叢を介して起きていることが示唆された。

NASは腸内細菌叢の機能を変化させる
次に、上記のマウスにおける腸内細菌叢の組成の違いを16S ribosomal RNA遺伝子のシークエンシングの結果をもとに検討した。まず、市販サッカリン摂取マウスは、摂取開始11週目において当初の腸内細菌叢および他のコントロール群の腸内細菌叢とは異なる組成を示していた (下の図1g)。同様に、市販サッカリンを摂取させたドナーマウスから便移植を受けたレシピエントの無菌マウスの腸内細菌叢は、主座標分析(Principal Coordinate Analysis; PCoA)において、グルコース摂取ドナーマウスから便移植を受けたコントロールマウスの腸内細菌叢とは異なるクラスターを形成していた (図1h)。
d0194774_035860.png

市販サッカリンを摂取させたマウスは、40以上のoperational taxonomic units (OTUs)で細菌叢の変化を起こしていた。相対量が増加していた細菌群の多くはBacteroides属とClostridiales目に属していたが、Clostridialesと同じFirmicutes門に属する腸内常在菌量であるLactobacillus reuteriは減少していた。量が減少していた細菌群の多くも Clostridiales目に属するものであった。同様に、HFDに加え純粋サッカリンを摂取したマウスでも、腸内細菌叢の異常が起きていた。以上より、サッカリンはその形態、濃度、与えた食餌などが異なっても、おおむね同様の腸内細菌叢の異常をもたらすことが示された。

(注) Operational Taxonomic Units (OTUs、操作性分類単位):配列決定した16S遺伝子のうちある程度以上の類似度(97%以上など)を持つ配列を一つのまとまりと考え、「1菌種」として扱う単位とする。「形成されたOTU数」を「菌種数」と考え、細菌の多様性を把握するのに用いる。

次に、ショットガン・メタゲノムシークエンシングを用いて腸内細菌叢の比較を行った。16S rRNAによる検討と同様、市販サッカリンを11週間摂取させる前とさせた後の便の細菌叢を、グルコースまたは水のみを摂取させた場合のコントロールの便の細菌叢を比較した。相対的な細菌種の量を比較するために、シークエンス結果をヒトマイクロバイオームプロジェクト (HMP)のリファランスゲノムデータベース上で解析した。結果は16S rRNAを用いた解析と同様、市販サッカリンを摂取させた場合に細菌種の量の変化が最も大きかった。さらに、メタゲノム解析の結果を腸内細菌遺伝子カタログ上で解析し、グループ化した遺伝子をKEGG (Kyoto Encyclopedia of Genes and Genomes)上でどのパスウェイに当たるかを検討した。遺伝子発現の変化したパスウェイは、市販サッカリとグルコースを摂取させたマウスで変化が逆であった。市販サッカリンは95%グルコースを含むことを考えると、この違いはサッカリンによるものと考えられる。市販サッカリンを摂取させたマウスはグリカン分解パスウェイの遺伝子発現が大きく増加していた。

グリカンは発酵してさまざまな物質になるが、その中には短鎖脂肪酸(short-chain fatty acids, SCFAs)が含まれている。SCFAは宿主のグルコースおよび脂質のde novo合成の前駆体やシグナル伝達分子になるので、その増加は宿主のエネルギー吸収を増加させ肥満につながりうることがマウスおよびヒトで示されている。このパスウェイは、市販サッカリン摂取マウスの腸内細菌のうち5種類のグラム陰性および陽性細菌の増加によって起こることが分かった。そのうち2種は16S rRNA解析で示されたBacteroides属であった。さらに、市販サッカリン摂取マウスはコントロールのグルコース摂取マウスと比較して、便中のSCFAsであるプロピオン酸と酢酸が大きく増加していた。市販サッカリン摂取マウスの腸内マイクロバイオームでは、デンプン・ショ糖の代謝、フルクトース・マンニトース代謝、葉酸・グリセロリピド・脂肪酸生合成に関与する遺伝子発現が亢進し、糖輸送に関与する遺伝子発現が低下しているという、以前報告された2型糖尿病患者の変化と同様の変化が認められた。

その他にも、純粋サッカリンを摂取させたHFDマウスでは、ascorbate/aldarate代謝 (レプチン受容体欠損糖尿病マウスで増加)、LPD生合成 (代謝性エンドトキシン血症で増加)、細菌走性(肥満マウスで増加)に関与するパスウェイの遺伝子発現の増加が見られた。以上より、市販サッカリンの摂取は腸内細菌叢の機能的変化をもたらすこと、特にグリカン分解パスウェイの遺伝子発現が亢進し、エネルギー吸収の増加につながる便中SCFAsの増加が起きることが示された。

NASは腸内細菌叢を直接変化させ、耐糖能異常を促進する
次にNASの腸内細菌叢への直接の影響を検討するため、通常マウスの便をサッカリンを添加した培養液を用いてin vitroで嫌気性培養した。このサッカリン添加in vitro便培養で、培養9日目にはBacteroidetes門の増加とFirmicutesの減少が認められ、この培養産物を無菌マウスに胃管投与したところ、コントロール便投与群に比べて有意な耐糖能異常が認められた。サッカリン添加in vitro便培養を投与されたマウスの便でもBacteroides属の増加とある種のClostridialesの減少が見られた。ショットガンメガゲノムシークエンシングによっても、サッカリン添加in vitro便培養で、サッカリン摂取マウスの便と同様のグリカン分解パスウェイの遺伝子発現の増加が認められた。その他にはスフィンゴ脂質代謝に関与する遺伝子発現の増加(非肥満糖尿病マウスでの増加が報告されている)、糖輸送に関与する遺伝す発現の減少が認められた。以上より、サッカリンは腸内細菌叢の組成と機能を直接変化させ、耐糖能異常を起こしうる細菌叢の変化をもたらすことが示された。

ヒトにおいてNASは耐糖能異常に関連している
最後にヒトにおいて、長期的および短期的なNAS摂取の耐糖能にどのように影響するかを検討した。まず、長期のNAS摂取と臨床データの関連について381名の非糖尿病者 (男性44%、女性56%、年齢は43.3 ± 13.2歳)のコホートを対象に調べた。NASの摂取量 (食事質問票による)は、体重、ウエスト・ヒップ率(中心性肥満を表す)、空腹時血糖、HbA1c、ブドウ糖負荷試験 (GTT)の血糖値、ALT (肝機能障害を表す)の高値と関連があった。HbA1cは、NAS摂取が多い40名は、NASを摂取しない236名に比べて高値であった(BMIで補正しても高値だった)。さらに、これらの被験者のうち、ランダムに172名を選び出し、便の細菌叢を16S rRNA解析を用いて調べた。その結果、NASの摂取とEnterobacteriaceae科、Deltaproteobacteria綱、Actinobacteria門の量の増加とは有意な関連があった。なお、細菌叢のOTUの量とBMIの間には有意な関連は見られず、上記のNAS摂取と細菌叢の関連は肥満を介する関連ではないと考えられた。

ヒトにおいて短期的なNASの摂取が耐糖能異常をもたらすかを調べるため、普段NASを摂取しないか、ここ1週間NASを含む食物を摂取していない7名の健常ボランティア(5名が男性、2名が女性、年齢は28-36歳)にNASを摂取させて検討を行った。7日間の試験期間のうち2日目から7日目まで、FDAの1日許容最大摂取量の市販サッカリン(5 mg/体重kg)を1日3回に分け連日摂取させ、、連日GTTを行った。その結果、このような短期間でも7名中4名の被験者が1-4日目に比べ、5-7日目にGTTでの有意な血糖上昇をきたした(図4c)。また、残り3名は血糖上昇はなかった (有意な耐糖能改善もなかった) (図4d)。このように、被験者にはNASに反応して耐糖能悪化が見られた者と見られなかった者があり、反応があった者を「NASレスポンダー」、反応がなかった者を「NASノンレスポンダー」と呼ぶことにした。

NASレスポンダーの腸内マイクロバイオームは、ノンレスポンダーのNAS投与前後とは異なるクラスターを形成していた(図4e)。さらに、ノンレスポンダーのマイクロバイオームはこのNAS摂取期間を通じて変化がなかったのに対し、レスポンダーではNAS摂取によってマイクロバイオームの変化が見られた(図4f)。
d0194774_081343.jpg

レスポンダーとノンレスポンダーのNAS摂取前(1日目)と摂取後(7日目)の便サンプルを正常食負荷無菌マウスに移植した。その結果、NAS摂取後のレスポンダーの便を移植されたレシピエントマウスは有意な耐糖能異常を示したのに対し、レスポンダーのNAS摂取前およびノンレスポンダーのNAS摂取前後の便では耐糖能異常は起きなかった。レスポンダーのマイクロバイオームを移植された無菌マウスの便では、サッカリン摂取マウスの腸内細菌叢変化と同様の変化がいくつか認められ、Bacteroides fragilis (Bacteroidales目)とWeissella cibaria (Lactobacillales目)が20倍増加、Candidatus Arthromitus (Clostridiales目)が10分の1に減少していた。

【結論】
本研究では、NASの摂取が腸内細菌叢を変化させ、耐糖能異常を起こす可能性がマウスとヒトで示された。NAS摂取による主な細菌群の変化は、以前に2型糖尿病のヒトでも報告されたBacteroidesの増加とClostridialesの減少であった。また、NAS摂取は腸内マイクロバイオームのうち、グリカン分解パスウェイの遺伝子発現を変化させ、食物からのエネルギー吸収を増加させる可能性があることが分かった。その他にもNASはマウスやヒトで糖尿病や肥満への関連が報告されている代謝パスウェイ (スフィンゴ脂質代謝やLPS生合成など)を変化させることが明らかになった。本研究は、マウスだけでなく、ヒトにおいても長期的および短期的なNAS摂取が耐糖能異常を起こしうることを示した。ヒトにおいては、NASの摂取に反応して耐糖能異常を起こすレスポンダーと起こさないノンレスポンダーがいることが分かり、このような反応の違いは個人の腸内細菌叢の組成と機能の違いによる可能性が示唆された。一般に食事に対する代謝疾患の起こりやすさには個人差があるが、これは個人による腸内マイクロバイオームの違いによるものかも知れず、もしそうだとすれば将来はマイクロバイオームに基づいた「個別化栄養療法 (personalized nutrition)」が重要になるのかもしれない。

人工甘味料は、人間の甘味に対する欲求を妨げることなくカロリー摂取を減らし、糖尿病患者の血糖を正常化させるのに役立つと考えられてきた。近年、多くの食事の変化に並行して、人工甘味料の消費も増加している。もしかしたら人工甘味料の使用は、意図に反して肥満や糖尿病増加に寄与してきた可能性もある。さらには、人工甘味料の影響には個人差があることが示唆され、それが腸内マイクロバイオームに基づく可能性についても今後検討が必要になるだろう。
[PR]
# by md345797 | 2014-09-23 23:58 | その他

Points of significanceコラム 2:統計における推定と検定(1)

Points of significance: Significance, P values and t-tests.

Krzywinski M, Altman N.

Nat Methods. 2013 Nov;10(11):1041-2.

Points of significanceの第2回では、まず(1)母集団概念と統計的推測の時制についてまとめ、(2)母集団からこれから観測するデータを「予言」する方法について触れた後、(3)観測したデータからもとの母集団を「推測」する統計的推定を4段階で理解する。最後に(4) Nature Methods総説にある仮説棄却による統計的検定の例を見る。

1. 母集団概念と統計的推測の「時制」
(1) 母集団と統計的推定

統計学では、抽象的な概念である「母集団」(無限母集団)というものを想定している。母集団は、具体的に見たり数えたりできない架空の存在である。何らかの「もの」ではなく、思弁的に想定している「自然現象」という「こと」と考えてよいだろう。これを観測して得たデータが「標本」である。自然現象を観測すると、そのたびに全く同じ値が得られることはないが、これはもとの自然現象がランダムな散らばりを持っていると考える。自然現象はある確率分布の関数で表されるため、一つの「真の値」というようなものは決して知ることはできず、その値は観測から推測するしかない。母集団としての自然現象の数値は、「観測の外」とか「観測値に匹敵するもの」というような語源をもつ「パラメーター」と呼ばれ、母数と訳される。母集団の確率分布はよく正規分布と考えられ、その母平均μ、母標準偏差σなどが母数である。観測データすなわち標本とは、母集団の確率分布に従って生起する数値であると考える。以下では、標本を加工して「統計量」(検定統計量、注1)という数値を作り、統計量の分布を考えることによって母数をある範囲で推測する。これが統計的推定(statistical inference)である。

注1:統計学で扱う数量のうち、平均や標準偏差など標本データを要約した量は「基本統計量(basic statistics)」と呼ぶ。検定に用いるためにこれらから計算した量のことを「検定統計量(test statistics)」と呼び、以下では検定統計量のことを単に「統計量」と記載することにする。

(2) 統計学における「時制」
統計学は、未来に向かって「予言する」のと、過去を向いて「推定する」という大きく分けて2つの時間的方向がある。これに関しては『完全独習 統計学入門』(小島寛之著、ダイヤモンド社)に詳しく、ここでも「95%予言的中区間」という分かりやすい用語を引用させていただいた。
95%予言的中区間:「これから観測するデータ」を95%の確率で「予言する」ときの用語。ある現象の本質がすでに分かっていて、将来の観測でそこからどのような結果が得られるかを95%の確率で予測する。「未来に向かって」の用語である。
95%信頼区間:「すでに起きて確定していること」だが、まだ自分が知らないことを推論するときの用語。「過去に向かって」の用語ととれるが、実際にはわれわれの観測を要約して、それを用いてある現象の本質を理解したいというときに用いる。

以下の2では「将来の観測結果を95%予言的中区間で予言する」、3では「ある現象を95%信頼区間で区間推定する」という順でまとめる。以下の議論の進め方も『完全独習 統計学入門』(小島寛之著)を参考にさせていただいている。

2. 母集団が分かっているとき、これから観測するデータを予言する
(1) 1個の観測データを予言する (統計量zと標準正規分布を用いる)

母集団を表す正規分布の中で、平均0、標準偏差(SD)1のものを標準正規分布という。標準正規分布では、-2以上~+2以下の範囲(平均±2SDの間)にデータの95.44%が含まれる。95%を含む範囲は約-1.96以上~約+1.96以下(平均±1.96SDの間) である。

平均μ標準偏差σが分かっている正規分布母集団から、1回だけ観測したときのデータx (1個だけ取り出した標本x)がどのような数値か、95%の予言的中区間で(未来のことを)予言したい。以下、分かっている値を青字これから知りたい未知の値を赤字で表す。

ここで、観測データxから母平均µを引いて母標準偏差σで割った統計量zを考える。

統計量z


である。xは正規母集団から取り出したので、その分布は正規分布に従っている。zは上の式から標準正規分布上の数値であることが分かる。そのため、zは95%の確率で、

-1.96≦≦+1.96


の区間に含まれる。この式を変形すると、xの95%予言的中区間は、

µ-1.96µ+1.96


と計算できる。

(2) n個の観測データの平均を予言する (統計量Uと標準正規分布を用いる)
同じく平均μ標準偏差σが分かっている正規母集団から、n個の観測値を得る(標本サイズnの標本をこれから取り出す)。このとき、これから取り出す標本の標本平均¯xがどのような値か95%の確率で予言したい。

標本を何回も取り出すと、そのたびにできる標本平均¯xによって分布(標本分布)ができる。この標本分布は、平均µ標準偏差σ/√nの正規分布になることが分かっている(Points of significance (1) 参照)。ここで¯xから平均µを引いて標準偏差σ/√nで割ることにより、標準正規分布に従う統計量ができる。これを、


統計量U




とする。Uは95%の確率で、

-1.96+1.96


の区間に含まれる。この式を変形すると¯xの95%予言的中区間は、

µ-1.96µ+1.96


と計算できる。
上記の統計量zとUは似ているが、zは1個の観測データxに関する統計量で、Uはn個の観測データからなる標本の平均¯xに関する統計量である。

3. 観測したデータから、未知の母集団について推定する
次に、観測したデータを用いて、未知の現象について推定する方法を述べる。これは、今持っている標本を用いて、すでに存在している母集団について推定するという(過去に向かっての)流れであり、以下のような5段階で順に考える。既知の観測データから統計量を作り、その統計量の分布を用いて、今度は未知の母集団について推論する。以後も分かっている値を青字これから知りたい値を赤字で示す。

第0段階:未知の母集団について本当に何もわかっていないとすると、母集団が「正規分布に従っているかどうか」も不明なはずである。しかし以下では母集団が正規分布であることを前提に考えることにする。それ以外の場合は、中心極限定理を用いた大標本の推定かノンパラメトリック手法を用いるが、これは別の回で考える。

第1段階: 正規母集団であり、母分散が分かっているとき、母平均を区間推定する。
ここで、「母集団については正規母集団であるという以外分かっていない」と言っているの、「母分散は分かっている」というのは、不自然な前提である。しかし、まずはこのような段取りで考えていくことが必要なため、この段階を踏むことにする。

第2段階: 正規母集団であり、母平均が分かっているとき、母分散を区間推定する。
これから知りたい母集団について、あらかじめ「母平均が分かっている」というのも不自然だが、先のためにこの段階も理解する。

第3段階: 正規母集団であり、母平均が分かっていないとき、母分散を区間推定する。
ここから先の段階では、母集団は正規母集団であるということ以外は分かっていない。まずこの段階では母分散を推定する。最終目標としては母分散より母平均の方が知りたいが、順番上この段階を踏むことにする。

第4段階:正規母集団であり、母分散が分かっていないとき、母平均を区間推定する。
いよいよ最終的な段階であり、母集団について正規母集団であるという以外何も分かっていないところから母平均を推定する。

【第1段階:あらかじめ母分散が分かっている正規母集団から、標本サイズn、標本平均¯xの標本を取り出した。このとき、まだ分かっていない母平均µを95%の信頼区間で区間推定する】
→統計量Uと標準正規分布を用いる

ここでは、前項でも出てきた標本平均の分布を考えると、標本平均¯xは平均µ(母平均と同じ)、標準偏差σ/√nの正規分布に従う。前項と同じように

統計量U


を計算すると、Uは標準正規分布に従うから、95%の信頼区間で、

-1.96+1.96


に含まれる。この式を知りたいμについて変形すると、

-1.96+1.96


となり、母平均μが95%信頼区間で区間推定できることになる。(これは「未来の」予言ではないから「95%の確率で予言的中する区間」と言わず、「95%信頼区間での区間推定」と呼ぶことに注意)。


【第2段階:あらかじめ母平均µが分かっている正規母集団から、標本サイズn (x1、x2・・・、xn)、標本平均¯xの標本を取り出した。このとき、まだ分かっていない母分散σ2を95%の信頼区間で区間推定する】
→統計量Vと自由度nのカイ二乗分布を用いる

カイ二乗分布について:
標本サイズn (x1、x2・・・、xn)のとき、これらの観測データをすべて二乗して合計した、を考える。このとき、観測の機会ごとに(標本の取り方によって)Vはまちまちの値を取るので、Vはある分布に従う統計量となる。この時の観測データ数nを自由度と呼ぶと(例えば3個ずつ観測データを取っていれば自由度3)、Vは「自由度nのカイ二乗分布(chi-square distribution)」(図1)に従っている。
d0194774_22452858.png
図1:カイ二乗分布の図。
自由度nによってグラフの形が違う。

さて、母標準偏差σの推定に戻る。まず各観測データからそれぞれの統計量zを計算すると、

z1z2、・・・、zn


となり、zは標準正規分布に従っている。そこで、zを標準正規分布から取り出した数値、新しい標本と考える。これらの標本を二乗して合計すると、その統計量Vは自由度nのカイ二乗分布に従うはずである。

統計量V・・・    

22+・・・+2


青字は分かっている数値なので、この式は

V=


というようにまとめられる。最後に、カイ二乗分布するVが95%の頻度で含まれる区間を考えるが、図2のようにVがa以上なら97.5%を含み、b以上なら2.5%を含むという値a、bがカイ二乗分布の数値表から分かる。Vは95%の頻度でこの間にあると言えるので、

ab


この式をσ2について変形すれば母分散σ2を95%の信頼区間で区間推定できる。
d0194774_219291.gif
図2 カイ二乗分布するxの値は、95%の頻度でaとb(黒で塗った外側の面積がそれぞれ2.5%である)の間に含まれる。aとbは自由度nによって値が異なるが、これらはカイ二乗分布の数値表によって分かる。

次項(2)に続く。

d0194774_22475144.png
休憩コーナー:カイ二乗分布のぬいぐるみ発見!!
( http://nausicaadistribution.blogspot.jp/より)

[PR]
# by md345797 | 2014-06-28 01:40

Points of significanceコラム2:統計における推定と検定 (2)

前項(1)からの続き

【第3段階:母平均µが分かっていない正規母集団から、標本サイズn (x1、x2・・・、xn)、標本平均¯xの標本を取り出した。このとき、まだ分かっていない母分散σ2を95%の信頼区間で区間推定する】
→統計量Wと自由度(n-1)のカイ二乗分布を用いる

まずここでの標本の分散を考える。標本分散s2は定義上、(各観測値-標本平均)の二乗を合計して標本サイズnで割ったものなので、

標本分散s2


ここで、

統計量W


というものを考える。これらの式を比較すると、s2とWは分子が同じで

n×s2σ2×W


すなわち、

W


であり、Wは標本分散s2に比例する統計量である。そして、この統計量Wは、自由度(n-1)のカイ二乗分布に従うことが証明されている(証明は省略)。

標本(標本サイズn、標本平均¯x)から標本分散s2を計算して、それをn/σ2倍すると統計量Wができる。Wは自由度n-1でカイ二乗分布し、Wが95%の頻度で含まれる区間a’-b’はカイ二乗分布の数値表から分かるため、

a’b’


この式をσ2について変形すれば、母平均µを用いずに母分散σ2が95%の信頼区間で区間推定できる。


【第4段階:正規母集団で母標準偏差σが分からない場合、標本サイズn、標本平均¯xの標本を取り出し、分かっていない母平均µを95%の信頼区間で区間推定する】
→統計量Tと自由度(n-1)のt分布を用いる

今までの方法から考えて、「求めたい母平均µを含み、標本から計算でき、しかもそれが従う分布が分かっている統計量」を作る必要がある。そうすればその分布を用いて95%信頼区間でµが区間推定できる。

この統計量を作ったのがウィリアム・ゴセット(1876-1937, ペンネームStudent、注2)であった。ゴセットは、

統計量T= (sは標本の標準偏差)


を作った(注3)。そして、この統計量Tが「自由度n-1のt分布」に従うことを発見した。
d0194774_23371531.png
図3: t分布 (自由度=1、2、5)と標準正規分布

「Studentのt分布」と呼ばれるこの分布は0を中心として正規分布によく似た形をとるが、正規分布に比べると頂上が低く裾野が広い形をしている(図3)。nが非常に大きい値をとる大標本であればt分布は正規分布で近似できるが、nが小さい小標本の場合は独自の分布になる。t分布を用いることにより、標本サイズが小さい場合でも正確にµが区間推定できるようになった(注4)。

Tを95%の確率で予言できる区間は、t分布上で-αから+αの間というように分かるので、


となり、これにより母平均µが95%信頼区間で区間推定できる。

注2:ギネスビール社の醸造技術者であったゴセットは、ギネス社の職務外の研究として秘密裡に論文を書き匿名で発表した。その際「自分は、先生である統計学者カール・ピアソンのstudent(生徒)である」という意味を込めて「Student」というペンネームを用いたようである。(『推測統計のはなし』蓑谷千鳳彦著、東京図書より)

注3:多くの本やWikipediaの記載では、この式の√n-1の部分が√nになっている。一方、『完全独習 統計学入門』(小島寛之著)や『入門 統計学-検定から多変量解析・実験計画法まで-』(栗原伸一著、オーム社)では√n-1であり、本稿もこれに従っている。多くの本では、標本標準偏差として通常の「標本の標準偏差s」の代わりに、母分散を偏りが出ないよう推定するために自由度で調整した標準偏差「不偏標準偏差」を用いているためこの違いがある。標本標準偏差不偏標準偏差との関係は以下通りである(詳しい説明は省略)。

不偏標準偏差 x 標本標準偏差(s)


多くの本では、標本標準偏差sを√n/(n-1)倍した不偏標準偏差のことを単に「標本標準偏差」と表記しているために、統計量Tの式

統計量T=


で√n-1が√nとなっているので注意が必要である。本によって記号がまちまちであることも理解を面倒にしており、「不偏標準偏差をσ ̂、標本標準偏差をs」とちゃんと区別して書いてある本、「前者を小文字のs、後者を大文字のS」と分けている本、不偏標準偏差の意味で「標本標準偏差s」という用語を用いている本などいろいろである。それぞれsが何を意味しているかはっきりさせて、その上で√n-1か√nかを読者が理解している必要があるだろう。

注4:ゴセット以前には、母集団で母標準偏差σが分からない場合に、

統計量


という統計量を作って、これが正規分布に従うということにして母平均µを区間推定していた。本当は、

(=統計量U)


が正規分布に従うのだが、母標準偏差σが分かっていないので標本標準偏差sで代用してよいことにしていた。これではnが非常に大きいときは誤差が少ないが、nが小さいときには結果に無視できないずれが生じていた。

そこでゴセットが考案した統計量Tは、

T=


というものであった。これは、

U=、 W=


であることから、

T(σが消える)


となり、母標準偏差σが分かっていない場合でも母平均µの区間推定ができる。これは母集団について何もわかっていなくても、母平均が区間推定できる画期的な方法であった。


d0194774_22533886.png

休憩コーナー(2): 正規分布(左)とt-分布(右)のぬいぐるみも発見!
形から言うと、左の方がt-分布っぽいが・・・。(http://nausicaadistribution.blogspot.jp/より)

次項(3)に続く。

[PR]
# by md345797 | 2014-06-28 01:26

Points of significanceコラム2:統計における推定と検定 (3)

前項(2)からの続き

4. Nature Methods総説(Krzywinski M, Altman N. 2013 Nov)
最後に、Nature Methods総説にある有意性と統計的検定の例を確認する。

(1) 1回の観測値が有意かどうかの検定
ある蛋白の発現量が10であるとき(これは過去の繰り返しの実験から明らかになっているとする)、今回の実験では発現量12と観測された。観測値12は妥当なものだろうか?

図4aで、ある現象の数値として分かっている値(Reference、ここでは10)は母集団平均に当たるのでµ
、観測値(observed、ここでは12)は標本データに当たるのでxとしてある。

観測値xはランダムなばらつきを示すので、取りうるすべての値の母集団から取り出した一つの標本であると考える。無数に観測を繰り返したときの観測値とその度数の関係を表したグラフは図4bのような正規分布になると思われる(正規分布と考えられない場合については別の回で述べる)。今回の観測値x=12は実際のところ、ありえないような外れ値である。それを示すため、まず、帰無仮説H0「今回の観測値は図4bのようなμを平均とするような母集団から得られたものである」を立て、最終的にこれを棄却するという方法を取る。帰無仮説H0を表した母集団(図4b)を帰無分布と呼ぶ。

このとき、x=12以上に外れた観測値が出る確率は、網掛けの部分の面積で計算される部分である。これがP値である。P値の大小によって今回の観測値の妥当性を判断する。ここでP値が小さい(通常P=0.05)ということは、帰無仮説の下でほとんどありえないことが起こったと考える。この帰無仮説H0の下でほとんどありえないことが起きているとすると、おおもとの状況(H0)自体が間違っているのだろうと棄却する。そこで、その対立仮説H1「今回観測された標本は、平均がµではない母集団から得られたものである」が有意に支持されることになる。
(なお厳密に言えば、このような対立仮説H1は「よく用いられる対立仮説」に過ぎず、他の対立仮説もいろいろ考えられる。だからこの対立仮説H1が「必ず正しい」とは限らない。)
d0194774_120204.jpg

図4 1個の観測値の有意性の判断

なお、P値は「帰無仮説の下でほとんどありえないことが起こった」確率であって、「帰無仮説が正しい確率である」ということではないので注意(注5)。この点はしばしば誤って解釈される。また、P値は統計的に有意であることを表すが、単に「統計的に」であって、それ以上の意味付けはできないことにも注意が必要である(注6)。

注5:これは「訴追者の誤謬」(prosecutor's fallacy)と同じ原理で間違っている。訴追者の誤謬についてはここでは述べないが『リスク・リテラシーが身につく統計的思考法―初歩からベイズ推定まで』(ゲルト・ギーゲレンツァー著、吉田 利子訳、ハヤカワ文庫NF)に詳しい解説がある。

注6:統計的有意性が示されても、それ以上の価値判断は加えられないことに注意する。さらにはその観測値自体にも何か「意味がある」とすら言えない。特に「統計的に有意差がある」とつい「一方が優れている」などと価値判断しがちだが、それは厳に慎むべき態度である。有意性(significance)という言葉は「重要な」とか「意味がある」という内容も含むため、significantly differentという言葉は誤解を招きやすいのかもしれない。統計的に有意な結果が「何を意味するか」は、統計学以外の根拠に基づいて決定されるべきなのである。なお、有意水準がp=0.05というのは単なる慣習的な線引きなので、0.049なら有意で0.051なら有意でないなどと判断するのはおかしい。差があるか否かはP=0.05という数字で区切るのではなく、そこでもやはり統計学以外の判断が必要であろう。
この注6の部分は、『涙なしの統計学』(D. ロウントリー著、加納悟訳、新世社) の記載を参考にさせていただいた。

(2) n個の観測値の平均が有意かどうかの検定
次に、1つのデータだけでなくさらに4つのデータを観測したとする。そうすると、n=5の標本を取ったことになる(図5a)。このときの標本平均は¯x=10.85、標本標準偏差s=0.96であった。この標本標準偏差s=0.96は母集団の標準偏差σと同じ考えてよいと仮定する(この仮定が成り立たない場合については別の回で述べる)。 ここで標本平均¯xの分布は正規分布であり、その平均はµ、標準偏差はs/√nである(図5b)。(注7)
d0194774_1164361.jpg

図5 n個の観測値の有意性の判断

注7:Nature Methodsの総説にはこう書いてあるが、正しくは前項(2)の注4のように標本分布の標準偏差はσ/√nである。ここではs=σと仮定しているのでこれでよいことにしている。また、これも前項(2)の注3のようにここでのsは単なる標本の標準偏差のことだから、

不偏標準偏差 x 標本標準偏差s


で不偏標準偏差を計算して、

統計量T=


とするべきだろう。これらのことは、この総説では省略されてしまっている

上記のTが取りうる値のt-分布から、図5cのような¯xの分布が分かる。1つの観測データのときと同じく、P値が求められ、これにより5個の観測データの平均が有意かどうかが判断できる。

(3) t-検定を用いた有意性の判断
上の例でn個のデータを観測したときに、

統計量t


はデータ数nを自由度とした図6aのようなt-分布に従う(注8)。

注8:このNature Methodsの総説にはこう書いてあるものの、正しくは上の注7の統計量Tの式が正しい。この総説ではsを不偏標準偏差としているのだろうが、混同しやすい記載である。
d0194774_1141037.jpg

図6 t-分布とそのP値

ここで、nが大きければ統計量tの値のP値も正規分布に近いが、nが小さい小標本の場合は同じtでもP値は非常に小さくなり、有意性を無視できないくらい過大評価してしまう。そのため、小標本の場合は正規分布ではなくt-分布で考える必要がある。例として、n=5の場合t=1.98であるP値はP=0.119であるはずなのに、正規分布で考えていると、P=0.048と有意であることになってしまう。
[PR]
# by md345797 | 2014-06-28 01:23

複雑ネットワークの理論(6):ヒトの疾患と疾患遺伝子のネットワーク “Diseasome”

The human disease network.

Goh KI, Cusick ME, Valle D, Childs B, Vidal M, Barabási AL.

Proc Natl Acad Sci U S A. 2007 May 22;104(21):8685-90

【まとめ】
ヒトの疾患と疾患遺伝子のデータベースであるOMIMを基に、ヒト疾患ネットワーク(HDN)疾患遺伝子ネットワーク(DGN)を作成した。さらにこれらの2つのネットワークを連結させることにより、「疾患と疾患遺伝子の関連」の全体像である"diseasome"を作成した。また、DGNには機能的モジュールがあることを示した。最後に、疾患遺伝子がコードする蛋白は他の蛋白との相互作用が特に多いのか、すなわちネットワーク上でハブを形成しているかを検討した。その結果、ヒト疾患遺伝子のうち生存に必須な(マウスで欠損すると致死になる)遺伝子がコードする蛋白だけがハブを形成しており(中心的であり)、非必須の遺伝子はハブにはなっていなかった(末梢的であった)。ただし、体細胞変異によって疾患が起きる遺伝子(多くのがん遺伝子)はハブを形成する傾向があった。このようなネットワークに基づく検討は、疾患と疾患遺伝子の関連に関する新たなプラットフォームを我々に与えてくれるものである。

【論文内容】
疾患遺伝子(遺伝子に占める疾患の座位)は、従来からのさまざまな遺伝学的方法、最近のポジショナルクローニング法、ゲノムワイド関連解析などによって明らかにされてきた。さらには、蛋白-蛋白相互作用マップ蛋白-蛋白相互作用マップ(interactome)ヒト代謝ネットワークを基にして、疾患遺伝子の詳細なマップも作られている。さらに、ネットワーク手法を用いて疾患と蛋白-蛋白相互作用の関連を解明しようとする試みもある。そもそも疾患と疾患遺伝子の関連は、「単一の疾患遺伝子が単一の疾患と関連している」というようなものではない。異なる複数の遺伝子変異が同じ疾患につながることがあり、例えばZellweger症候群はペルオキシソーム生合成に関する少なくとも11遺伝子のいずれに変異が起きても出現する。また、1つの遺伝子の中の別の変異が異なる疾患形質を惹き起こすこともあり、例えばTP53の変異は11の異なるがん関連異常に関与している。そこで本研究は、「単一遺伝子-単一疾患」的アプローチではなく、現時点で知られるすべての遺伝的疾患(disease phoenome)と疾患遺伝子のセット(disease genome)とをネットワークとして連結することによって、疾患と疾患遺伝子の組み合わせの全体像、すなわち“diseasome”を把握することを目標とした。

Diseasomeの構築
まず、今までに知られたすべての遺伝的疾患のグループとすべての疾患遺伝子のグループを結びつけた2部グラフを作成した(図1a中央) (2部グラフ(bipartite graph)とは、グラフ理論において2つのグループに含まれる頂点どうしが連結しているグラフであり、これらの頂点は同じグループ内では連結していないものを指す)。左の疾患が右の疾患遺伝子の変異と関連があることが示されているとき、それら2つの頂点を枝で連結した。これらの疾患、疾患遺伝子、それらの関連は、ヒトの疾患遺伝子とその形質についてのデータベースであるOnline Mendelian Inheritance in Man(OMIM)から得たものである(2005年12月の時点で、1,284種の疾患と1,777種の疾患遺伝子が登録されていた)。OMIMに含まれる内容は、当初は単一疾患につながる単一疾患遺伝子が主だったが、最近は共通の疾患に関連する遺伝子変異や同じ遺伝子変異に伴う複数の疾患が多く登録されている。このような登録にはいくつもバイアスがあるだろうし、このデータベース自体、当然完成したものではない。しかしOMIMは現時点で知られる遺伝的疾患と疾患遺伝子についての最も完全なデータベースである。なお当研究では、ここに含まれる全疾患を22の疾患クラスに分類して以下の作業を行った。
d0194774_12462785.jpg

図1 “Diseasome”の作成
中央:ヒトの疾患ネットワーク(左のHuman Disease Networkに基づくDisease phenome)と疾患遺伝子ネットワーク(右のDisease Gene Networkに基づくDisease genome)に含まれるそれぞれの頂点を枝で結んだ2部グラフ(DISEASOME)。頂点の○は疾患、□は疾患遺伝子を表し、ある疾患遺伝子が疾患に関連しているときに枝で連結している。○の大きさは、その疾患に関与する遺伝子の数を表す。
左:ヒトの疾患のネットワーク(Human Disease Netwotk)で、以後HDNと呼ぶ。左図の2頂点間の枝は、それらに関与している同じ疾患遺伝子があることを示す。また枝の太さは2頂点の疾患に関与する共通する疾患遺伝子の数を表す。例えば、乳がんと前立腺癌は両方に共通して関連する遺伝子が3つあるので、枝の幅も他の3倍になっている。
右:疾患遺伝子のネットワーク(Disease Gene Networkで、以後DGNと呼ぶ。2頂点間の枝は2つの疾患遺伝子が同じ疾患に関連していることを表す。枝の太さは2つの疾患遺伝子が共通して関連する疾患の数を表している。このdiseaseomeは縮小版だが、完全なものはSupporting Information(SI)の図13を参照。
d0194774_1248951.jpg

図2 ヒト疾患ネットワーク (HDN)と疾患遺伝子ネットワーク (DGN)
(a) HDNでは各頂点が一つ一つの疾患を表し、2頂点間の枝は、それらの2つの疾患に共通する疾患遺伝子があることを表す(詳しくは下記参照)。ここでは、関連する疾患遺伝子が10個より多い疾患のみ疾患名を書きそれ以外は省略しているが、完全な図はSupporting Information(SI)の図13を参照。
(b) DGNでは、各頂点が疾患遺伝子であり、2つの遺伝子が共通して同じ疾患に関連しているときに枝で連結してある(詳しくは下記参照)。


HDNの特性
HDN(図2a)では各頂点が一つ一つの疾患を表し、頂点の色は22の疾患クラスを、頂点の大きさはその疾患に関連する疾患遺伝子の数を表す。2頂点間の枝は、それらの2つの疾患に共通する疾患遺伝子があることを表す。枝の幅は共通する疾患遺伝子の数を、枝の色は同じクラスの疾患どうしならその色、別のクラスの疾患どうしなら灰色としている。

もし疾患がそれぞれ特有の遺伝的原因を持ち、共通する疾患遺伝子が少なければ、HDNの多くの頂点が連結していないか、またはごく少数の疾患ごとの小さいクラスターを形成するだろう。しかし実際のHDNでは、頂点(疾患)は多くの枝(共通の疾患遺伝子の存在を示す)で連結されている。OMINに含まれる1,284種の疾患のうち、867種は少なくとも1本の枝を持ち、516種が多数の枝を持つハブを形成していた。疾患に関連する疾患遺伝子の数s (頂点の大きさで表示)は疾患によって大きく異なり、広い分布を示していた(SI 図6a)。大多数の疾患はsが少ないが、いくつかの疾患はsが非常に大きく、例えば難聴はs=41、白血病はs=37、大腸がんはs=34というようにかなり多くの疾患遺伝子と関連していた。また、各頂点の枝の数kも広い分布を示しており(SI 図6b)、大多数の疾患はごく少数の疾患にしか関連していないが、いくつかの疾患は例えば大腸がんはk=50、乳がんはk=30という多数の疾患に関連していた。

HDNは明らかなクラスターを形成し、これらは22の疾患クラスに対応するものであった。最も大きいがんのクラスターには密な相互連結が見られ、これは多くの共通した疾患遺伝子(TP53、KRAS、ERBB2、NF1など)との関連を介して互いに連結しているためと考えられた。がんのクラスターにはがんになりやすいいくつかの疾患(Fanconi貧血、毛細血管拡張性運動失調症 Ataxia Telangiectasiaなど)も含まれている。その一方で、代謝性疾患の多くはがんのように大きなクラスターを形成しておらず、小さい連結した頂点群を形成していた。がんでは異なる疾患遺伝子の変異が同じ疾患につながること(遺伝子座異質性)が多いが、代謝性疾患はそのようなことが少ないためと考えられる。

DGNの特性
DGN(図2b)では各頂点が疾患遺伝子であり、2つの遺伝子が共通して同じ疾患に関連しているときに枝で連結してある。頂点の大きさは、その疾患遺伝子が関連している疾患の数を表す。疾患遺伝子が1つのクラスの疾患に関連していれば頂点はそのクラスの色にしてあるが、1つのクラスより多い疾患に関連していれば灰色にしてある。5つ以上の疾患に関与している遺伝子や本文で言及している遺伝子について、遺伝子名を付記している。DGNでは、OMIMに含まれる1,777疾患遺伝子のうち1,377遺伝子が共通して同じ疾患に関連していることを表す枝を持ち、903遺伝子(特にTP53PAX6)は多数の枝を持つハブを形成していた。

HDNとDGNにおけるクラスター形成
HDN(疾患)とDGN(疾患遺伝子)のグラフの枝の数は同じままで、それぞれの連結をランダムにシャッフルしたグラフ(ランダムコントロール)も作成した。その結果、ランダムにつなぎかえた疾患ネットワークにおける連結した頂点の集まりの平均サイズ(頂点数643±16)は、実際のHDNにおける平均サイズ(516)より有意に大きかった(SI図6c)。同様に、ランダムにつなぎかえた疾患遺伝子ネットワークにおける連結した頂点の集まりの平均サイズ(頂点数1,087±20)は、実際のDGNにおけるサイズ(903)より有意に大きかった(いずれもP<10^-4、SI図6cとe)。これらの結果は、HDNもDGNも実際のネットワークはランダムコントロールに比べ、クラスター形成が大きいことを示している。また、実際の疾患(または疾患遺伝子)は、同じクラスの疾患(または疾患遺伝子)により連結しやすい。例えば、実際のHDNでは同じクラスの疾患の間に812の枝があり、これは同じクラスの疾患をランダムに連結させた場合の枝の数107±10に比べ8倍も多かった。

DGNにおけるモジュール形成
ある疾患に関連する複数の疾患遺伝子の蛋白産物は、同じ細胞内パスウェイや分子複合体などの同一の機能的モジュールに属していることが多い(実例として分かっている疾患はほとんどないのだが、Fanconi貧血はDNA修復という機能的モジュールに含まれる蛋白をコードする遺伝子の変異による)。実際の疾患遺伝子にモジュール形成があるかを検討するため、まず疾患遺伝子の相互作用(すなわちDGN)と既報の蛋白-蛋白相互作用マッピング(interactome)の結果を重ねてみた。その結果、DGNと蛋白相互作用マップの間で290の相互作用が重なっていた。これはランダムコントロールで予想される相互作用数(平均30程度)の10倍と大きいものであった(P<10^-6)(図3a)。
d0194774_12522545.gif

図3:DGNのモジュール形成
a :疾患遺伝子の蛋白産物間に見られる相互作用(赤矢印↓)は、ランダムコントロール(青)で予想される相互作用の数の分布に比べ非常に多い。
b:共通の疾患に関連する疾患遺伝子は組織均質性(赤)が高い(同じ遺伝子数のランダムコントロール(青)を比較のために示している)。
c:同じ疾患に対応する2つの疾患遺伝子ペアの発現プロファイルの相関係数(赤)のPCCの分布は、コントロール(青)に比べて高い方にシフトしている (P<10^-6)。
d:同じ疾患に関連するすべての遺伝子の発現プロファイル間の平均PCCは、コントロールに比べ、高値にシフトしている(P<10^-6)。


同じ疾患に関連する疾患遺伝子は、共通の機能的な特徴、すなわち共通の遺伝子オントロジー(Gene Ontology; GO)を共有していると思われる。実際、同一疾患においてGOの均質性はランダムコントロールに比べて大きかった(SI図8)。

疾患遺伝子の蛋白産物が共通の機能的モジュールに含まれるとき、同じ組織内に発現する傾向が強いはずである。実際、疾患の組織均質性係数という指標(マイクロアレイデータにある36組織の10,594遺伝子のデータセットの中で、特定の組織に発現している共通の疾患に属する遺伝子の最大の割合)を考えると(図3b)、疾患の68%が組織均質性を持っており、これはランダムコントロールで予想される51%に比べ有意に大きかった(P<10^-5)。

共通の機能的モジュールに含まれる疾患遺伝子は共発現する傾向があると思われる。図3cに示すように、同じ疾患に関連する2つの遺伝子の共発現プロファイルの相関係数(Pearson correlation coefficients, PCC)の分布は、ランダムコントロールのPCCに比べ高値にシフトしていた(P < 10^−6)。また図3dに示すように、全体の疾患に関与する2つの遺伝子ペアのPCCの平均もランダムコントロールに比べ高値にシフトしていた。図4dではPCCが約0.75を明らかなピークとする小さい分布の山を伴っていた。このピークは平均PCCが大きい約33疾患によるもので、Heinz体貧血(PCC=0.935)、Bethlem筋症(PCC=0.835)、球状赤血球症(PCC=0.656)などを含んでいた。

以上より、共通の疾患に関連する疾患遺伝子は、それらの蛋白産物が互いに相互作用し、同じ組織に共通して発現し、共発現のレベルが高く、同じGO用語に含まれる傾向がある。すなわち、疾患遺伝子にはモジュール構造が認められると考えられる。

疾患遺伝子のうち一部の「必須遺伝子」だけがネットワークの中心となっている
ヒトの疾患遺伝子がコードする蛋白は、他の蛋白との相互作用が特に多い、すなわちネットワーク上でハブを形成するものだろうか?この問題は、がんにおける蛋白-蛋白相互作用ネットワーク(interactome)において検討されてきたが、ヒト疾患全体においてはまだ明らかになっていない。図4aでは、疾患遺伝子はinteractomeの中でハブとなる蛋白をコードしている傾向があることを示している。疾患遺伝子がコードする蛋白は他の疾患関連でない蛋白に比べると、他の蛋白との相互作用が32%大きい、すなわちネットワーク内では頂点としての枝の数〈k〉が多かった。また、枝の数〈k〉の多い蛋白は少ない蛋白に比べると、疾患に関連する遺伝子によってコードされている傾向があった(P=1.6x10^-17)。
d0194774_12541357.jpg

図4 「必須遺伝子」(出生に必須で欠損すると致死になる遺伝子)のトポロジーにおける機能的役割
a:遺伝子がコードする蛋白が他の蛋白と相互作用する数(枝の数)〈k〉と、その中で疾患遺伝子が占める割合f。これによると、枝が多いすなわちハブであることと疾患遺伝子であることは相関があると「一見」思われる。
b:ヒト遺伝子のうち「必須遺伝子」(これが欠損すると致死、マウスで検討された遺伝子のヒトにおけるホモログ)と疾患遺伝子の重なりをベン図で表している。疾患遺伝子のうち、重なっている部分は「必須」である疾患遺伝子、緑の部分は「非必須疾患遺伝子」。
c:枝の数〈k〉の多い蛋白は少ない蛋白に比べると「必須遺伝子」によってコードされている傾向がある。
d:しかし、枝の数〈k〉と「非必須疾患遺伝子」のあいだには相関がない。すなわち、疾患遺伝子であっても、「必須遺伝子」でなければそれがコードする蛋白がハブを形成する傾向はない。
e:他の蛋白との共発現〈ρ〉が多いと、その蛋白が「必須遺伝子」によってコードされている傾向が強いが、
f:「非必須疾患遺伝子」によってコードされている傾向は多くない。
g:蛋白が発現している組織の数nTが多いと、その蛋白が「必須遺伝子」によってコードされている傾向が強いが、
h:「非必須疾患遺伝子」によってコードされている傾向は多くない。


ところがこの検討では、本当に重要な蛋白は発生に必須であり、もしその蛋白に変化があれば妊娠第一期に自然流産(または出生後すぐの死亡)を起こしてしまうという重要なことを無視しているのである。この問題は、マウスにおいて欠損すると胚性致死(または出生後致死)を示す遺伝子のヒトにおける相同な遺伝子(オルソログ)を調べることで乗り越えられる(マウスの致死性遺伝子はMouse Genome Informaticsに基づく)。この検討により、そのようにマウスで欠損させると致死になる遺伝子のヒトにおけるオルソログは1,267遺伝子あり、そのうち398遺伝子がヒト疾患関連遺伝子に含まれるものであった。ここでは、この1,267遺伝子を「必須遺伝子(essential gene=出生してくるのに必須という意味)」と呼び、OMIMにあった1,777の疾患遺伝子全体から「必須遺伝子」に含まれる398遺伝子を除いた1,379遺伝子を「非必須疾患遺伝子(non-essential disease gene)」と呼ぶことにする(図4bのベン図参照)。

疾患遺伝子のうち、「必須遺伝子」(図4bの重なり部分)と「非必須遺伝子」(図4bの緑色部分)はヒトのinteractomeにおいて非常に異なる役割を示していることが分かった。まず、疾患遺伝子のうちの「必須遺伝子」がコードする蛋白は、すべての疾患遺伝子がコードする蛋白に比べると、ハブを形成する傾向があった(図4c、P=1.3x10^-17)。そうすると、図4aで見られた「疾患遺伝子がコードする蛋白はハブを形成する」という傾向は、単に疾患遺伝子の22%(1,267遺伝子中396遺伝子)が「必須遺伝子でもある」ということによって起きているのか?驚いたことに、疾患遺伝子の多く(78%)を占める「非必須」遺伝子がコードする蛋白は全くハブを形成していなかった(図4d:非必須疾患遺伝子がコードする蛋白の枝の数〈k〉と、その蛋白が疾患遺伝子によってコードされているということの間に相関はない)。したがって、図4aに見られた疾患遺伝子がコードする蛋白がハブを形成するという傾向は、疾患遺伝子の中の少数の「必須遺伝子」によるものであった。

また、遺伝子発現パターンの同調(シンクロナイズ)について検討した。細胞の円滑な機能発揮のためには、いくつもの機能的モジュール活性を協調させて維持する必要がある。そのため、重要な遺伝子の発現パターンは同調していると考えられる。疾患遺伝子のうち「必須遺伝子」である遺伝子の発現パターンも多くの他の遺伝子の発現と同調しているだろう。このことを検討するため、平均遺伝子共発現係数〈ρ〉という測定値を考えた。これは、正常ヒト組織マイクロアレイの結果から、「必須遺伝子」(または「非必須疾患遺伝子」)iと細胞内の他のすべての遺伝子との間のPCCijを求め、合計して平均したもの〈ρ〉i=Σj PCCijである。予想どおり、他の遺伝子との高い平均共発現係数〈ρ〉を示す遺伝子は、低い〈ρ〉やマイナスの〈ρ〉を示す遺伝子よりも「必須遺伝子」であることが多かった(図4e、P=1.7x10^-4)。しかし、「非必須疾患遺伝子」は逆の傾向を示し、発現パターンが他の遺伝子と逆相関を示すか相関がない遺伝子と関連していた。図4fに示すように、発現が高度に同調した遺伝子(〈ρ〉 > 0.2)の中で「非必須疾患遺伝子」が占める割合は少なかった (P = 2.6 × 10^−8)。このように、「必須遺伝子」の発現は他の遺伝子の発現と同調しているが、「非必須疾患遺伝子」の発現は、他のすべての遺伝子の発現パターンから大きく外れているという傾向が見られた。

最後に、すべての組織で常に発現しているハウスキーピング遺伝子が疾患遺伝子になっている傾向があるかを検討した。図4gに見るように、遺伝子が発現している多くの組織が多いほど、その遺伝子が「必須遺伝子」である傾向があった(P=2.8x10^-16)。「非必須疾患遺伝子」においては図4hのようにその逆であり、少ない組織に発現している傾向が見られた(P=1.4x10^-6)。ハウスキーピング遺伝子のうちたった9.9%しか疾患遺伝子ではなく、これは非ハウスキーピング遺伝子の13.5%が疾患遺伝子ということに比べて有意に少ない(P=3.6x10^-6)。それに対し、マウスのハウスキーピング遺伝子の59.8%は「必須遺伝子」であり、これは非ハウスキーピング遺伝子で40.5%が「必須遺伝子」であったのに対し有意に多いP<10^-4)。
以上より、「非必須疾患遺伝子」はハブに関係しておらず、他の遺伝子の発現との同調が少なく、発現している組織も少ないという傾向が認められる。すなわち、「非必須疾患遺伝子」の多くはトポロジーにおいては機能的に「末梢を占めている」と言える。そしてそれとは対照的に、「必須遺伝子」はハブとなる蛋白をコードしていて、他の残りの遺伝子と強く同調して発現する。また、多くの組織で発現し、ハウスキーピング遺伝子の中で多くの比率を占めている。「必須遺伝子」はトポロジーにおいて機能的に「中心的」であると言える。

多くの疾患遺伝子が「末梢性」しか示さないという結果は意外であったが、これは進化の過程を考えに入れるとうまく説明できるだろう。もしトポロジカルに「中心的」な遺伝子に変異が起きると、それは広く発現しているため、正常の発生や生理的機能に強い障害を与え、その個体は発生早期に致死となってしまい集団からは除かれる。そのため、このような「中心的」な遺伝子の変異ではなく、生殖年齢まで生存できる変異だけが集団内で維持されるわけである。したがって、トポロジカルに「末梢にある」疾患関連の変異の方が生存のチャンスは大きくなる。

疾患遺伝子の変異が(遺伝的なものでなく)体細胞突然変異であれば、上記のような選択圧は受けないだろう。本当にそうかどうかを検討するため、Cancer Genome Censusに登録されているがんを起こす体細胞変異の特徴を検討した。その結果、がんで体細胞変異を起こしていたがん遺伝子はハブをコードしており、他の遺伝子と高い共発現を示し、ハウスキーピング遺伝子の中の多くの割合を占めていた(SI図10)。すなわち、体細胞変異を起こすがん遺伝子はトポロジカルに「中心的」であり、これは「多くのがん遺伝子は細胞の発生と成長に重要な役割を果たす」という我々の理解(例えばp53が細胞の生存や死に重要であるなどの知見)に合致するものである。
[PR]
# by md345797 | 2014-06-16 12:57

複雑ネットワークの理論(5): 代謝ネットワークはスケールフリーかつモジュール性を持つ階層的ネットワーク

Hierarchical organization of modularity in metabolic networks.

Ravasz E, Somera AL, Mongru DA, Oltvai ZN, Barabási AL.

Science. 2002 Aug 30;297(5586):1551-5.

【論文内容】
ネットワークにおけるモジュール

モジュールは、システムの構成因子がある区別される領域にまとまって機能するものである。ネットワークはいくつかのモジュールに分けられることがあり、特に社会的なネットワークではモジュールはコミュニティと呼ばれる。このコミュニティの検出方法についてはさまざまな方法が考えられている。なお、ネットワークのモジュールは、単なるクラスター(頂点が三角形を作る構造)とは違うことに注意する。

スケールフリー性とモジュール性
生物における代謝ネットワークはスケールフリー・ネットワークであると考えられ、多数の反応に関わるハブとなる基質が少数存在するトポロジーを示している。このような従来のスケールフリー・ネットワーク(図1A)ではその定義上、分けて考えられるようなモジュールは存在しない。しかし、現実の代謝ネットワークでは生化学的にまとまって分けて考えられるような機能的モジュールが存在している。また、代謝ネットワークは、クラスター係数が高いネットワークであり、モジュールの存在を示唆するものである。したがって、いくつかのモジュールどうしが連結しているネットワーク(図1B)が想定できる。しかし逆に、このような明らかなモジュール性を持っていると頂点がほぼ同数の枝を持つようになり、ハブが出現せずスケールフリーにならなくなってしまう。
d0194774_21165818.jpg

図1:複雑ネットワークの3種類のモデル。いずれも左にシェーマ、右に256個の頂点を持つ典型的なネットワークの形態を示す。
A: スケールフリー・ネットワーク。新しい頂点は、もともと多くの枝を持つ頂点に連結するため、非常に多くの枝を持つ頂点(ハブ)ができる。モジュール性は少ない。B: モジュールが相互に連結したネットワーク。どの頂点もほぼ同じ数の枝を持ち、ハブは存在しない。C: 階層的ネットワーク。なお、図1C左側のグラフには元論文の間違いがある(後述赤字の注2参照)



代謝ネットワークは高い平均クラスター係数を持つ
では、実際の代謝ネットワークの性質はスケールフリーなのか、モジュール性なのか。この問題を検討するため、まず実際の43種類の生物の代謝ネットワークの平均クラスター係数を計算した。

◇クラスター係数とは:
ある頂点が作りうる範囲でどのくらいクラスター(その頂点を含む三角形の構造)を作っているかの割合である。図2A左の赤の頂点に連結している青の頂点の間がすべて直接連結されているときは、赤の頂点のクラスター係数をC=1(すべてクラスター化している)。右のように赤の頂点に連結している青の頂点どうしが直接連結していないときをC=0(クラスター構造はない。赤の頂点を介して連結しているだけ)とする。真ん中のように、青の頂点の間に実際ある枝(3本)を連結しうる枝の数(6本)で割ったものC=1/2が赤の頂点のクラスター係数になる。

一般的には、頂点iが枝をki本持つ、すなわちki個の頂点に隣接するとする。そうすると、それらのki個の頂点から2つ選んで連結してできうる枝の総数はki(ki-1)/2本である。ここで実際にはki個の頂点がn本の枝で連結されているとすると、頂点iを含むクラスター(頂点iを含む三角形)がn個あることになり、頂点iのクラスター係数Ciをn/[ ki(ki-1)/2]で定義する。頂点iのCiは、頂点iが作りうるクラスターのうち、どのくらいの割合で実際のクラスターができているかを表す。全部の頂点のクラスター係数の平均値を平均クラスター係数とする(注1)。平均クラスター係数は、ネットワーク全体でどのくらいクラスターが形成されているか、すなわち「ネットワークのモジュール化」の指標になる。

注1:グラフ理論では、上記の「頂点のクラスター係数Ci」を「クラスター度」といい、ネットワークの全部の頂点のクラスター度の平均のことを「クラスター係数」ということがあるので注意。

ここで、43種類の生物の代謝ネットワークにおける、頂点数Nと平均クラスター係数C(N)の関係を図2Bに示した。紫は古細菌、緑は細菌、青は真核生物を表し、頂点数Nのスケールフリー・ネットワークの平均クラスター係数にを白い◇で示した。同じNのスケールフリー・ネットワークと比べると、生物の代謝ネットワークは平均クラスター係数C(N)が大きい。したがって、現実の代謝ネットワークは、理論的なスケールフリー・ネットワークより高いモジュール性を持っていることが分かる。また、スケールフリー・ネットワークはその頂点数Nが大きくなるとN^-0.75にしたがって平均クラスター係数C(N)は小さくなる(頂点が増えるとクラスターを形成しにくくなる)が、生物の代謝ネットワークでは、その生物における頂点数(代謝産物の数)に関わらず平均クラスター係数C(N)は一定であった(モジュール化の程度はどの生物の代謝ネットワークも同じ)。
d0194774_2103799.jpg

図2 代謝ネットワークにおける階層的モジュール性
A: ある頂点(赤●)のクラスター係数Cの説明。左のように連結している頂点(青●)の間がすべて直接連結されているときはC=1(すべてクラスター化している)。右のように連結している頂点の間で直接連結していないときはC=0(クラスター化なし)。真ん中は、青●の間に実際ある枝(3本)を連結しうる枝の数(6本)で割ってC=1/2である。
B: 43種類の生物の代謝ネットワークの頂点数Nと平均クラスター係数C(N)の関係。古細菌(紫)、細菌(緑)、真核生物(青)のすべてでNの数に関わらず平均クラスター係数は同じ。頂点数と枝数が上記の生物と同じでフリースケール・ネットワークの場合のC(N)を◇、理論的な値を線で示したが、実際の生物でのC(N)はそれらより常に高い。
C-E: 古細菌A. aeolicus、細菌E. coli、真核生物S. cerevisiaeの代謝ネットワークの頂点における枝の数kとクラスター係数C(k)の関係は、いずれもベキ法則C(k)~k~^-1に従うという特徴がある。Fは43種類の生物全体での平均(小さい表示は合計)したものを表す。同じ頂点数・枝数の単なるフリースケール・ネットワークでは◇のようになり、ベキ法則には従わない。


「階層的ネットワーク」の提唱

生物の代謝ネットワークは、前に見たようにスケールフリー・ネットワークであると同時に、その頂点数に関係しない高い平均クラスター係数を持つモジュール性を示すことが分かった。しかし、この2つは明らかに矛盾することであり、これらの条件を満たす、代謝ネットワークの新しいモデルが必要になった。これが階層的モデル(hierarchical model)と呼ぶものである(図1c)。

例としてN個の頂点、ここでは4個の頂点がすべて互いに連結した小さい連結グラフをまず作る。これを1つのモジュールと考え、この周りに(N-1)つ、ここでは3つの同じものを複製し、それら複製グラフで外側にある3個の頂点を古いグラフの真ん中の頂点とそれぞれ連結する。これにより新しく4+4x3=16個の頂点を持つ連結グラフができたことになる。次に、この16個の頂点を1つのモジュールと考えて、周りに3つ同じものを複製し、外側の頂点をまた古いグラフの真ん中の頂点と連結する。これを繰り返すと頂点の数は4倍ずつ増加する(注2)。

注2: 図1Cの左図は、上記の説明では連結がないはずの周囲の3つの連結グラフの中心どうしが連結しており、元論文の間違いではないか?正しい図が『複雑ネットワーク 基礎から応用まで』(増田直紀、今野紀雄・近代科学社)の「図6.11ラヴァスの階層的モデル」に掲載されていたため、以下に引用させていただいた。
d0194774_2111384.jpg

これは、スケールフリー・ネットワークであり(ハブがあり、新しい頂点が選択的にハブに連結する)、かつモジュール構造を持つネットワークになる。スケールフリー性のベキ指数はγ=1+(ln 4)/(ln 3)=2.26、クラスター係数は頂点数に関わらずC≃0.6となり、いずれも実際の代謝ネットワークに近い。また、このネットワークは繰り返し4倍になっていくことから、階層的である。このような階層では、頂点がk本の枝を持つとき、頂点のクラスター係数はベキ法則C(k)~k^-1に従って減少することが分かっている(Drogovtsev, 2002)。

実際、43種の生物の代謝ネットワークのC(k)が、上のような1/k法則に従うかを検討した。図2C-Fに示すようにC(k)~k^-1であり、これらの代謝ネットワークは階層的ネットワークの特徴を示すことが示された。このように階層的ネットワークは、スケールフリー性のあるトポロジー、頂点数によらない高いクラスター係数、C(k)がベキ法則に従うという性質を併せ持っている。

ネットワークの中にあるモジュールを発見する
ここから、E. coliのネットワークをグラフ理論に基づいて検討することとした。先にネットワークのトポロジカル・オーバーラップ行列O_T(i, j)を求めることにより、モジュールを発見する方法について述べる。

◇トポロジカル・オーバーラップとは:
頂点iと頂点jがあるとき、トポロジカル・オーバーラップO_T(I, j)とは、「iとjのどちらも連結している頂点の数」を「iとjの枝の本数の少ない方」で割ったもの。この数が多い方と、頂点iと頂点jが同じモジュールにある度合いが高いと言える(図3A)。

頂点iとjの間でトポロジカル・オーバーラップが1というのはiとjがすべて同じ頂点に連結していることを表し、0はiとjが共通の頂点に連結していないことを表す。2つの頂点からの連結が共通の頂点を通じてオーバーラップしているかどうかということである。高度に連結したモジュールに含まれる頂点は、隣接する頂点とトポロジカル・オーバーラップが大きい。代謝ネットワークにおいては2つの基質のトポロジカル・オーバーラップが大きいほど、同じモジュールに属する可能性が高いと言える。そのため、この2頂点を行列表示したトポロジカル・オーバーラップ行列はモジュールの発見に有用である。
d0194774_19364968.jpg

図3:トポロジカル・オーバーラップを求めることによりモジュールを発見する
A. 小さいネットワークの例を示す。2つの頂点iとjにおいて、トポロジカル・オーバーラップは次のように定義される。
d0194774_3575750.gif

ここで、J_n(i, j)はiとjが連結している頂点の数を表す(もしiとjの間に直接連結があれば1を加える)。[min (ki, kj)]は頂点iの枝の数kiと頂点jの枝の数kjのうち小さい方を表す。すべての枝の上の赤字は連結された2頂点のトポロジカル・オーバーラップを表し、頂点の横にあるカッコはその頂点のクラスター係数を表している。なお、原論文の図ではCのクラスター係数が(3)となっておりミスプリントであったので、引用の際(1/3)に改変した。

B: Aで示したネットワークのトポロジカル・オーバーラップ行列。行と列は階層的クラスタリングアルゴリズム(Eisen MB, et al. PNAS, 1998)を用いて頂点を並べ替え、連結のオーバーラップが大きい頂点どうしを近くに配置するようにした。色は、頂点間のオーバーラップの度合いを表示したもの。これにより、赤~茶色にかけてのモジュールが3個あることが分かる。
また、上と右につけた樹状図は3つのモジュールを表しており、EFGとHIJKは、ABCよりもトポロジー的にお互い近いことを表す。なお、図3Aの頂点ABCDの赤色とHIJKの青色が図3Bでは原論文のミスで逆になっているので注意。


実際の代謝ネットワークにおけるモジュールの同定
図4Aは、E. coliの代謝ネットワークのトポロジーを、図3Bと同様のトポロジカル・オーバーラップ行列で表したものである。これによると、強固に相互連結したモジュール(行列の赤色の部分)がいくつも形成されているのが分かる。これを拡大して見るとサイズが大きく相互連結が少ない入れ子になった(nested=フラクタルのように拡大しても自己相似形がある)モジュールの階層が認められた。

ここで明らかになったネットワークにおけるモジュールと、代謝産物の生化学的特性との間の関係を視覚化するために、行列の上と右に代謝産物の階層木(hierarchical tree)を表示した。これらは生化学的分類を用いて色分けしている。その結果、小分子の種類ごと(代謝パスウェイごと)にだいたい同じ木の枝に分布しており、これを圧縮して三次元表示した図4Bでは代謝ネットワークの区切られた領域に対応して分布していた。以上よりE. coli代謝ネットワークにおいて、今回階層的モデルから得られたトポロジカルな構成は、実際の代謝産物の生化学的分類と強い相関があることが分かる。
d0194774_2144257.jpg

図4:E. coliの代謝ネットワークにおけるモジュールの同定
A:E. coliの代謝ネットワークに対応するトポロジカル・オーバーラップ行列(中央)、モジュール間の関係を表す階層木(行列の上と右)。階層木の色は行列の下にあるように、炭水化物(青)、核酸代謝(赤)、蛋白・アミノ酸代謝(緑)、脂質代謝(水色)、芳香族代謝(濃いピンク)、モノカルボニル化合物代謝(黄色)、コエンザイム代謝(薄いオレンジ色)で色分けしている。
B:代謝ネットワークの3次元構成。各頂点の色はAで示した通り。薄い青で囲んだ部分はピリミジン代謝に関わるモジュール。
C:ピリミジン代謝のモジュールを拡大し階層木にしたもの。全体が3段階のモジュールの入れ子構造になっており、1段階目を水色、2段階目を薄いオレンジ色で表している。
D:ピリミジン代謝モジュールとその周囲の代謝産物のグラフ。赤はCで示されたピリミジン代謝のモジュールに含まれる代謝産物。緑はピリミジン代謝パスウェイにあるが、非分岐点や分岐の経路の終末点にあたるためCには表示されていない代謝産物。青と黒はピリミジン代謝から他の代謝経路に連結する代謝産物で、黒は他の代謝経路の枝に属する主要な代謝産物、青は分岐しない代謝産物。矢印は反応方向、番号はその反応を触媒する酵素を表す。


上記のようにグラフ理論を用いて、実際の生化学的パスウェイにおけるモジュールを見出しうるかを、ピリミジン代謝パスウェイに絞って検討することにした。代謝ネットワークを階層的ネットワークと考えると、ピリミジン代謝は図4Bの薄い青色で囲んだ領域にトポロジカルに限定され、図4Cに示すような4つのモジュールから構成されていた(4つのモジュールもさらに小さいモジュールからなるという、入れ子構造になっている)。また、実際の代謝経路は図4Dのグラフで示したものである。ここから、赤い四角で囲まれた代謝産物によって構成されたモジュールを発見するのが上記の方法である。

なお、階層的ネットワークにおけるモジュールの境界は直観的に分かる生化学に基づく境界と常に一致するとは限らない。例えば、L-glutamineからのuridine 5’-monophosphate (UMP)の合成は直線的な生化学反応のモジュールに含まれるが、UMPからのuridine 5’-diphosphateの合成はモジュールの境界を越えていた。このようにまだ明らかなモジュールとして分からないところもあり、代謝ネットワークにおけるモジュールの理解のためには、さらなる実験的および理論的解析が必要なのだろう。

まとめと今後の展望
以上のように代謝ネットワークの構造は、階層的ネットワークモデルとつなぎ目なく埋め込まれたモジュールによって表されることが明らかになった。代謝ネットワークは、従来の直観的に分かるようなモジュール性(図1B)、すなわちいくつかの隔離したモジュールが少ない枝を介して連結しているモデルではなく、小さいモジュールがグループを形成して大きなモジュールを形成し、それが集まってさらに大きなモジュールになるというモデルで表される。この構造は図4Aにある階層的木によっても視覚的に理解でき、逆向きに代謝ネットワークをいくつかの大きい統合のゆるいモジュールに分け、それをさらに小さい統合の強いサブモジュールに分けていくことが可能になる。

なお、上記の階層的ネットワークとモジュール性によるネットワークの理解は、代謝ネットワークのみならず、他の細胞内ネットワーク(遺伝子ネットワーク、蛋白相互作用ネットワーク)や社会的ネットワーク(WWW、インターネットのネットワーク)にも応用可能だろう。また、生態系は複数のレベルで進化が同時に起きる現象があるが、これも生態系ネットワークのモジュール性で説明可能かもしれない。ある局所的な変化が起きると高度に統合された小さいモジュールがまず変化し、それがゆるく統合した大きいモジュールにゆっくり影響を与えることによるのだろう(そもそもモジュールとは、局所的な構成要素の変化が起きても、その変化が他の構成要素に及ぼす影響が最小限ですむように、小規模のグループを構成していることでもある)。また、階層的トポロジーはすでにあるモジュールをコピーしたり再利用したりして創発する(図1C)。そのため、ネットワークに最初にモジュールが現れるメカニズムやその後に階層的およびスケールフリーのトポロジーが同時に出現する進化的メカニズムの理解が、今後のネットワーク理論の重要な課題となるだろう。
[PR]
# by md345797 | 2014-06-10 21:07

複雑ネットワークの理論(4) 細胞内代謝パスウェイはスケールフリー・ネットワークである

The large-scale organization of metabolic networks.

Jeong H, Tombor B, Albert R, Oltvai ZN, Barabási AL.

Nature. 2000 Oct 5;407(6804):651-4.

【まとめ】
43種類の生物(古細菌、細菌、真核生物)の細胞内代謝ネットワークを、酵素反応の基質を「頂点」、反応を「枝」で表したネットワークと考えたところ、これらの代謝ネットワークは、生物種によらずスケールフリー・ネットワークの特徴を示したことを報告する。これにより、細胞の代謝ネットワークが示す頑健でエラー耐性があるという特徴は、それがスケールフリー・ネットワークであることに基づくと考えられる。

【論文内容】
生命現象の過程に見られる頑健性(robustness)は、蛋白、DNA、RNA、小分子などといった構成要素の動的な相互作用による。この相互作用は極めて複雑なネットワークであるが、それを複雑系(complex system)としてとらえることが可能になりつつある。複雑系は以前より、古典的なランダムネットワーク理論(Erdös–Rényiモデル)で考えられてきた。これは、構成要素を頂点とし、それらがある確率pをもってランダムに連結されたグラフである。このネットワークは図1aのようなものであるが、その結合性は図1bで表されるような均一なポアソン分布となる。すなわち、頂点から出る枝の数kは平均値〈k〉をピークとして、その確率分布P(k)は指数関数的に減少する。

一方、World-Wide Webやインターネットなどが示す現実のネットワーク(図1c)は、このようなランダムな構造ではなく、P(k)がベキ法則(power-law)で減少するスケールフリー・ネットワークである。スケールフリー・ネットワークは、非常に多い数の枝を持つ少数の頂点(ハブ)と枝の数が少ない大多数の頂点からなるという、極めて不均一なトポロジーを示すネットワークである。これは、少しずつ頂点が加わっていくというネットワークの「成長」と、新しい頂点がハブに優先的に結合するという「優先的選択」によって形成されることが分かっている。
d0194774_17205150.jpg

図1 2種類のネットワーク構造の特徴
a, 指数関数的(Exponential)ネットワーク。ランダムネットワーク、Erdös–Rényi モデルとも呼ばれる。b, ネットワークの頂点がk本の枝を持つ確率はP(k)は平均値〈k〉をピークに指数関数的に減少する。そのため、枝の数が極端に大きい頂点は存在しない。c, フリースケール(Scale-free)ネットワーク。「ハブ」と呼ばれる、枝の数が極端に大きい頂点(灰色の●)が少数存在する。d, スケールフリー・ネットワークでは、P(k)はピークを持たず、ベキ法則に従って減少する。P(k) ≈ K^-γであり、これは両対数グラフで傾きが-γの直線で表される。e, E. coliの代謝反応の一部をグラフ理論で表示したもの。このグラフにおいて頂点(四角で囲まれた部分)は酵素反応における基質である。いくつかの基質(educt)が複合体を作り、酵素によって反応を起こし、産物(products)となる。productはさらなる酵素反応のeductになっている。酵素反応はこれらの頂点を結ぶ枝であり、その反応をつかさどる酵素はEC番号で表示されている。


細胞ネットワークの大規模構造を理解する手始めとして、43種の生物の主要代謝ネットワークのトポロジー特性を検討した。ここでは、代謝パスウェイとゲノムの統合データベースであるWIT databaseを用いた。代謝ネットワークにおける反応は、図1eのようなグラフで表した。ここでは酵素反応の基質が頂点で、酵素反応が枝、代謝をつかさどる酵素がEC番号で表示されている。さまざまな代謝ネットワークをこのようなグラフで表すことにより、グラフ理論と統計学を用いてそのトポロジー特性を検討したり定量化したりすることが可能になる。

代謝ネットワークは、ランダムで均質な指数関数的モデルと、非均質なスケールフリーモデルのどちらで表されるのだろうか?結果は図2に示すように、酵素の基質(頂点)がk個の酵素反応(枝の本数がk本)である確率はベキ法則P(k) ≈ K^-γに従っていた(図2のa、b、cはそれぞれ古細菌、細菌、真核生物の代表例、dは43種すべての平均)。すなわち、代謝ネットワークはスケールフリー・ネットワークであった。頂点あたりの枝の数kは、頂点に入ってくる枝と出ていく枝でそれぞれk_inとk_outと表わされ、それぞれのベキ指数γ_inとγ_outはいずれも2.2であった。
d0194774_1718994.jpg

図2 さまざまな生物の代謝ネットワークの結合性分布
a: 古細菌(Archaeoglobus fulgidus)、b: 細菌(E. coli)、c: 真核生物(C. elegans)。代謝における酵素反応の基質を頂点とし、酵素反応を枝としたとき、頂点あたりの枝の数kと、その枝数をもつ確率P(k)の関係を両対数グラフで表したもの。Inは頂点に入ってくる枝、Outは頂点から出ていく枝についてkの確率分布を表している。a、b、cのいずれも、両対数グラフでマイナスの傾きを持つ直線で表されるため、P(k)がベキ法則に従っていることが分かる。dは、検討した43生物のすべての結合性分布の平均を表す。


多くの複雑ネットワークでは、2つの頂点は比較的短い距離(=少数の枝の数)で連結されている。このようなネットワークをスモールワールドであるという。図3aはE. coliの代謝ネットワークがスモールワールドであることを表すヒストグラムである。図3aの横軸は、E. coli代謝ネットワークの2頂点間の距離(2つの頂点が最短でいくつの枝で連結されているか、lはpathway length)、縦軸は任意の頂点間の距離の頻度Π(l)を示す。これによると頂点間の距離は3であることが最も多く、代謝ネットワークはスモールワールドであることが分かる。

また、2頂点の最短距離を全部の頂点間で平均したもの(グラフ理論における平均距離)を、ここではネットワークの直径(diameter)と呼ぶ。直径が小さい方が、ネットワーク内の伝達が速いことになる。単純な細菌(例えばMycoplasma genitalium)に比べるとより複雑な細菌(E. coli)は酵素や基質が多い(頂点や枝が多い)のだから、代謝ネットワークの直径は大きくなるように思われる。ところが図3bに示したように、43種類の生物すべてで代謝ネットワークの直径は同じであった(大体3程度)。この結果は予想外であったが、生物が複雑になり頂点数が増加しても、その分連結も増加するのであれば、2頂点間の経路は増大せず、ネットワークの直径は一定になりうる(頂点数が増えてもその分経路も増えれば、頂点から頂点への行きやすさは全体的にあまり変わらないということ)。実際、図3cとdで見るように、生物が複雑になって酵素反応の基質の種類(頂点の数 N)が増加すると、基質あたりの反応数(頂点あたりの枝の数 L/N)が増加していることが分かる。なお、cは入ってくる枝、dは出ていく枝であり、赤が古細菌、緑が細菌、青が真核生物での結果を示している。
d0194774_17163969.jpg

図3 生物種によらず、代謝ネットワークの直径は一定である
a, E. coliの代謝ネットワークで、代謝産物を頂点としたときの2頂点間の距離(最短経路、pathway lengthのl)のヒストグラム。縦軸のΠ(l)は、任意の2つの頂点がlの距離を取る頻度を表す。これによると頂点間の距離は3であることが最も多く、代謝ネットワークはスモールワールドであることが分かる。 b, 43種類の生物の代謝ネットワークの平均距離 (直径)。エラーバーは標準偏差σであり、aの説明にあるΠ(l)により求められたlを用いて〈l^2〉-〈l〉^2で近似される。ネットワークの頂点数Nが大きくなっても、ネットワークの直径dは変わらない。c, d,生物が複雑になって酵素反応の基質の種類(頂点の数 N)が増加すると、基質あたりの反応数の平均(頂点あたりの枝の数の平均 L/N)が増加することが分かる。cは入ってくる枝、dは出ていく枝についてであり、赤は古細菌、緑は細菌、青は真核生物。e, E. coliの代謝ネットワークから基質を除外した場合の直径に及ぼす影響。赤は枝の多い頂点(関わる酵素反応が多い基質)から順に除外した場合、緑はランダムに頂点を除外した場合。除外する頂点数M=60で、代謝に見られる基質の約8%を除外したことに相当する。f, 43種の生物の代謝ネットワークにある基質のうち、平均のランク順〈r〉とその標準偏差σの関係。ランクが高い(横軸で数値が小さい)基質は、普遍的に多くの生物で用いられており、その基質のランクは生物間のばらつきが少ない。


スケールフリー・ネットワークは、少数のハブによってネットワーク全体の結合が保たれているので、ハブが外部から攻撃されたときはネットワークは脆弱である。枝の数が多い頂点(大きなハブ)から順番に取り除いていくと、ネットワークの直径が急速に増加し(=結合性が弱くなり)、非連結のクラスターに分解されてしまう。しかしその一方で、スケールフリー・ネットワークにはハブが存在するそのことにより、ランダムに起きるネットワークのエラーには予想外の頑健性を示す。

そこで、E. coliの代謝ネットワークにも、このような「攻撃に対する脆弱性とエラーに対する耐性」が見られるかをコンピュータ・シミュレーションで検討した。図3eの赤い△のように、最も多く連結している頂点(基質)から順に除外していくと、代謝ネットワークの直径は急速に増加した(Mは除外する基質数、横軸右に行くにしたがい徐々にはハブを除外)。しかし、緑の□のようにランダムに基質を除外していっても、ネットワークの直径は変わらない。仮にランダムな酵素の変異が起きていくつかの基質ができなくなったとしても、これによってネットワークの連結性はほとんど影響を受けないことが分かる。なお、ここでハブとなる基質はごく少数なので、ランダムに起きる酵素の変異によってハブが消失する確率は非常に低いのだろう。このようなE. coli代謝ネットワークの変異に対する耐性は、in silicoin vivoで変異を起こす研究で詳細に検討されている (Edwards JS, PNAS 2000)。なお本研究では、43種類の生物すべてに同様のエラー耐性が認められた。

代謝ネットワークの大規模構造の特性はネットワークがハブを持つことによると考えられるが、全生物で同じ基質がハブとして働いているのか、それともハブは生物ごとに違いがあるのか?これを検討したところ、43の生物でハブとして働く基質のランキングは事実上同じ(論文のsupplementary Table 1)であった。43の生物で認められる全種類の基質の中で、ハブとなる基質は4%のみである。すなわち、生物はごく少数の基質を普遍的に利用していることが分かる。一方、生物に特異的な違いの見られる基質は、反応の枝の数が少ない。これを定量的に表すために、43の生物で認められた基質ランキングr の標準偏差σ(r)を図3fに示した。ハブとなる基質のランク順の平均〈r〉が大きくなるほど、σ(r)が大きくなっており、これは基質としての利用ランクが高いもの(〈r〉が小さいもの)ほど生物間のばらつきが少ない(σが小さい)ことを表している。以上より、43の生物種の代謝ネットワークにおいて、多くの枝を持つ頂点は生物間で普遍的に用いられており、枝の少ない頂点は生物によってばらつきがある。

生物が現在示す代謝ネットワークのトポロジーは、内部からのエラーと外部からの攪乱に対する頑健性や、ある特定の生物が環境のニッチに占めるための特性を得るために長い進化の過程において獲得してきたものと思われる。その結果、このようなネットワークはランダムなものではなく、頑健性とエラー耐性を持つスケールフリー・ネットワークになったのだろう。また、ここで検討したすべての生物でネットワークの直径は同じであり、これも進化の過程で保存されたものなのだろう。もし直径がもっと大きいと内的エラーや外的変化に効率よく対応できず、生存に不利だったのかもしれない。また、スケールフリー・ネットワークは他の細胞内ネットワーク(例えば、アポトーシスや細胞周期ネットワーク)に普遍的に存在するものだろうか?現時点では代謝以外のネットワークは分かっている頂点数や枝の数がまだ小さいので、本研究のように数学的ツールで統計学的に解析するのは難しい。しかし、代謝経路以外の細胞内ネットワークでも結合性の分布がベキ法則に従うことが予想され、上記のようなスケールフリー・ネットワークになっている可能性を今後検討したい。
[PR]
# by md345797 | 2014-06-08 17:23

複雑ネットワークの理論(3) エラーに対する耐性と攻撃に対する脆弱性

Error and attack tolerance of complex networks.

Albert R, Jeong H, Barabasi AL.

Nature. 2000 Jul 27;406(6794):378-82

【まとめ】
多くの複雑ネットワークは、ネットワーク内にランダムに起こるエラーに対して驚くべき耐性を持っている。例えば細胞は内部のさまざまな変化が起きても、成長し繁殖することができる。これは代謝ネットワークの根底にある頑健性(robustness)というエラー耐性があるためだろう。社会的なコミュニケーションネットワーク、すなわちインターネットやWorld-Wide Webにも驚くべきエラー耐性があり、部分的な異常を定期的に起こしてもそれがネットワーク全体の情報伝達能力に影響することはほとんどない。このような複雑ネットワークの安定性はネットワークに内在する冗長な結合によるものであるが、エラー耐性はすべての冗長なシステムに見られるのではなく、スケールフリー・ネットワークと呼ばれる、枝が非常に多い少数の頂点を持つ不均質なネットワークでのみ見られることを示す。このネットワークはしかし、枝の多い頂点を狙った攻撃を受けると、ネットワークの結合性を維持することが決定的にできなくなることがある。すなわち、スケールフリー・ネットワークにおいては、高いエラー耐性を示すことは同時に、攻撃に対しては非常に脆弱であることでもある。現実の社会的、生物学的ネットワークの多くはスケールフリー・ネットワークであり、エラー耐性と攻撃に対する脆弱性という2つの普遍的な性質を示すものと考えられる。

【論文内容】
(1) 指数関数的ネットワークとスケールフリー・ネットワーク
大きなネットワークの形すなわちトポロジーのデータが集まるようになり、近年それらのネットワークの普遍的な構造や成長過程についての理解が急速に進んでいる。今までに分かっている複雑ネットワークの形は、連結性の分布(注1)に基づいて大きく2つのグループに分類できる。
注1:頂点から出る枝の数kの確率P(k)が示す確率分布。

第一のネットワークのグループは、P(k)がkの平均値〈k〉でピークを持ち、kが大きくまたは小さくなるP(k)は指数関数的に小さくなるものである。これを指数関数的(exponential)なネットワークと呼ぶ。このようなネットワークの例は、エルデシュが提唱したランダムグラフ (Erdös–Rényi (ER) model) とスモールワールドネットワーク (Watts-Strogatz (WS) model)である(注2)。どちらもすべての頂点が平均〈k〉に近い数の枝を持っている、ランダムで均質なネットワークである。
注2:「ランダムネットワーク」というと上記のERモデルのみを指すことがあるため、論文ではERモデルとWSモデルを合わせて「指数関数的ネットワーク」としている。

それに対し、World-Wide Web (WWW)のような大きなネットワークは、第二のグループであるスケールフリー(scale-free)ネットワークと呼ばれる不均質なネットワークに属する。そこではP(k)の分布はベキ法則(power law)、すなわちP(k)~k^-γに従い、特徴的なスケールがない(平均値や分散などの尺度を表す数値が存在しない)。このスケールフリー・ネットワークでは、均質なネットワークでは決して見られない、非常に多くの枝(k≫〈k〉)を持つ頂点、すなわちハブがある程度存在する。
d0194774_0124917.jpg

図1 指数関数的ネットワーク(a)とスケールフリー・ネットワーク(b) どちらも頂点数130、枝数215であるが、ネットワークの形はまるで違う。
a:指数関数的(exponential)ネットワーク。頂点が持つ枝の数の確立P(k)は〈k〉=3.3をピークとして、指数関数的に減少する。その分布がランダムであることから、「均質な」ネットワークと言える。
b:不均質な性質を持つスケールフリー(scale-free)ネットワーク。大多数の頂点は1-2本の枝しか持たないのに、いくつかの頂点は非常に大きい数の枝を持つ(ハブが存在する)。
aもbもネットワーク内で枝の数が最も多い頂点の上位5個を赤で示し、それと1本の枝で連結している頂点を緑で示した。その結果、aでは全体の27%の頂点しか緑色でないなのに、bでは60%もの頂点が緑色である。すなわち、bはaと違って、ハブを介して多くの頂点が連結していることがわかる。この図はネットワーク解析ソフトPajekを用いて作成した。


(2)ネットワークの直径
ネットワークの相互連結性は、そのネットワークにある頂点間の最短経路の距離の平均で表され、これをそのネットワークの平均距離、または直径d(diameter)と呼ぶ。dが小さいネットワークはすべての頂点間の距離が平均して小さいと考えられる(注3)。頂点数が非常に大きいネットワークでも、そのネットワークの直径は意外と小さく、8億以上のドキュメント(頂点)がリンク(枝)でつながっているWWWでは約19、地球上の60億人以上の社会的ネットワークでも約6とされている。
注3:ここでの定義は上記のように、直径d=ネットワークの平均距離。グラフ理論では、すべての2頂点間の距離の「最大のもの」を直径と呼ぶことがある。いずれにしろ、直径が小さいということはその集団は伝達が速いことを示している。

(3) ネットワークのエラーとそれに対する耐性
ここで、同じ頂点数、同じ枝数を持つ指数関数的ネットワークとスケール・フリーネットワークのエラー耐性について検討する。ネットワークの「エラー」とは、あるネットワーク内の頂点がランダムに機能不全になって、ネットワークから除外される(消失する)ことを指す。頂点が除外されると、その頂点を介する経路がなくってしまうことになるので、残った頂点間の平均直径は一般に増加する。すなわち、dが増加し、ネットワークの相互連結性は減少すると考えられる。ここで、消失する頂点の割合をfとし、頂点が徐々に消失していったときの、fに対するネットワークの直径dの変化について検討した。

図2aのように指数関数的ネットワーク(E)では、消失する頂点の割合fが増えるとネットワークの直径dは一定の割合で増加した(図2aの青い△)。頂点は別の頂点を介して連結をもっているにもかかわらず、頂点が消失していくと、残った頂点どうしが互いの交通を維持するのは徐々に困難になる、ということである。指数関数的ネットワークでは、すべての頂点がほぼ平均した数の枝をもっているので、それぞれの枝がネットワークの直径に及ぼす影響は同じと言える。そのため、どの頂点が除かれても、ネットワークに与える障害の程度は同じになる。

それに対し、スケールフリー・ネットワーク(SF)は、点の消失に対するdの変化は全く異なっていた。すなわち、頂点がランダムに消失していっても、ネットワークの直径dは変わらなかった(図2aの青い□)。5%の頂点が消失しても、ネットワークに残った頂点どうしの交通には影響が見られない。スケールフリー・ネットワークのの連結は、ベキ法則に従う分布のため、ごく少ない枝しか持たない頂点が大多数を占めており、ランダムに頂点が消失する場合このような「小さい」頂点が消失する確率が大きいので、残った頂点間の経路に与える影響はほとんどなく、ネットワーク全体のトポロジーは全く変わらないといってもよい。
d0194774_0145870.jpg

図2 ネットワークの頂点が除外されたときのネットワーク全体の結合性
全体のfの割合の頂点がランダムに除外された場合、ネットワークの平均距離(直径d)がどのように変化するかを、指数関数的ネットワーク(E)とスケールフリー・ネットワーク(SF)で比較した。2つのネットワークはどちらも10,000個の頂点と20,000本の枝からなっている。
a:除外される頂点の割合fを横軸に、そのときのネットワークの直径dを縦軸に示した。すなわち、ネットワーク内部のエラーが全体の相互連結性にどう影響するかを示す。青色は、ネットワークから頂点がランダムに除外される「ネットワークにエラーが起きている状態」を表している。指数関数的ネットワーク(青い△)ではfが増加するとdも直線的に増加するが、スケールフリー・ネットワーク(青い□)ではfが増加してもdは変わらない。
赤色は、すべての頂点のうち「枝の多い頂点」を故意に狙って攻撃された場合を示している。すなわち、枝の多い順に頂点が除外されていくと、指数関数的ネットワークでは、ランダムに除外された場合と同じようにdが直線的に増加するだけだが(赤い◇)、スケールフリー・ネットワークでは急速にdが増加する(赤い○)。これは、スケールフリー・ネットワークはハブを狙った攻撃を受けると急速にネットワークの相互連結性が低下することを示している。
b、c:インターネット(b)やWWW(c)がランダムなエラーまたはハブを狙った攻撃を受けた時の、頂点の消失の割合fとネットワークの直径dの関係。ランダムなエラーの場合は直径は変わらないが、攻撃を受けたときは急速にdが増加する(相互連結性が低下する)。すなわち、インターネットもWWWも、エラー耐性と同時に攻撃に対する脆弱性を示す。


(4)ネットワークへの攻撃とそれに対する脆弱性
次に、ネットワークに故意に障害を与えようとする情報に通じた外部者(informed agent)がいるとする。そういう外部者は、どこでもいいからランダムに頂点を攻撃するのではなく、わざと枝の多い頂点(ハブ)を狙って攻撃してくるだろう。この状況をシミュレーションするため、枝の数が最も多い頂点をまず取り除き、それから枝の数kが大きい順に頂点を除外していくことにした。このように外部からの故意の「攻撃」を受けた場合、指数関数的ネットワークではランダムに頂点が消失した場合と同じようなdの増加しか見られなかった(図2aの赤い◇)。一方、スケールフリー・ネットワークでは最も枝の数が多い頂点が除外されると、ネットワークの直径dは急速に増加し、5%の頂点が枝の数順に除外されるとdは2倍に増加した。dの増加は、残った頂点間の交通が少なくなり、ネットワークの相互連結性が低下していることを表す。すなわち、スケールフリー・ネットワークはハブを狙った攻撃に対しては脆弱なのであり、この脆弱性は、ネットワークの結合が少数の枝の多い頂点によって維持されている(図1b)というまさにその本質的な性質によるものである。

(5) 2つのネットワークにおける、エラーと攻撃に対するクラスター断片化反応
頂点がネットワークから除外されると、その頂点が持つ枝も消失するため、その枝によって連結されていたクラスターがばらばらに断片化するかもしれない。ここでは、ネットワークにおけるエラーと攻撃の被害をより深く理解するため、このクラスター断片化の過程について検討する。

・ここでも、頂点がエラーまたは攻撃によって除外される割合をfとする。また、ネットワークの中で最大のクラスターの大きさ(ネットワーク全体の頂点数に対するクラスターに含まれる頂点数の割合)をSとする。fが0のときは、「ネットワーク全体が1つのクラスター」であるからS=1である。そして、クラスターがまったく存在しなくなったときがS=0である。さらに、メインのクラスター以外のすべてのクラスターの平均サイズ(含まれる頂点の数)を〈s〉で表す。Sは頂点総数に対する割合なので0~1、〈s〉はクラスターのサイズ(頂点の個数)なので1以上の数値を取る。Sと〈s〉では意味合いが違うが、図3では同じ縦軸で表しているので注意。

・さて、指数関数的ネットワークでランダムな頂点の除外(エラー)が起きると、fがある閾値(fc=0.28)を超えて大きくなったときに、メインのクラスターは完全に断片化し、Sはほぼ0となった(図3aの青い□)。その過程で、メインのクラスター以外のすべてのクラスターの平均サイズ s は、fが閾値fcに近づくにつれて急速に増加して2に近づき、その後1まで減少した(図3aの青い■)。すなわち、fが小さいときは頂点が一つ一つ除外されても、メインクラスター以外のクラスターの平均サイズ s はほぼ1である。このネットワークにはもともとあまりクラスターがなく、頂点数1のクラスターすなわちクラスターを作らない単独の頂点が非常に多いと考えられる。ここで、fが増加してくると、最大のクラスターの断片化が大きくなる。fが閾値fcになると最大のクラスターはばらばらの断片となる(Sはほぼ0)。残ったクラスターの大きさ s はこのときにピークとなる(2個程度でクラスターを作っている頂点の割合が多くなる)。さらに頂点が除外され続けてfが閾値fcよりも大きくなると、残ったそれぞれのクラスターも断片化してしまい、 s は1まで減少する。

・しかし、スケールフリー・ネットワークでランダムに頂点が除外されたエラーの場合のネットワークの振る舞いは、それとは異なっていた(図3b)。まず、fが大きくなってくると、最大のクラスターのサイズSは徐々に減少する。しかし、fが大きくなっても s はほぼ1で一定であり、ネットワークから一つ一つ頂点が除外されていっても、メインクラスター以外にはほとんど影響がないことが分かる。(ハブによって強く連結しているメインクラスターが非常に大きく、それ以外は頂点数1の断片がわずかに存在するためであろう。) 指数関数的ネットワークはfが大きくなるとある閾値fcにおいて破局的な断片化を起こすのに対して、スケールフリー・ネットワークはfが大きくなってもメインのクラスターを十分維持することができる(図3bの青い□)。ここでは頂点の除外はランダムに起こるため、ハブとなる頂点が直撃を受ける確率は非常に低い。そのため、メインのクラスターが完全に収縮するまでは、ネットワーク全体は断片化されないだろう。このように、スケールフリー・ネットワークは、ランダムなエラーに対するトポロジーの安定性が、指数関数的ネットワークに比べるとはるかに優れているということができる。

・次に、2つのネットワークが「枝の数が多い頂点」を選んで枝の多い順に攻撃された場合を示す。指数関数ネットワークが攻撃を受けた場合のネットワークの断片化反応(図3aの赤い○と●)と、スケールフリー・ネットワーク攻撃を受けた場合の反応(図3bの赤い○と●)はほぼ同じである。スケールフリー・ネットワークの方がより速やかに断片化してしまうともいえる。なぜなら、メインのクラスターが完全に断片化されてしまうfの閾値fcが、指数関数的ネットワークの0.28に比べると0.18とより小さいためである。

注4:論文では、上記のようなネットワークの振る舞いはパーコレーション理論に相当すると考えている。「指数関数的ネットワークは、パーコレーション理論における無限次元のパーコレーションに相当し、上記で見られた閾値のある振る舞いはパーコレーションの臨界点に相当すると考えられる。(注:「無秩序から突然秩序が形成される相転移」の逆のようなものか?) また、スケールフリー・ネットワークは、パーコレーション理論において臨界点が極限まで遅延した状態ということができるだろう」との記述がある。
d0194774_0163622.jpg

図3:ネットワークにおけるエラーまたは攻撃に対するネットワークの断片化
図2のネットワークにおいて、最大のクラスターの大きさS(○または□で表す)、その他のクラスターの平均サイズ〈s〉(●または■で表す)を、頂点が消失する割合fの関数として示している。
a:指数関数的ネットワーク(E)において、ランダムなエラーが起きた場合(□または■)または枝の多い頂点を狙った攻撃を受けた場合(○または●)のネットワークの断片化。
b:スケールフリー・ネットワーク(SF)において、ランダムなエラーが起きた場合(青い■)または枝の多い頂点を狙った攻撃を受けた場合(赤い●)のネットワークの断片化を示す。bの右上の小さいグラフは、スケールフリー・ネットワークにおいてfが0から1まで変化するときの、大きいグラフで示されたさらに先の「エラー耐性」を示す曲線である。すべての頂点がほぼ除外されるまで(f=1)、最大のクラスターはばらばらにならないことを示す。

スケールフリー・ネットワークでは、起こりえないくらいの高率のエラー(f_max=0.75、頂点のほぼ3/4がランダムに除外された場合)であっても〈s〉(青い■)のピークは非常に小さい(bの大きい方のグラフでf=0.75であっても〈s〉は1.06程度)。aもbも、頂点の数を1,000、5,000、20,000として解析を繰り返したが、Sと〈s〉が示す曲線はオーバーラップするものであった。したがって、ネットワークの大きさ(頂点の数)に関わらず、エラーが起きたときまたは攻撃を受けたときのネットワークの振る舞いは同じであると言える。

c、d:インターネット(c)とWWW (d)における、エラーや攻撃による断片化を示す。用いられる記号はbと同じだが、dは〈s〉の用いられているスケール(右縦軸)が違うので注意。dでは、攻撃を受けた際、fが小さいときにはメイン以外のクラスターの平均サイズ〈s〉はほぼ1.5(赤い●)であるが、fが大きくなるとfc=0.067を閾値として〈s〉は急速に増大し最大60にまで達して、さらにその後急速に減少することを示している。
インターネットとWWWは、ベキ指数γや頂点からの枝の数の平均〈k〉、クラスター係数が異なるのに、エラーや攻撃に対する反応は同じである。bのスケールフリー・ネットワークとインターネットとWWWの間で、閾値fcの値およびd、S、〈s〉の規模は異なるものの、エラーや攻撃に対する反応は同様であった。


(6) インターネットとWWWのエラー耐性と攻撃に対する脆弱性
現実のネットワークでは、エラーや攻撃がもたらす影響についてはほとんど分かっていないのが現状である。そこでインターネットとWWWという2つのネットワークのエラーおよび攻撃に対する耐性について検討した。(なお、「インターネット」はコンピュータの相互連結によるネットワークのことであり、「WWW」はインターネットを利用して提供される、複数のドキュメントを結びつけるサービスのことをいう。)

インターネットはスケールフリー・ネットワークであり、その連結の分布はベキ法則に従ってP(k)~k^-2.48であることが分かっている(Faloutsos M, 1999)。そこで、上記の結果予想されるインターネットのエラー耐性と攻撃に対する脆弱性を検討した。その結果、インタ―ネットでは、頂点の2.5%までがランダムに除外されてもネットワークの直径dは変わらない(エラー耐性がある)が、もっともリンクの多い頂点が除外されたとき(インターネットのハブが攻撃された場合)は、dが3倍以上に増加することが分かった(図2b)。すなわち、エラー耐性と同時に、攻撃に対する脆弱性が見られる。クラスターの断片化に関しても、ランダムな頂点の除外が増えた場合も大きなクラスターは維持されるのに対し、リンクの多い頂点が除外された場合はfが0.03という小さい値でネットワークは臨界点を示し、ばらばらになったクラスターのサイズの急速な増加が見られた(図3c)。

WWWはドキュメントを頂点とし、URLハイパーリンクを枝とする巨大な有向グラフ(それぞれの枝が頂点から頂点へと向きがあるグラフ)である。WWWもスケールフリー・ネットワークであり、ドキュメントから出る枝の数と入ってくる枝の数はべキ法則P(k)~k ^-γ に従っている。P_in(k)のγ_inは2.1、P_out(k)のγ_inは2.45であることが分かっている。WWWの完全なトポロジー地図は得られていないので、ここでは325,729の頂点と1,469,680の枝のwebのサブセット(Albert R, et al. Nature 1999.)を用いた検討を行った。その結果、ランダムに頂点が除外されてもdはほぼ一定であったが、ハブを狙った攻撃を受けた場合はdが大きく増加した(図2c)。また、高率でエラーが起きてもネットワークは大きなクラスターとして維持されるが、攻撃を受けた場合はfc=0.067を閾値としてクラスターのサイズが急激に増加、すなわちネットワークは急速に断片化した(図3d)。

(7) 結果のまとめ
指数関数的ネットワークとスケールフリー・ネットワークで、それぞれランダムなエラーが起きた場合と枝の多い頂点を狙った攻撃を受けた場合のクラスター断片化反応を図4にまとめた。スケールフリー・ネットワークでエラーが起きた場合(図の下側)は、クラスター断片化がほとんど起こらず、指数関数的ネットワークと比較すると「エラー耐性が強い」と考えられる。また、指数関数的ネットワークでのエラーと攻撃、スケールフリー・ネットワークでの攻撃に対しては、同じような急速なクラスター断片化が起こる(図の上側)。すなわち、スケールフリー・ネットワークの「攻撃に対する脆弱性」が理解できる。
d0194774_0175284.jpg

図4:2種類のネットワークにエラーが起きたとき、またはネットワークに対する攻撃を受けたときのクラスター断片化反応のまとめ

a–fは、図2で示したネットワークがランダムなエラー(a-c)または枝の多い頂点を狙った攻撃(d-f)によって頂点が除外されるとき、除外される頂点の割合fの値(0.05、0.18、0.45)によってどのくらいの大きさのクラスターがどれくらいの割合で存在するかを示すグラフである。グラフは、横軸が出現するクラスターのサイズ(クラスターに含まれる頂点の数)、縦軸がそのクラスターの数(全体の数に占める割合)を示している。○はクラスター断片化の模式図。

上側の図は指数関数的ネットワークでエラーが生じたときおよび攻撃を受けたときと、スケールフリー・ネットワークが攻撃を受けたときの反応が同じであることを示す。fが小さいときは(a)、異なるサイズのクラスターが出現し、その中にはまだ大きいクラスターも残っている。クラスターの断片化したサイズは1から16の間に分布しているが、大きいクラスターでサイズが9,000のものもある(当初のネットワーク全体の頂点の数は10,000)。(b)では、閾値fcにおいてネットワークはサイズが1から100の小さい断片に分解され、大きいクラスターが消失することを示している。fがさらに大きい場合でも、クラスターは頂点数が1か2という小さい断片になるまで分解される。

一方、下側の図は、スケールフリー・ネットワークでランダムなエラーが起きた場合に上側とは異なる反応を示すことを表している。fが増加しても、最大のクラスターのサイズはゆっくり減少し、少しずつ小さいクラスターに分解されるのみである。実際、(d)で見られるように、f=0.05では、クラスターが分解されていると言っても単に1-2個の頂点が出現しているだけである。f=0.18では攻撃を受けたクラスターは断片化しているが、頂点数8,000の大きいクラスター1つと頂点数1から5のクラスターがいくつか見られるのみである(e)。非現実的なくらい高度のエラーが起きても(f=0.45)、大きいクラスターは存在し続け、断片化されたクラスターの頂点数も平均で11を超えない程度の小さいものである(f)。


スケールフリー・ネットワークがエラー耐性を持つことは、同時に、攻撃に対する脆弱性を持つことにも直結する。すなわち、非常に多くの枝が集まる頂点があるからこそエラー耐性があるのだが、今度はそのような頂点を狙った攻撃を受けると、たちまちネットワークの直径が増加し、クラスターが断片化する。攻撃に対する脆弱性はインターネットやWWWといったコミュニケーションネットワークにとっては脅威になるものだが、ネットワークに本質的に内在する不均一な性質自体が攻撃に対する脆弱性をもたらしているのだから、その対策は今後詳しく検討されるべきであろう。
[PR]
# by md345797 | 2014-06-06 00:21

複雑ネットワークの理論(2) スケールフリー・ネットワークの提唱

Emergence of scaling in random networks.

Barabási AL, Albert R.

Science. 1999 Oct 15;286(5439):509-12.

【背景】
複雑ネットワークを考えるときに、1998年に提唱されたスモールワールド・ネットワーク (ワッツ・ストロガッツモデル)は画期的なものだった。しかし、現実のネットワークにはハブ(枝の数が非常に大きい頂点)が存在し、これはスモールワールド・ネットワークでは説明できない。このことに直面したノートルダム大学のアルバート・ラズロ・バラバシは、それまでのネットワークモデルにおけるランダムな世界観を捨てて、新しいモデルの構築を目指した。
d0194774_146426.jpg
Albert-László Barabási (1967-) 以下の背景の多くは、バラバシの著書『新ネットワーク思考―世界のしくみを読み解く』(青木薫訳、NHK出版)によっている。







① 「ハブ」の存在
現実社会の友人ネットワークについて考えてみると、大多数の人は友人の数は数名だが、「友人の数がずば抜けて多い」人物が何人かはいる。これはウェブでも同様で、全ドキュメント(1999年で10億以上と言われる)の90%以上はリンクされる数は10以下であるが、ごく少数のページは100万近くリンクされている。後者はネットワーク上では「ずば抜けて枝の多い頂点」であり、ハブと呼ばれる。このハブは現実に存在するにもかかわらず、エルデシュのランダムネットワークでやワッツ・ストロガッツのスモールワールド・ネットワークでは生じない。では、ハブが生じるネットワークとはどのようなものなのか?

② ベキ法則
1900年代、イタリアの経済学者ヴィルフレード・パレートは、「収入分布は“ベキ法則”にしたがう」ことを発見。これは「世の中にはごく一握りのきわめて収入の多い人たちがおり、人口の大多数はわずかな収入しかない」ということを表す法則であり、後にパレートの法則とか「80対20の法則」などと呼ばれた(世の中のお金の80%は人口の20%の人という一握りの人たちが持っており、お金の20%はその他大勢の80%が持っている、ということ)。

これをネットワークでは、頂点の枝の数の度数分布として考える。枝の数がkである頂点の数をN(k)とし、全頂点についてkを横軸、Nの頻度を縦軸にプロットする。その結果は下記の式のようになる。
d0194774_153618.png

これは、一般的には
d0194774_1373621.png

で表される「ベキ法則 (power law)」に従うプロットとなる。(aは定数、kはスケーリング指数と呼ばれる定数で、ここではマイナスの値になる。「ベキ法則」は、べき乗則、ベキ則などとも訳される。ベキ(冪)乗は今では累乗と同じことだが、もともとは累乗と混同されて用いられ始めた用語らしい。「冪」の字は当用数字に含まれないため「ベキ」のように書かれる。)
d0194774_1385965.jpg
(ベキ法則に従うグラフ)

一般的なベキ法則の式の両辺の対数をとると、
d0194774_1382366.png

は、
d0194774_1383737.png

のように表される。

ここでは、「枝の数がk本である頂点の数N(k)が、k^-γ(kの-γ乗)で表される関係」を示す。N(k)=k^-γの両辺の対数を取ると、log N = -γ log kとなり、両対数グラフ(x軸がlog k、y軸がlog N)にプロットすると-γの傾きを持つ直線として表される。
d0194774_1524163.png
(ベキ法則のグラフを両対数プロットで表したもの)

③ スケールフリー・ネットワーク
ベキ法則は、正規分布(釣鐘型の分布)とは違って、①どこにもピークがなく、なめらかに減少する、②分布のすそ野は正規分布よりも広い、③ごく少数のきわめて大きい事象と無数の小さい事象が共存する状態を表すなどの特徴を持つ。バラバシは、枝の数と頂点の数がベキ法則に分布をスケールフリー・ネットワークと呼んだ。

スケールフリー・ネットワークはグラフで見ると分かるように、「平均的な数」の枝をもつ頂点というものは存在しない。枝の数には、なめらかに減少するヒエラルキーがあるのみである(これは「ロングテール」とも呼ばれる)。この分布は、ある枝の数を持つ頂点数に平均や分散などの尺度(スケール)が存在しないので「スケール」「フリー」と名付けられた。

下の図は、『新ネットワーク思考―世界のしくみを読み解く』(アルバート・ラズロ・バラバシ、 青木薫訳)より改変引用させていただいた。左は従来考えられていたランダムネットワークで、k本の枝を持つ頂点の数N(k)は確率的に分布するため、正規分布に従っている。ここでは、ずば抜けて多くの枝を持つ頂点が存在する確率はきわめて低い(存在しない)。右はスケールフリー・ネットワークで、k本の枝を持つ頂点の数はベキ法則に従う。大多数の頂点はごく少ない数の枝しか持たないが、一部のごく少数の頂点は莫大な多さの頂点を持つことを表している。それぞれの下に例として、都市をつなぐ高速道路網(ランダムネットワーク)と、空港をつなぐ航空経路網(スケールフリー・ネットワーク)が示されている、左では高速道路がものすごく多数集中する都市などというものは存在しないが、右では航空便が非常に多く集まる空港(ハブ空港)がいくつか存在している。このようにスケールフリー・ネットワークはランダムネットワークとは全く異なるネットワークである。
d0194774_2161124.jpg

(そもそも、確率に支配されるようなランダム・無秩序な事象は正規分布に従うとされる。一方、そこから秩序が生まれると(秩序の創発、相転移とも呼ばれる)、ベキ法則に従うようになると言われる。したがって、現実のネットワークは、全く無秩序な状態ではなく、秩序が創発した、ちょうど相転移を起こしたような状態でありベキ法則に従うことが多いとされる。なぜ、相転移でベキ法則が出現するかは、1971年にケネス・ウィルソンによる「繰り込み群」理論で証明されている。)

④ 「ネットワークの成長」と「ハブの優先的選択」
ランダムモデルは、(a)頂点は最初からすべて存在し、頂点数は一定という仮説の上に成り立っていた。(b)すべての頂点は対等という仮定もあり、互いに区別できないからこそランダムにリンクできたといえる。しかし、現実に存在するネットワークでは(a)(b)のような仮定は成り立たない。

現実のネットワークは、(1)頂点は1つ1つ増えていく(ネットワークは成長する)。(2)すでに多くのリンクを獲得している頂点(ハブ)は、新しくできた頂点から高い確率でリンクされる(ハブは優先的に選択される)、という2つの特徴を示す。バラバシは、この(1)と(2)の特徴を両方組み込むと、ネットワークはスケールフリーになることを以下の論文で示している。

ここに来て、古典的なモデル(ランダムグラフやスモールワールド・ネットワーク)は「静的」(↔成長する)で、「ランダム性の仮定の上に成立」(↔優先的選択)していたことに初めて気づいたわけである。


【論文内容】
遺伝的ネットワークやWorld Wide Web (WWW)のような複雑ネットワークは、頂点どうしがスケールフリーベキ法則に従う分布によって連結しているというモデルを初めて提唱する。複雑ネットワークは、①新しい頂点を追加していくことによってネットワークが成長する(growth)、②新しい頂点はもともと枝が多かった頂点に優先的に接続される(preferential attachment)という2つの普遍的な特徴を持っている。この2つの特徴を持つモデルは、さらにスケールフリーの分布を再生産して自己組織化することを述べる。

まず、映画俳優の共演ネットワークを社会的ネットワークのモデルとして用いて検討した。各俳優が頂点であり、2人の俳優が同じ映画で共演したとき枝によって連結されると考える(この例では頂点数212,250、平均枝数28.78だった)。ある俳優がkの枝を持つ確率P(k)はほぼkの-γ乗というベキ法則で表され、γの値は2.3±0.1であった(図1A)。次に複雑なネットワークであるWWWで、ドキュメントとリンクを頂点と枝と考えた(頂点数325,729、平均枝数5.46)。ここでもP(k)~k^-γであり、γは2.1±0.1だった(図1B)。さらにアメリカ西部の電力供給網で、発電所・変電所を頂点、高圧送電線を枝と考えた(頂点数は4941と少ない、平均枝数2.67)。ここでも同様にP(k)~k^-γであり、γはほぼ4だった(図1C)。そのほかにも図に示していないが、論文を頂点、引用回数を枝とした場合もベキ法則に従い、γは3だった。以上より、これらの大きな社会的ネットワークでは、頂点が、γ=2.1から4程度のベキ法則にしたがうk本の枝数を持つことが明らかになった。
d0194774_1541918.jpg

図1:現実のネットワークで、ある頂点が枝の数kを持つ確率P(k)を両対数プロットで表したもの。A:映画俳優の共演関係、B:WWW、C:電力供給網の例。いずれも、両対数プロットによって傾きがマイナスの直線(ベキ法則)で近似される。

従来のランダムグラフモデル(エルデシュ=レイニィモデル)では、N個の頂点がお互い枝で連結される確率をpとしたとき、ある頂点がk本の枝を持つ確率P(k)はポアソン分布に従っていた。次に、スモールワールド・ネットワーク (ワッツ・ストロガッツモデル)では、N個の頂点を規則的に結合している枝をpの確率でランダムにつなぎかえたところ、頂点間の距離が減少してスモールワールド現象が生じた。しかし、これら2つのモデルでは、kが非常に大きい頂点(ハブ)が出現する確率は指数関数的に減少し、事実上ハブは出現しない。しかし、前述のベキ法則にしたがう分布では、kが非常に大きい頂点(ハブ)が高い確率で存在することになる。このようにハブが出現するためのネットワークの特徴とは何であろうか?

現実のネットワークには、次のような2つの普遍的な特徴がある。第一の特徴は「成長」(growth)である。ランダムグラフもスモールワールド・ネットワークも、頂点数が一定で固定されていた。しかし、現実のネットワークには新しい頂点が追加され、頂点の数はネットワークの成長とともに増加するのが普通である。例えば、映画俳優の共演ネットワークには新しい俳優が出現し、WWWにも新しいウェブページが作られ、論文の引用でも新しい論文が常に発表されている。第二の特徴は「優先的選択」(preferential attachment)である。従来のモデルは2つの頂点が連結する確率は、ランダムかつ一様であった。しかし、現実のネットワークでは選択的な連結が見られるのである。例えば、新しい俳優は、すでによく知られた出演の多い有名俳優が出ている映画に出演しやすい。これは、もともと他の俳優との共演回数が多い俳優は出演も多いため、新しい俳優はその有名俳優と共演しやすくなるためである。同じように新しく作られたウェブページはすでによく知られたリンクの多いページにリンクすることが多いし、新しい論文はそれまで多く引用されてきたすでによく知られた論文を引用することが多い。すなわち、新しい頂点がすでにある頂点に連結する確率は、一様ではない。枝の少ない頂点よりも、すでに多くの枝をもつ頂点の方に連結する確率の方が高いのである。

次に「成長」と「優先的選択」という2つの特徴を持つモデルを考えた。まず、ネットワークの成長という特徴を、少数(m_0個)の頂点から始まり、時間ごとに新しくm本の枝を持つ頂点が1個ずつ付け加わるとする(このときm≦m_0と仮定)。そして、頂点iに新しい頂点が連結する確率Πは、その頂点がもともと多くの枝を持つときに高くなるようにする。これを頂点iの結合性と呼び、Π(ki)=ki/∑j kj の式で表されることにする。この式は、もともとのki(頂点iが持っている枝の数)を他の頂点の枝数の合計で割ったもので、もともとの枝が多い頂点は新しい頂点が連結する確率Π(ki)が高いことを表している。時間がtステップたつと、このモデルは(m_0+t)個の頂点とmt本の枝というランダムネットワークが付け加わる。その結果、このネットワークは図2Aのように、頂点がk本の枝を持つ確率が「γ=2.9±0.1のベキ法則」に従うスケールフリー・ネットワークとなった。ここではランダムネットワークからベキ法則が生じている(論文タイトルにある「ランダムネットワークからのベキ法則(という新たなスケール)の創発」)。このネットワークは、頂点がk本の枝を持つ確率P(k)は、ネットワークの成長に伴う時間tとは独立している(そのため全頂点の個数(m0+t)=すなわちネットワークのサイズからも独立している)ため、持続的に成長するにもかかわらず、スケールフリーの状態を維持しているという特徴を示す。
d0194774_1555921.jpg

図2A:「成長」と「優先的選択」という2つの特徴が持つネットワークでは、ある頂点の枝の数がkである確率p(k)はベキ法則に従う。最初は5個の頂点(m0=5)から始まり、時間ごとに5個(m=5)ずつ頂点が増え、それはもともとある枝の多い頂点を優先的に選択して連結するネットワークを作成した(本文参照)。時間がt=150,000(○)からt=200,000(□)のP(k)の分布を示したところ、kのベキ法則に従っていた。X軸、Y軸とも両対数でプロットしているので、log kとlog P(k)は傾きが-γの直線で示され、ここではγ=2.9である。
B:「成長」だけあって「優先的選択」がないネットワーク。時間当たりm本の枝を持つ頂点が1つずつ増える。この時、mが大きくなると直線の傾きが小さくなるが(○m=1, □m=3, ◇m=5, △m=7)、いずれもベキ法則には従わない(x軸のkが対数ではないことに注意)。
C:ハブの生成。時刻t_1=5(上の点の集団)と、t_2=95(下の点の集団)において付け加わった2つの頂点が時間とともに枝を獲得していく様子。ki(t)はその時刻に持っている枝の数を表す。古くからある(tが小さい、ここでは5)頂点は、新しく付け加わった頂点(tが大きい、ここでは95)に比べ、格段に(kiは対数で示されているのに注意)多くの枝を持つ(すなわちハブとなる)ことが分かる。


上記のように、ネットワークに「成長」と「優先的選択」という2つの条件を与えるとベキ法則のスケールが出現するが、この2つの条件はどちらも必要なのだろうか?モデルAとして「成長」するが「優先的選択」はない(新しくできた頂点は他の頂点に同じ確率で連結する)ネットワークを仮定した。そこではΠ(k)=(定数)=1/(m0+t-1)である。図2Bがそのようなモデルを表すが、そこではベキ法則が成り立たず(x軸が対数ではないことに注意)、スケールフリーの特徴は見られない。また、モデルBとして、初めにN個の頂点があるが枝がないグラフを想定する。そこでランダムな頂点を選び、それをΠ(ki)=ki/∑j kjの確率で頂点iに連結させる。このモデルは当初はベキ法則に従うが、P(k)は一定である。なぜなら、Nが一定で(=成長しないで)枝の数だけが時間とともに増加する場合、時間がNの2乗に漸近的に等しくなるとその後はすべての頂点が連結された状態に到達してしまうためである。このように、モデルAもモデルBもベキ法則にはならないことから、スケールフリー・ネットワークの生成には「成長」と「優先的選択」の両方が必要と考えられる。

新しく出現した頂点は「優先的選択」すなわち、もともと枝の多い頂点に高い確率で連結するため、ネットワークが成長するにつれて2頂点間の結合性は当初に比べてどんどん大きくなっていく。頂点が新しい枝を得る割合は、∂ki/∂t = ki/2tであるため、 ki(t) = m(t/ti)^0.5で示される。ここではtiはネットワークが始まってから頂点iがネットワークに追加されるまでの時間である(図2C)。ここでは、新しく追加された頂点(tiが大きい)から古くからある(tiが小さい)頂点へ連結する可能性が高いので、古くからある頂点のいくつかは非常に多く枝をもつことになる。これは、現実社会でよく見られる「金持ちはより金持ちになる(rich-get-richer)」という現象と同じである。ここで、ある頂点がk本の枝を持つ確率P(k)は、kの-3乗に比例するベキ法則で示され、このγ=3というのは頂点ごとに追加される枝の数mには独立して決められる。すなわち、
d0194774_21367.png
現実のネットワークでは、γは2.1から4の間だったが、これは優先的選択の程度によって調節される。なお、ネットワークには頂点数が増える「成長」ではなく、すでにある頂点間の枝が増える(または減る)というタイプの成長もある。その場合もγの調節は必要だが、同じ くスケールスケールフリーになる。

【結論】
現実の複雑ネットワークでは「成長」と「優先的選択」という2つの特徴が共通して見られ、それらによって複雑ネットワークには普遍的に「スケールフリー」性が出現する。これは生物学的なシステムにおける遺伝的ネットワークやシグナル伝達ネットワークにも応用可能だろう。ただし、遺伝的ネットワークでは頂点が遺伝的にコードされたものであるため、「成長」する開かれたネットワークではないかもしれない。しかし、単純な分子から複雑な生命が形成される進化の過程ではネットワークの成長が起きているとも考えられ、遺伝的ネットワークについても今後スケールフリー・ネットワーク的な理解が可能になるかもしれない。
[PR]
# by md345797 | 2014-06-03 01:22

複雑ネットワークの理論(1) 「スモールワールド」ネットワークの集合的ダイナミクス

Collective dynamics of 'small-world' networks.

Watts DJ, Strogatz SH.

Nature. 1998 Jun 4;393(6684):440-2.

【背景】
複雑なネットワークに関する重要論文をいくつか読みながら、代謝や疾患のネットワーク的な解明のために必要な概念の理解を目指す。ここではまず背景となる研究の流れを理解し、次に1998年のワッツ・ストロガッツ論文を読む。

① グラフ理論
グラフとはいくつかの点とそれらを結ぶ線からできている図のことで、これを研究する数学の分野をグラフ理論という。点は頂点(vertex、または結節点node)、それらを結ぶ線は枝(edge、または辺、リンクlink)と呼ばれる。ある頂点からある頂点までの最短の行き方(パスpath)のうち、最短のものを2頂点間の距離(distance)といい、グラフのすべての頂点間の距離の平均を平均距離(以下で出てくるcharacteristic path length固有パス長とも)などという。

グラフ理論は、数学者レオンハルト・オイラー「ケーニヒスベルクの7つの橋の問題」を解決したエピソード(1736年)に始まる。その後200年近く進展がなかったが、1960代にフランク・ハラリーらにより近代のグラフ理論が整備された。なお、グラフ理論を初歩から着実に理解するには、『あたらしいグラフ理論入門』小林みどり著、牧野書店)が有用である。

「グラフ理論」は、ある条件を設定して無矛盾な論理を展開するという数学の一分野である。しかし、現実社会や自然界に見られるネットワークではそれらの前提条件が厳密に満たされることは少ない。実際に見られるネットワークは頂点数がきわめて多く、不規則で複雑なネットワークであり、グラフ理論に基づいて不規則で複雑なネットワークを表現し解析する方法が求められるようになってきた。

② ランダムグラフ
現実に見られるネットワークは、グラフ理論にもっと乱雑な性質を加えたものであると考えられる。そこで、1959年に数学者ポール・エルデシュがランダムグラフを提唱した。これは、n個の頂点があるときに2頂点間に確率pで枝をおき、確率(1-p)で枝をおかないようにしたもの。確率pが小さいと枝が少なくネットワークが分断され、pが大きいと枝が多くてすぎてネットワークが密になりすぎる。ある程度のpなら、現実のネットワークのように枝の数も中等度(ある程度疎)で乱雑なものとなる。提唱者の名前を取って、Erdős–Rényiグラフ(ERモデル)とも呼ばれる(Erdős P, Rényi A. "On Random Graphs. I.". Publicationes Mathematicae 6:290–297, 1959)。

エルデシュは、「複雑さとはランダムということである」と仮定し、頂点をランダムに結ぶランダムグラフ理論を作った。しかし、現実のネットワークでは、各頂点がそのように平等で、しかも頂点間の連結が全くランダムであるはずがない。エルデシュの目標は、現実のネットワークに応用できる普遍的なモデルを作成することではなく、ランダムグラフ理論の数学的な深さに対する探究だったのかもしれない。では、現実のネットワークはどのように形成されるのだろうか?

③ スモールワールドの発見
現実の社会的ネットワークでは、比較的少数の人を介して誰ともつながれることが知られている。これは、1969年のスタンレー・ミルグラムの実験によって、世界中の人は平均6人の知り合いを介して高度に相互連結している現象として明らかにされた。後に言われる「6次の隔たり」による「小さな世界(small world)」の発見である。これは、n個の頂点が、平均k本の枝を持つネットワークがあると、dステップ離れた頂点はk^d (kのd乗)個ある。Nやkが非常に大きくなっても、k^dはNを超えることはないから、最大でk^d=Nと考えられる。両辺の対数を取ると、ネットワークの平均距離は、d=log N/log kで表される。頂点数Nが世界の人口のように非常に大きくなっても、対数の関係で表されるのでぐっと収縮し、現実のネットワークでは平均距離dは意外と小さくなることが分かる。「ネットワークの平均距離が短い」という点では、格子型のグラフのような規則的なネットワーク(別の頂点に到達するまでの距離は長い)より、エルデシュのランダムグラフの方が現実のネットワークに近いと考えられる。

・なお、6次の隔たりと言っても、現実に「目的の人物まで簡単に到達できる」ということではない。平均の知り合い数(各頂点の枝の数)をkとすると、単純にk^6人の知り合いを全部チェックしないと目的の人には到達できないことになるためである。ただし、この場合も実際にはすべての知り合いをチェックしなくても、近い人を選んでチェックするだろうから、もっと早く到達しうるだろう。「6次」というのはむしろ上限なのかもしれない。

・「世界は小さい(It’s a small world)」というときのネットワーク上の「距離」は、ここでは頂点からの別の頂点まで最短で到達できる枝の数のことであり、今までのユークリッド空間の「距離」とは本質も扱いも大きく異なる。したがって、ネットワークを考える際には、非ユークリッド的世界の新しい幾何学といったものを学ぶ必要があるだろう。(『新ネットワーク思考―世界のしくみを読み解く』 アルバート・ラズロ・バラバシ、 青木薫訳より)

④ ネットワークのクラスター的現実
さて、社会学者マーク・グラノヴェッターは1969年に、「新しい仕事を見つける力になってくれたのは親しい友人ではなく、ちょっとした知り合いであること」を発見した。これは「弱い社会的絆(弱い紐帯)の重要性」として報告され、社会学における重要な知見となった。親しい友人はでは知りうる情報が似ていて役に立たず、一方、単なる知り合いの方が異なる情報を持っているために新しい仕事を見つけるのには有用なことがあるためなのだろう。

ここでまず、「親しい友人」どうしで密に結ばれるネットワークを想定する。それらのネットワークがお互い、「単なる知人どうし」という弱い絆によって結ばれているのが、現実のあり方であることが明らかになった。前者の親しい友人どうしの密なネットワークは、「クラスター」と呼ばれる。現実のネットワークはこのように、全くのランダムな頂点の結びつきではなく、いくつかのクラスターを含むものである。

そこで、当時コーネル大学で応用数学から社会学を研究していたダンカン・ワッツとその指導教官スティーブン・ストロガッツは、このようなクラスター化の程度を定量化することを考え、クラスター係数(clustering coefficient)という量を導入した。例として、自分につながる友人たちがどのくらいクラスター化されているかということを考えるとする。「友人たちの間に実際に存在する枝の数を、生じうる可能な枝の数で割ったもの」を求めると、友人たちがみんな互いに友人どうしであればその数は1になり、友人たちがお互い全然友人でない(自分を介してつながっているだけ)であればその数は0となる。これをネットワーク全体で平均したものを、そのネットワークのクラスター係数と呼んだ。

実際のネットワークの例として、論文の共著関係でクラスター化があるかを実証した。ここでは数学論文のデータベースを用いて、前述のエルデシュと論文の共著者としてどのくらいの数でつながっているのか(エルデシュ数)を測定することもできる。このような論文共著のネットワークを検討したところ、それは①平均距離が小さく(小さい世界であり)、②クラスター性を持つという2つの特徴を満たすことが実証された。
d0194774_2034041.png
Duncan J. Watts (1971-)
現実のネットワークは平均距離が小さく、かつクラスター化されている。全く規則的なグラフではクラスター化はされているが平均距離は大きい。一方、ランダムグラフでは、平均距離は小さいものの、クラスター化されていない。それらの折り合いをつけて、現実のネットワークに近いモデルとして提唱されたのが、後述ののスモールワールド・ネットワークであった。

⑤ なおこの翌年に、さらに動的に成長する現実のネットワークの新しいモデル(スケールフリー・ネットワーク)が提唱されることになる。



【論文内容】
従来、ネットワークの結合の形態は完全に規則的か、完全にランダムかと考えられてきた。しかし、現実の社会的ネットワークや自然界のネットワークはこの両極端の間にあるのではないだろうか。この研究では、完全に規則的と完全にランダムのちょうど中間のネットワークの単純なモデルを提案する。それは、規則的なネットワークを「つなぎかえる(rewire)」ことによりランダムさを増加させるという方法によっている。

以下で提唱するネットワークモデルは、以前「スモールワールド」またの名を「6次の隔たり」と呼ばれた現象との類似性により、「スモールワールド・ネットワーク」と呼ぶことにする。スモールワールド・ネットワークは。線虫(C. elegans)の神経系のネットワーク、米国西部の電力系統、映画俳優の共演関係に共通して認められるものであった。またこのネットワークは、情報の拡散速度や同期性が大きく、感染症はスモールワールド・ネットワークでは規則的なネットワークに比べて速く拡大することが示された。

図1左のように、n個の頂点にそれぞれ枝がk本ある規則的な格子(lattice)グラフがあるとする。この枝をすべて確率pでランダムにつなぎかえる。それにより、p=0で規則的な格子、p=1でランダムなグラフの間を調節することができる。今まで、このpが0と1の間という中間領域についてはほとんどわかっていなかった。
d0194774_394161.gif

図1:ここでは、グラフの頂点と枝の数を変えることなく、規則的なネットワーク(左)からランダムなネットワーク(右)に移行するための、ランダムな枝の「つなぎ替え」を示している。左は、n個の頂点とそれぞれから出るk本の枝で最も近い頂点どうしが結ばれる規則的なグラフである(図では分かりやすくするため、n=20、k=4としているが、後述の実際のネットワークではnもkも非常に多い)。真ん中は、これらの枝を確率pでランダムな頂点につなぎ替え、確率(1-p)でそのままにしたものである。この確率は0から1まで変化するが、p=0のときは規則的な格子で変わらないが、徐々にランダムさが増加し、右のp=1で頂点間の枝は完全にランダムにつなぎかえられる。真ん中のグラフが、スモールワールド・ネットワークであり、規則的なネットワークに見られるような高いクラスター性と、ランダムネットワークに見られるような短い平均距離という2つの特徴を併せ持っている。

ここで、これらのグラフの平均距離(characteristic path length固有パス長=すべての2頂点間の距離の平均) L(p)クラスター係数 C(p)を求めた。平均距離Lはすべての2つの頂点の間の最短の枝の数の平均、すなわちグラフの全体的な特性を表し、クラスター係数Cは隣接するはずの頂点どうしが実際にどのくらい枝でつながっているかの平均、すなわちグラフがどのくらいクラスター化されているか(cliquishness)という局所的な特性を表す(cliqueは派閥とか仲良しグループというような意味である)。

実際のネットワークは、多くの頂点がある程度疎に結合しているが、グラフが非連結になるほど疎ではない。式で表すと、n≫k≫ln(n)≫1であり、ここでk≫ln(n)であることが「ランダムグラフが連結である」ために必要である(頂点の数nは各頂点の枝の数kに比べて非常に多い=すなわちネットワークが疎、kは頂点の対数より非常に多い=すなわち枝はある程度密である)。このときpが0に近づく(=ネットワークが規則的になる)とLはn/2kに近似(これは≫1)でCは3/4に近づく。一方、pが1に近づく(=ネットワークがランダムになる)とL_randomはln(n)/ln(k)、C_randomはk/n(これは≪1)となる。

すなわち、規則的な格子(p=0)は高度にクラスター化されており、頂点数nが増えるにしたがってネットワークの平均距離Lは直線的に増加する。一方、ランダムネットワーク(p=1)はクラスター化が少なく頂点数nが増えても平均距離Lは対数的にしか増加しないためスモールワールドになる。このような両極端では、Cが大きい時はLも大きく、Cが小さい時はLも小さい。(高度にクラスター化されていれば平均距離が大きく、クラスター化が少なければ平均距離も小さい=スモールワールド)
d0194774_20243184.gif

図2:図1で示した頂点間の枝のつなぎ替え確率がpのときの、ネットワークの平均距離L(p)とクラスター係数C(p)の関係をプロットした。
ネットワークの平均距離Lは2つの頂点をつなぐ最小の枝の数を全頂点間で平均値を取ったもの。クラスター係数Cはネットワーク全体がどのくらいクラスター化されているかを0から1までの数値で表したもので、ある頂点vにkv個の頂点が隣接しているとき、取りうる枝の数は最大でkv(kv-1)/2本であるが、そのうち実際に存在する枝の数の割合をCvとして求め、頂点全部で平均を取ったものがCである。友人のネットワークでいえば、平均距離Lは2人を結ぶ最短人数であり、ある人vの友人どうしが「彼らの間でどのくらい友人どうしか」を表すCvのネットワーク全体の平均がクラスター係数Cである。


図2では頂点数n=1000、頂点あたりの枝の数(次数)k=10のとき、pが増加する(ネットワークのランダムさが増加する)ことによって、LやCがどの程度低下するかを示した。Lの低下は急速だったので、横軸のLは対数で表示してある。pが中等度のとき、平均距離は急速に低下するのに、クラスター係数はあまり低下しない(局所的なクラスターは十分保たれる)、というスモールワールド現象が生じる。

図2のように、pが大きくなってネットワークの平均距離L(p)がほとんどL_randomまで小さくなっても、クラスター係数はしばらくC(p)≫C_randomであるようなpが存在する。これは、規則的な枝をある程度ランダムにつなぎかえると、「クラスター性を保ちながら、ネットワークの平均距離は短い」というスモールワールド・ネットワークの特徴が出現することを示している。もともとは距離が遠かった頂点間を結ぶ「ショートカット(近道)」の枝を導入することによって、完全なランダムネットワークではないスモールワールドが実現する。pが小さい場合は、ショートカットはネットワークの平均距離を大きく短縮させる(pが少し大きくなるだけで非直線的に大きい効果がある)。これは、ショートカットはそれが結ぶ頂点間だけではなく、それらの近傍、さらにはその近傍間を結ぶ距離をすべて短縮することができるためである。一方、ショートカットとなるためにクラスター化された近傍から除かれた枝は、クラスター係数Cの低下には直線的に影響する。pが小さいときL(p)が急激に低下しても事実上C(p)は低下しないからである。ここで重要なことは、スモールワールドへの移行はクラスター係数C(p)によって表される局所的な状態からはほとんど分からないということである。これらの結果の正しさを検証するために、様々な異なるタイプのネットワークで当初は規則的なグラフで、異なるアルゴリズムによりランダムなつなぎ替えを行ったとき、本質的に同じ結果が得られるかを検討した。この時、頂点のつなぎ替えに際して、L_randomよりも遠く離れているはずの頂点を結合させるようにつなぎ替えなければならないことだけを条件とした。

このような理想的な構成を行うことにより、ショートカットの重要な役割が明らかになった。すなわち、スモールワールド現象は、多くの頂点を持つ疎なネットワークに起きやすく、その際ショートカットの数は割と少なくても十分であることが分かった。このことを検証するため、さまざまなネットワークの実例で平均距離Lとクラスター係数Cを計算することにした。実例は、映画俳優の共演関係(ランダムネットワークの提唱者・P エルデシュとの論文共著関係を表すグラフに似たものである)、米国西部の電力供給網、線虫C.elegansの神経ネットワーク(すべての細胞系譜と神経ネットワークが明らかになっている)である。これら3つのグラフでLとCを計算すると、これらがすべてスモールワールド・ネットワークを示していることが明らかになった。したがって、スモールワールド現象は人工的・社会的ネットワークだけでなく、自然界の大きいネットワークに普遍的に見られる現象と思われる。

d0194774_20233910.gif

表1:スモールワールドネットワークの実際の例。
上から映画俳優の共演関係、米国西部の電力供給網、線虫の神経ネットワークであり、それぞれの頂点数n、頂点あたりの枝の平均kが説明文に書かれている。L_actual、C_actualはそれぞれの現実のネットワークの平均距離とクラスター係数であり、L_random、C_randomはそれぞれの頂点数、平均次数を持つランダムネットワークの平均距離とクラスター係数を示す。いずれの実際のネットワークでも、L_randomに比べLはやや大きいか同程度なのに、C_randomに比べてCが非常に大きく、短い平均距離の割に大きくクラスター化されている(すなわちスモールワールド・ネットワークである)ことが分かる。


そこで次に、感染症の拡大の単純化モデルを用いて、スモールワールド現象の重要性をさらに検討することにした。このモデルは図1のようなグラフを想定し、t=0で健康な集団に1名の感染患者が発生したとする。さらに、ある一定期間感染症が続いた後、感染患者は免疫成立または死亡によって除かれ、その後は二度と感染が起きないと仮定する。この期間に、感染患者に接した健康な人は確率rで感染するとする。これにより、感染が拡大して全員が感染または死亡するか、ある一部が感染している状態が進行していることになる。

図3aでは、集団の半数が感染するために必要な感染の確率(critical infectioneness:感染力) r_halfは、pが大きくなるにつれて減少することを示している。すなわち、ネットワークがランダムであるほど平均距離が短くなるため、感染の確率が低くても(弱い感染力の感染症でも)、集団の半数が感染しうる(図3a)。また、感染症が集団全体を感染させるに十分な感染力がある場合(r=1)、感染がネットワーク全体に拡大するのに必要な時間T(p)が減少するカーブは、ネットワーク平均距離L(p)が減少するカーブとほぼ同じであった(図3b)。この図の横軸は対数表示であるので、ごくわずかにpが増加しただけでも、急速にT(p)が減少することを表す。すなわち、意外と少ないランダムなショートカットがあれば、簡単にランダムネットワークと同じ程度急速な感染症拡大が起きるようになる。
d0194774_20223456.gif

図3:感染症拡大の単純モデルのシミュレーション結果
a:集団の半数が感染するために必要な感染の確率(r_half)は、ネットワークがランダムであるほど小さくて済むことを表す。
b:また、感染の確率が最大(r=1)のとき、集団全体に感染が拡大するまでの時間T(p)は、ネットワークの平均距離L(p)の減少のカーブと同じになる。ここで、横軸は対数であることに注意。これは、ごくわずかのpの増加でも、急速にT(p)が減少することを表す。すなわち、数本のランダムな枝のつなぎ替えによって、感染が全体に広がる時間はランダムネットワークと同様になる。

【結論】
スモールワールド・ネットワークに見られる①クラスター性が高く、かつ②ネットワークの平均距離が短い、という2つの組み合わせは、従来の規則的な格子モデルやランダムグラフモデルでは見られなかったものである。今後、現実社会や自然界のネットワークにこのモデルが広く見いだされると思われる。

[PR]
# by md345797 | 2014-05-30 03:03

Points of significanceコラム 1:標準偏差(SD)と標準誤差(SEM)を区別する

Points of significance :Importance of being uncertain.(統計学は不確実性を扱う)
Points of significance :Error bars.(エラーバーと有意差の解釈)

Krzywinski M, Altman N.

Nat Methods. 2013 Sep;10(9):809-10、Oct;10(10):921-2.

【総説内容】

1. 統計学は不確実性を扱う
われわれがまた自然現象について何かを調べるとき、毎回全く同一の値が得られることはまずない。われわれの観察や経験は常にいろいろな不確実性を伴い、決して完全ではありえない。しかも、その観察や経験が1回しか行われないことが多い。このような不確実性を伴う、たった1回の経験だけをもとに、一般化した本質を理解するには何らかの危険が伴う。われわれの経験を要約して一般化して理解する際に、「どのくらいの危険が伴うのか」「その一般化はどれくらい信頼できるのか」を扱うのが統計学である。ここでは、統計学の基本的な概念を、直観的に理解しにくい部分も含めて考察する。また、「医学雑誌に掲載された論文の約半分は統計を誤用している」とする報告もあり、よく見られる統計に対する認識の誤りについても考える。

統計学は、記述的な面(descriptive:経験をまとめ要約する部分)と推測的な面(inferential:たった1回の経験からそれが一般化できるかを推定する部分)からなる。推測を行うべき全体のデータは、母集団(population)と呼ばれる。母集団の分布は横軸に数値、縦軸に頻度を取った度数分布(frequency distribution)で表され、これは度数分布をある範囲の数値ごとに頻度をまとめて棒グラフにしたヒストグラムや、ヒストグラムの各棒の上端をなめらかな線で結んだ分布曲線で表されることが多い。
d0194774_1122315.jpg

上の図1aはこの母集団分布の位置を表す平均(μ)と広がりを表す標準偏差(SD、s.d.、σ)を表す。これは図1bのようにさまざまな値を取り、直接は分からないこれらの値を推測することが統計の主要な目的である。母集団は非常に大きく、その平均を直接求めることはできないので、母集団から標本(sample)を得ることによって推定することになる。

2. 標本から、母集団の平均を推定する
(1) 標本で観測される平均や標準偏差などの数値を統計量(statistics)、母集団の平均や標準偏差(これらは直接は知り得ない)を母集団パラメータ(population parameter)と呼ぶ。前者はローマ字(X barやs)、後者はギリシア文字(μ、σ)で書く。標本の統計量を用いて、母集団のパラメータを推定することが主要な目的である。

なお、ある分布が正規分布曲線に従うとき、平均±1SDの間、平均±2SDの間、平均±3SDの間には、それぞれ68%、95%、99.7%の面積が含まれる(これらは概数であり、正確には整数を正規分布曲線の式にあてはめた68.26…%、95.44…%、99.74…%のような数値である)。
d0194774_1125297.jpg

ここで、標本の抽出(sampling)にあたり、1つの母集団からランダムに何組も標本を取ることを想定する。例えば、図2aのような不規則な分布曲線で表される母集団から、標本の大きさ(標本のデータの数)が5個の標本(n=5)を3種類得たとする(図2b)。標本1はX_1(_は1が下付き文字であることを表す)、そして標本1の5個のデータの平均値はX_1 bar(図のようにX_1の上に横棒)と書く。

(2) ところで、母集団から組数の標本を取ると、それら多数の標本の平均(X_bar)の分布というものができる。これは標本分布(sampling distribution)と呼ばれる概念である(図2c)。図2cのように、標本分布の平均をμ_X bar (X barは下付き文字)、標本分布の標準偏差をσ_X bar (X barは下付き文字)で表す。

ここで、標本の大きさが大きくなればなるほど、母集団の形が何であれ、標本分布は正規分布に近づく(下の図3)。これは、中心極限定理(central limit theorem; CLT)という、統計学の最も基本的で重要な定理に基づいている(定義の詳細は省略)。
d0194774_1132129.jpg


(3) このとき、CLTに基づいて次のことが導かれる。nが十分に大きくなるとき、

標本分布の平均μ_X barは、母集団の平均μに等しくなる。
標本分布の標準偏差σ_X barは、(母集団の標準偏差σ)/√(標本の大きさn)に等しくなる。

②の方は混乱を招くことが多いが、σ_X barは「標本分布の」標準偏差σは「母集団の」標準偏差であり、後述の標準誤差(SEM=s/√n)は②のσ/√nの推定値(estimate)である。多くの本には「標本分布の標準偏差=標準誤差」と書かれていることが多いが、厳密には母集団標準偏差/√nの推定値である。

上記の①②は、nが無限大に大きくなった場合を想定しているのであって、現実にはnは有限個しか集められない。そのため、
①′ 母集団の平均μは、標本の統計量に基づいて、「ある区間にある確率で含まれる」というように区間で推定するほかない。
②′ 標本平均の標準偏差σ_X bar母集団の標準偏差σもいずれも仮想上のもので、直接には求めることはできない。標本の標準偏差sはnが十分に大きくなれば母集団の標準偏差σの代用にはなるが(下図4参照)、①′の推定に使うには不十分である*。そこで、後述の標準誤差(=s/√n)をσ/√nの推定値として用い(図4参照)、σ/√nはσ_X barと等しいことから、①′の標本分布の平均の区間推定に用いる。

(*ここでは、「標本の標準偏差と母集団の標準偏差に差がない」と仮定して、母集団の平均を推測する。実際は標本と母集団の標準偏差に差がある場合もあるだろうが、それはあまりに複雑になるので割愛し、上記のような仮定での説明を続ける。)

(4) 標本分布の標準偏差(の推定値)は、標準誤差(SEM、s.e.m.=standard error of the mean)と呼ばれる。標準誤差は、標本の「標準偏差(SD)と大きさ(n)」という既知の値から(標本のSD)/√(標本の大きさn)で求められる。

さて、前述のように標準分布の平均は、ある範囲で推定するしかない。標本分布において、標本平均±1SEMの範囲に標本分布の平均が含まれる確率は68%である。また、標本平均±3SEMの範囲であれば、標本分布の平均は99.7%の確率で含まれる。このように「信頼度を上げるためには推測の範囲を大きくする必要があり、逆に「推測の範囲を狭めれば信頼度は下がってしまう」というジレンマがある。そこで慣習上、標本平均±2SEMの範囲で95%程度の信頼度で、標本分布の平均(すなわち母集団平均)を推測することにしている。この標本分布の平均±2SEM範囲を、標本分布の平均の「95%信頼区間(confidence interval; CI)」と呼んでいる。

(5) 以上より、標準分布のSEMが分かり、標本分布の平均が95%の確率で標本の平均±2SEMの区間に入ることが示された。中心極限定理に基づくと、標準分布の平均母集団平均は等しいので、母集団平均標本平均±2SEMの範囲を95%信頼区間として求めることができた。

(6) 以上で見たように、SDとSEMはまったく異質のものである。SDは、ある標本の平均のまわりのデータのばらつきを表す。一方SEMは、「標本分布においてどのくらいのばらつき具合で標本平均がばらついているか、これにより標本平均の上下どのくらいの範囲で標本分布の平均が含まれる区間を絞れるか」というを表す。nが十分大きい時、標本分布の平均母集団平均と等しいので、SEMは得られた標本平均によってどのくらいの精度で、どのくらいの信頼性をもって母集団平均を予測できるかの指標になる。SDは標本のばらつきを表す「量」で、SEMは標本平均から母集団平均を推測するためのこの標本平均の「質」と言えるかもしれない。

(7) したがって、標本のばらつきを表すSDの代用として、SEMを用いてはならない。グラフではSEMの方がSDのエラーバーより小さくなるので、「ばらつきが少なく、実験の精度が高く見える」「エラーバーが小さいのでより有意差があるように表現できる」と、見栄えを考えてSDで書くべきエラーバーをSEMのエラーバーで代用する、といったSEMの誤用は論外である。そもそもSDも標本のデータがもともとばらついていることを表しているだけで、実験の精度とは関係がない。さらには、あなたが論文の読者で、著者がSEMのエラーバーを用いていたら、その長さを√n倍して標本のSDを求め、±2SDの間に95%の標本データが含まれる、というように考えよう。

d0194774_114123.jpg

上の図4は、図2aの母集団から3種類の標本(X_1, X_2, X_3)を取って、標本の大きさnを1から100まで増加させた場合の標本平均(X_bar)、標本の標準偏差(s)、標本分布の標準誤差(s.e.m.)の変化を点で示したものである(これらは標本から求められる)。赤い線は母集団の平均μ、母集団の標準偏差σ標本分布の標準偏差σ_X barを表している(これらは理論上の仮想で、現実には求められない)。上から1番目、2番目のように母集団の平均と母集団の標準偏差は取る標本の大きさに関わらず同一の値であるが、3番目のグラフのように標本分布の標準偏差σ_X barはnが大きくなるにつれて徐々に減少していって一定の値に収束する。標準誤差s.e.m.がいかに標本分布の標準偏差σ_X barの推定値になり、標本平均から母集団平均を推測するのに有用かが分かる。

3. エラーバーの解釈
次に、ここに2つの独立した標本があるとする。これらの標本は、同じ大きさで、同じ広がりをもつ正規分布に従っているとする。これら2つの標本の平均の間に有意差があるかどうか、2標本のt-検定(two-sample t-test)を用いてP値を計算した。

有意差について詳しくは次回以降述べるとして、ここではこの結果を3種類のエラーバー(すなわちSD、SEM、95%CI)を用いて表現したものを下の図5に示す。2つの標本の平均は0と1.0とする。
d0194774_1142488.jpg

図5aは、3種類のエラーバーでP値は異なるが、同じ長さで表現した場合である。2つの標本のエラーバーがちょうど接するとき、3種類でP値は全く異なることを示している。図5bでは、同じP=0.05になるようなエラーバーとしたところ、3種類の長さは異なり、オーバーラップまたはギャップがあることを示す。図5bで分かるように、「エラーバーどうしが重なり合っていない場合、2つの標本の平均の間には有意な差がある」とか「エラーバーが重なっているので、平均間に有意差はない」という思い込みは、どちらも全く誤りである

2012年にNature Methodsに掲載された論文の2/3の図でエラーバーが使われていた。しかしそのうち、エラーバーがSDを表すものは45%、SEMを表すものは49%、95%CIを表すものはある論文の1つの図のみだった。そのほか5%では何とエラーバーが何を示すのかが文中に述べられていなかった。

(1)エラーバーがSD
図5aではn=10の2つの標本のエラーバーどうしが接触しているが、P=0.0003と有意差がある。図5bではP=0.05で有意差があると言えるがエラーバーは重なっていない。エラーバーの重なりと有意差については一概に、直観的には判断できない。

(2) エラーバーがSEM
図5aではn=10の2つの標本のエラーバーどうしが接触しているが、P=0.17と有意差はなく、図5bでは有意差があってエラーバーが離れている。ここでも「2標本のエラーバーが重ならないからといって、標本間に有意差がある」と考えるのは間違いである。

(3)エラーバーがCI
95%CIがよく用いられるが、下の図6のように標本平均のエラーバーとしてCIが用いられると、95%の確率で母集団平均がエラーバー内にあることになる(同一の母集団から別の標本を取ったとき、その標本の平均が95%の確率でエラーバー内にある、というのはよくある間違い)。95%CIのエラーバーはn=3でおよそ4 x SEM、nが15以上でおよそ2 x SEMでSEMのエラーバーに比べて大きい(図6b)。
d0194774_1115316.jpg


現時点では不幸なことに、上記3種類のエラーバー(SDとSEMと95%CI)は理解不十分のまま混在している。したがって、論文を読む際には、このエラーバーは何であり、どう解釈するのが正しいのかを常に考える必要があるだろう。

付記:
上記のまとめでは、『新・涙なしの統計学』 (D. ロウントリー著・加納 悟訳:新世社、2001)の記述が大変分かりやすかったので参考にさせていただいた。


[PR]
# by md345797 | 2014-05-07 01:04 | その他

複数祖先集団GWASのメタアナリシスは、新たな2型糖尿病感受性座位の発見と微細地図解像度の上昇に有用

Genome-wide trans-ancestry meta-analysis provides insight into the genetic architecture of type 2 diabetes susceptibility.

DIAbetes Genetics Replication And Meta-analysis (DIAGRAM) Consortium.

Nat Genet. 2014 Mar;46(3):234-44.

【用語集】
Single nucleotide polymorphism; SNP (一塩基多型):ゲノムDNA上の一塩基の置換。塩基の置換のうち、頻度が非常に少ないものを変異(mutation)、人口の0.5%以上に見られるようなある程度の頻度で見られるものを多型(polymorphism)と呼ぶ。SNPの中でも置換の頻度の多い(人口の5%以上に見られる)ものをコモンSNP(common SNP)と呼ぶ。2003年から始まったInternational HapMap Projectによってcommon SNPの大部分が明らかにされた。
Locus, Loci (座位):ゲノム上の位置のこと。1つの座位に対し、1つの遺伝型(genotype)が対応する。ある1つの塩基の場所を「座位」とよび、それが何の塩基であるかを「遺伝型」と呼んでもよい。
(これらの語は、遺伝子が発見される前に作られた用語なので、「遺伝子」の場所や型というわけでもない。したがって、「遺伝子座」「遺伝子型」というより「座位」「遺伝型」という訳が適しているとされる。)
Trait (形質):形質は、一つの座位に可能な表現型をまとめたもの。
「エンドウマメの形」という形質(trait)に対し、「丸い」「しわがある」という表現型(phenotype)がある、などと考える。
Allele(アレル):ある個体では、1つの座位に父母由来の2つの遺伝型が存在し、この関係をアレルと呼ぶ。1つの塩基の座位にある、2つの塩基をアレルと呼んでもよい。「アレル」も遺伝子発見以前からの用語であり、しかも実体ではなく関係を表す語なので、「対立遺伝子」と訳すより、「アレル」のまま用いるのがよい。
アレルの人口の中での頻度を調べて、頻度の高いものを「メジャーアレル」、低いものを「マイナーアレル」と呼ぶ。マイナーアレルは「多型」であり、疾患と関連することが多い。
Allele Frequency (アレル頻度):マイナーアレルの頻度が5%以上のSNPはコモンSNP、0.5~5%のSNPはレアSNP、0.5%未満のものは変異(mutation)と呼ばれる。SNPの多型の頻度(アレル頻度)を横軸に取り、その多型が表現型にどう影響するか(疾患となるオッズ比)を縦軸に取ったグラフが非常に有名である(Manolio TA et al. Finding the missing heritability of complex diseases.
Nature. 2009 Oct 8;461(7265):747-53.
)
d0194774_14534374.jpg

左上は非常にまれなSNP変異だがその影響は大きいもの(その変異があるとほぼ必ずその疾患となる)、右下は頻度の多いSNP多型だがその一つ一つのSNPが疾患に及ぼす影響が少ないもの(疾患発症のオッズ比が1.1-1.5程度のもの)である。前者はメンデル型遺伝性疾患、後者はよくみられる、コモンな疾患と考えられている。このようにコモンな疾患とは、頻度は多いがその影響は少ないSNP多型が積み重なってできているとする仮説がある。これが「コモンな疾患はコモンな多型によって起こる」(common disease-common variants; CDCV)仮説であり、CDCV仮説に基づいてGWASを用いたコモンな疾患の原因検索が行われてきた。GWASは、頻度の多いSNP多型を検出することにより、疾患とSNPの関連を調べる方法である(後述)。

上図の中間(水色)の疾患はアレル頻度のやや低い(0.5~5%)のレアSNP多型が、それぞれ疾患に対しやや大きい影響をもたらすというものである。稀少疾患(rare disease)がこれに当たると考えられる。また、コモンな疾患の一部にはこのようなレアなSNP多型が関与しているかもしれない(common disease-rare variant; CDRV仮説)。この集団は従来のGWASではとらえることが困難であり、今後、密度の非常に高いSNPアレイ、次世代シークエンサーを用いた全ゲノムシークエンスやエキソン全体のエキソームシークエンスなど(深度が高い=ディープシークエンスと呼ぶ)の発達によって解析が可能になると考えられる。

Linkage disequilibrium; LD(連鎖不均衡):染色体が子孫に受け継がれるとき、遺伝子の相同組み換えが起きる。その際、相同組み換えが起こりやすい場所(ホットスポット)がある。これらのホットスポット間のSNPは、高い確率で挙動を共にするが、この挙動を共にするSNPsを「連鎖不均衡の関係にある」という。これらのホットスポット間の1区画をブロックと考え、ハプロブロック(haploblock)という。HapMap Projectによってこの「ハプロブロック構造」が明らかになったため、ある数種類のSNPs(タグSNPs)の変化のみ調べればSNP全体の多様性が分かるようになった。

Haplotype(ハプロタイプ):一般には、一緒に(haplo-)遺伝する傾向のあるDNA変異または多型のことをいうが、ゲノム上に見られるSNPのセットまたはアレルの組み合わせのこともハプロタイプと呼ぶ。

Genome-wide association study; GWAS (ゲノムワイド関連解析):ある疾患(disease)や形質(trait)と関連があると考えられるSNPを、全ゲノムを対象に網羅的に検索し抽出する方法。疾患群(cases)と対照群(controls)からそれぞれDNAを抽出し、SNPチップ(SNP array)とハイブリダイズさせることにより、その疾患と有意に関連するSNPを検出する。ある座位のSNPの一方(アレル)が疾患群で有意に多く見られるとき、そのSNPが疾患と関連する(associated)と考える。

ここで用いるSNPは、全SNPである必要はなく、挙動を共にするSNP(連鎖不均衡の関係にあるSNP)があるため、ある種のタグSNP(lead SNP)について調べるだけでよい。全SNPの中でも、マイナーアレル頻度が5%以上のcommon SNPの1/10程度について調べれば、どのようなSNPのパターン(ハプロタイプ)に属するかが分かるとされている。したがって、現在明らかな1,000万のcommon SNPsから大体1/10の100万のタグSNPsを調べるため、1,000K SNPチップなどが用いられる。

通常、群間の差は、群間の違いが偶然である確率が5%未満(P<0.05)で「有意な差がある」と考える。しかし群の数が多い場合の群間の比較ではBoferroniの補正が用いられる。これは有意水準を決めるのに5%を群数で割ったものであり、100万SNPsで調べた(1,000KのSNPチップを用いた)場合は、0.05÷1,000,000=5x 10 -8、すなわちP<5x10 -8を有意水準とする。P値をlog変換し、-log10 P が8以上で有意に「疾患と関連する」などとされるのはこのため。

以下にGWASおよびそのメタアナリシスの概略図を示す(Manolio TA. Genomewide association studies and assessment of the risk of disease. N Engl J Med. 2010 Jul 8;363(2):166-76.より引用)
d0194774_1455385.jpg

上の図1Aでは、3人(Person 1, 2, 3)のゲノムにおける、染色体9番上のある小さい座位を示している。SNP1はPerson 1ではGGであるところが、Person 2ではGT、Person 3ではTTとなっている(同様にSNP2は、Person 1ではAAであるところが、Person 2ではAG、Person3ではGG)。ここではそれぞれ、最初が①頻度の多い「野生型の」ホモ型(common homozygote)、二番目が②ヘテロ型(heterozygote)、三番目が③頻度の少ない「多型」ホモ型(variant homozygote)とする。SNP1ではGがメジャーアレルでTがマイナーアレル、SNP2ではAがメジャーアレルでGがマイナーアレルである。
図1Bでは、疾患群(Cases)と対照群(Controls)の全DNAをSNPアレイで解析し、SNPsをゲノム全体で比較したところ、SNP1はP=1x10 -12、SNP2はP=1x10 -8の有意水準で「マイナーアレルが有意に関連している」ことが明らかになったことを示している。なお、ここで上記の①と(②+③)を比較するか(優性遺伝形式)、(①+②)と③を比較するか(劣性遺伝形式)、さらには①と②と③を比較するかは有意差が大きいものを取るとされている。
図1Cは、横軸に順番に染色体(番号ごとに色が変えてある)を並べ、その上のSNPを点で表している。縦軸はそれぞれの点(SNP)が疾患と関連する有意水準Pをlog変換で表している。このグラフ(signal plot)は、ニューヨークのマンハッタンにある高層ビル群をイメージさせることから「マンハッタンプロット」のニックネームで呼ばれる。この例では、SNP1が10の12乗、SNP2が10の8乗で有意に疾患に関連があることを示す(左のプロットでは同一線上にあるように見えるが、これを大きく拡大すると実際には右プロットのように染色体9番の上のずれた位置にある)。

このようにして明らかになったSNPを疾患の「感受性座位」(susceptibility loci)と呼ぶこれは、SNPの多型「だけ」で疾患が起こるわけではないが、そのSNPを含む多くのSNPsの多型の蓄積によって疾患が「起きやすくなる」、疾患発症が「影響される」=susceptibleと考えられるため。

なお、このようなシグナルが認められるハプロタイプブロックのすべてのSNP(タグSNPだけでなく分かりうるすべてのSNP)が疾患に関連するかを調べ、より強く関連するSNPを絞っていくことをファインマッピング(fine mapping; 微細地図作成)と呼ぶ。この微細地図(fine map)の解像度(fine-mapping resolution)を上げていくことが、GWASの精度を高めるには重要とされる。

なお、GWASで最終的に分かるのは、あくまでも「どのSNPが」疾患に関連しているかであり、「どの遺伝子(gene)」が関連しているかまでは分からない。しかし、特定されたSNPが近傍の遺伝子にどう影響しているかはexpression quantitative trait loci; eQTL(量的形質座位)解析の結果明らかになることがある。
d0194774_14564017.jpg

図1は疾患に関連のあるSNPsを検出するための集団(initial discovery set)を対象にしたものであった。上の図2はそこで明らかになったSNPsを確認し、偽陽性の結果を除外するために別の集団(replication set)を対象とした検討である。図2の例では3つの集団をreplication setとしており、一つ一つの検討では、このSNPが疾患に有意に関連していることは示されていない。しかし、これらのメタアナリシスを行うとこのSNPが強いシグナルとなって認められ、有意に疾患に関連していることが示されている。

【論文内容】
2型糖尿病(T2D)の疾患感受性に対するGWASは、大部分がヨーロッパ白人を祖先とした集団(European ancestry)を対象としたものである。近年は、東アジア人、南アジア人、メキシコ人およびメキシコ系アメリカ人、アフリカ系アメリカ人など他の祖先集団でも検討が行われ、ヨーロッパ白人とオーバーラップする結果が得られている。そこでこの研究では、多くの祖先集団のGWASの結果を組み合わせた「複数の祖先集団にわたる(trans-ancestry)」メタアナリシスを行った。これにより、より大きいサンプルサイズで解析ができ、また連鎖不均衡(LD)構造の異なる集団を対象とすることによって、T2D感受性座位の微細地図の解像度(fine-mapping resolution、感受性座位をいかに絞り込めるか)が強化されると考えられる。

研究の概要
現在までに報告されている4つの人種集団、すなわちDIAGRAM(ヨーロッパ人)、AGEN-T2D(東アジア人)、ST2D(南アジア人)、MAT2D(メキシコおよびメキシコ系アメリカ人)の各コンソーシアムの、合計26,488名の疾患群(case)と83,964名の対象群(control)を対象とした。遺伝的多様性を統一して検討するために、HapMap Projectによる250万のcommon SNPを用いてメタアナリシスを行った。

複数の祖先集団メタアナリシスによる新たな感受性座位の発見
現在までにT2D感受性座位として確立しているものは69個あり、それらのアレル効果(その座位のアレルが疾患発症に関与する影響度)の多様性を、祖先集団間で検討した。その結果、下記の3つの座位のSNPで大きな違いがあることが示された。すなわち、TCF7L2 (SNP番号:rs7903146)はどの集団でもT2Dと大きな関連があったが、その関連(疾患に関連するオッズ比)はヨーロッパ人集団で最も大きかった。一方、PEPD (rs3786897)とKLF14 (rs13233731)は、それぞれ東アジア人とヨーロッパ人でT2Dと大きな関連があった。今回、これら69個の確立したT2D感受性座位を除いた後に、複数の祖先集団で共通してT2D感受性座位(リスクアレル)と考えられるSNPの発見を試みた。

その結果、まず33個のSNPが同定された。これらに対し、ヨーロッパ人の疾患群21,491名と対照群55,647名を対象として、T2Dおよび他の代謝形質および心血管形質との関連を調べるreplication studyを行った。その結果、全ゲノムにおいて有意に(P<5x10 -8)T2Dと関連する7つの座位が新たに同定された(TMEM154、FAF1、POU5F1-TCF19、SSR1-RREB1、MPHOSPH9、LPP、ARL15)。これらの座位は、すべての祖先集団において比較的頻度の高いコモンなSNPで、T2Dへの効果は中等度のものであり、その点で上記のような集団間の多様性は見られなかった。

・これらの新しいT2D感受性座位の一つは、免疫に必要なMHC(major histocompatibility complex; 主要組織適合遺伝子複合体)内のPOU5F1-TCF19の近傍にあるSNPである。MHCにある1型糖尿病(T1D)のリスク座位がlatent autoimmune diabetes of adulthood (LADA)に関連があることが分かっており、これは臨床的にはT2Dと誤って診断されていることがある。
・また、新しい座位にはARL15およびSSR1-RREB1近傍のSNPsが含まれ、これらはそれぞれ空腹時インスリンと血中アディポネクチン値(さらにHOMA-IRで示されるインスリン抵抗性)および空腹時血糖(さらにHOMA-βで示されるインスリン分泌低下)と関連がある。
・新たなT2D感受性座位についていくつかの組織でeQTL解析を行ったところ、SSR1-RREB1座位が膵β細胞においてSSR1の、MPHOSPH9座位が肝においてABCB9および肺においてSETD8の、POU5F1-TCF19座位が単球においてHCG27の発現に強く影響していた。
・また、これらの新たな座位がどのようにT2D感受性に影響しているかも検討した。その結果、POU5F1-TCF19座位はTCF19のミスセンス変異(p.Val211Met)となっている、MPHOSPH9座位はABCB9、OFGOD2、PITPNM2のUTRの変異となっている、FAF1座位はインスリン転写調節に関わるELAVL4発現に関与するオープンクロマチン部位に存在することなどが明らかになった。

複数の祖先集団メタアナリシスによる感受性座位の微細地図解像度(fine-mapping resolution)の上昇
複数の祖先集団のGWASの結果のメタアナリシスにおいて、ベイズ統計学の手法であるMANTRA
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3460225/
(Meta-ANalysis of Transethnic Association studies)ソフトウェアを用いた各集団データの統合を行った。その結果として、T2D感受性座位の微細地図解像度が上昇するか(SNPsの数が増加するか、SNPsの99%信頼セットのゲノム上間隔が短縮するか=感受性座位をいかに絞り込めるか)を検討した。

方法として、すでに確立した10のT2D感受性座位(JAZF1、SLC30A8、CDKAL1、HHEX/IDE、TCF7L2、IGF2BP2、FTO、CDKN2A/B、PPARG、MTNR1B)を対象に、ヨーロッパ人におけるメタアナリシス(疾患群12,171名と対照群56,862名)よりも複数祖先集団を統合したメタアナリシス(疾患群26,488名と対照群83,964名)の方がSNPsの99%信頼セットのゲノム上の間隔が短縮するかどうかを検討した。その結果、MTNR1Bを除いて、複数の集団を統合したメタアナリシスを用いてT2D感受性座位のSNP数が増加、または、感受性座位の微細地図解像度が上昇した。
d0194774_14503950.jpg

図3SLC30A8(rs13266634)のsignal plotsであり、上がヨーロッパ人でのGWAS、下が複数祖先集団を統合したGWASの結果を示している。下の方が微細地図の解像度(fine-mapping resolution)が上昇している。

【結論】
複数の祖先集団におけるT2D感受性座位のGWASでメタアナリシスをおこなうことにより、①新たなT2D感受性座位が明らかになり、また、②すでに知られているT2D感受性座位の微細地図の解像度が上昇した。このことは、従来のGWAS、特にヨーロッパ人の祖先集団のみのGWASでは関連が有意でなかったT2D感受性座位がまだ存在することを意味しており、これらの座位はサンプルサイズの大きい複数祖先集団のGWASメタアナリシスで検出できる可能性がある。


[PR]
# by md345797 | 2014-04-28 18:08 | その他