
ヒトの全遺伝情報であるDNAの30億塩基対をすべて調べようというヒトゲノム計画は,2000年6月に当時のクリントン大統領が華々しく終了を宣言した。データは2001年2月に公開されたが,実際には精度を上げるための作業が2003年まで続くと見られる。とはいえ,生命科学の研究はすでに次のステージに移ったといえる。ゲノム解読後の研究,いわゆる「ポストゲノム研究」だ。
ヒトゲノム計画の“終了宣言”がされたころ,あたかも「これでヒトのすべてがわかる」といった印象を与えるような報道が一部でされた。ゲノム情報なしに「ヒトのすべてがわかる」ことはあり得ないが,ゲノムが解読できたからといって,ヒトがわかるわけでもない。ヒトゲノム計画で明らかになったのは,例えば「5番染色体の5000番目の塩基は4種類のうちのどれか」が,30億すべての塩基サイトに対してわかったということだ。その文字列が何を意味しているのかを解明するのはこれからだ。むしろ,ゲノムを端から丹念に調べていったせいで,「なぜこんな奇妙なことになっているのか」といった謎が増えたという研究者もいる。期待が大きい医療への応用も同じで,遺伝情報が得られても,すぐに治療に結びつくとは限らない。
それでも,ヒトゲノムの全貌がわかった意義は大きい。ゲノム情報なしには事実上不可能だった研究も多い。ゲノム情報は地図のようなものだ。地図が手に入ったからといって,どこかに埋まっている宝を入手したことにはならないが,地図なしには宝探しを始めることさえままならない。
ゲノム解読後に可能になった研究やしなければならない研究テーマはさまざまだ。この特集では,広範囲にわたる「ポストゲノム研究」のうち,とくに塩基配列やそこから直接得られるアミノ酸配列を“研究の対象”にしている分野に的を絞って取り上げた。
DNAに書かれている遺伝情報とは,A(アデニン),G(グアニン),C(シトシン),T(チミン)という4種類の塩基が作る文字の羅列に他ならない。1と0で書かれるコンピューターのデータと同じで,この文字の並びだけを見ても,何のことだかまったくわからない。しかも,30億の文字列のうち,「遺伝子」が占めている領域は,全体の3~4%しかない。
ヒトゲノムが解読されるまでは,ヒトの遺伝子は10万個くらいといわれていた。現在はそれよりずっと少なく,3万~4万個といわれているが,まだ確定値は出ていない。DNAのなかでどの部分が「遺伝子」であるかは,コンピューターの解析ソフトを使って行われている。遺伝子に特有のパターンを塩基の文字列の中から探し出すのだ。取りこぼしや誤りがないように,複数のソフトを使って進められているが,ある遺伝子のイントロン部分(タンパク質の情報が書かれていない部分,下の図を参照)の中に,別な遺伝子が入っていたり,イントロンがあまりに長くて解析が難しかったりと,まだ「遺伝子の数はいくつ」とはっきり決めることはできない。
遺伝子にあるのは情報だけ
遺伝子の情報をもとにタンパク質を作るときには,まず,DNAの塩基配列をメッセンジャーRNA(mRNA)の前駆体に写し取る(転写)。前駆体mRNAから不要な部分を切り取って(スプライシング),完全なmRNAとなると,細胞質に移動してリボソームに結合し,ここで4種類の文字からなる塩基配列の情報は20種類からなるアミノ酸の配列情報へと翻訳され,タンパク質が作られる。このDNA→mRNA→タンパク質という流れは「セントラル・ドグマ」と呼ばれる。
このドグマ(教義)から「遺伝子はタンパク質より偉い」などと考えてはならない。転写などの作業を実際にしているのは他ならぬタンパク質だからだ。遺伝子は単なる設計図に過ぎない。必要に応じてそれを読み解き,役立つ物を作るのはタンパク質だし,DNAそのものを作っているのもタンパク質だ。もちろん,そこで働くタンパク質も遺伝子の情報に基づいて作られている。だから,どちらかが“偉い”などという話でなく,遺伝子とタンパク質は互いに絡み合いながら生命現象を支えている(正確に言えばRNAの働きも重要だ。RNAの配列を決める情報もDNAの中に書かれていて,これも遺伝子として扱われている)。
ヒトゲノムの解読が終わろうとしているからといって,「ヒトがわかる」とはならないのは,個々のタンパク質の働きを調べるという大仕事が残っているからだ。医療への応用についても,診断ならばその人の持つ遺伝子を調べればすむ場合もあるが,薬を創るとなるとやはりタンパク質のことを知らなければならない。ゲノムを研究する「ゲノミクス」の次はタンパク質を対象にした「プロテオミクス」だと言われるのも当然だろう。
注目されるタンパク質
DNAの配列にはイントロンなど,タンパク質とは直接関係ない情報も含まれているが,mRNAにはタンパク質合成に必要な情報だけが切り出されている。日本は,mRNAをより化学的に安定で扱いやすい完全長cDNA(相補的DNA)の形で収集するプロジェクトを進めている。ヒトゲノム解読では後れをとったといわれた日本だが,完全長cDNAは日本の得意分野だ。mRNAやcDNAの塩基配列がわかれば,タンパク質を構成するアミノ酸の配列もすぐにわかる。
配列情報に基づいたアミノ酸の長い鎖は,折りたたまれて立体構造をつくる。その構造はタンパク質の機能に深くかかわっている。現在,タンパク質をグループ分けして,各グループからいくつかのタンパク質を選んで,実験的に1つひとつ立体構造を調べる研究が進んでいる。
しかし,アミノ酸配列だけから直接,立体構造を予測することはできないだろうか。それに挑戦したのが「タンパク質分子の姿をあぶり出す新手法」(20ページ)だ。それぞれのアミノ酸が親水的であるとか,電荷を帯びているといった性質から,そこに働く力を考え,立体構造を予測するという,意欲的な研究だ。X線結晶構造解析などの実験的な手法による構造解析が難しい膜タンパク質の予測に,特に大きな成果を上げつつある。
プロテオミクスの最終目標は,すべてのタンパク質の構造と機能を明らかにして,生命現象を説明することにある。ほとんどのタンパク質は単独ではなく,他のタンパク質と結合することで機能を発揮する。そこで,どのタンパク質とどのタンパク質が結合するかといった研究も進められている。しかし,実際には1つのタンパク質に複数の別なタンパク質が結合したりして,解析は容易ではない(右上の図)。AとB,AとCは結合しないのに,BC複合体とAならば結合するなどといった事例もあり,解析を難しくしている。
塩基配列から直接わかること
タンパク質の全容が明らかになるにはまだ少し時間がかかりそうだが,DNAの塩基対だけでもさまざまな面白い研究が可能だ。完全長cDNAの収集と並んで日本が力を入れているのは,SNP(単一塩基多型)の収集だ。SNPは遺伝子レベルの個人差を研究するときに不可欠な研究材料だ。
ヒトゲノムでは,民族にかかわりなく,同じ染色体の同じ位置(遺伝子座と呼ぶ)に同じ働きを持つ遺伝子がある。ところが,その塩基配列は,少しずつ個人差がある場合がある。こうした塩基配列の個人差の多くはSNPという,1つの塩基が別の塩基に置き換わったものだ。「遺伝子の個人差を医療に生かす」(28ページ)では,病気へのかかりやすさなどに影響するSNPを探そうという研究を紹介する。
ごく単純に考えれば,患者グループと健康な人のグループのゲノムを比較して,その違いを統計的に処理すれば,その病気に関係するSNPが見つかるはずだ。しかし,遺伝性疾患とは呼ばない,高血圧や糖尿病などといったありふれた病気の場合,関与するのはたくさんの遺伝子で,どのSNPの組み合わせが臨床的に意味があるのか,さらには病気に関与した遺伝子セットを両親から1つずつ合計2セット持っている人と,1セットだけの人とで症状に違いがあるのかなど,統計的な手法を駆使した解析が必要になる。
ゲノムの比較でわかるのは個人差だけではない。「ヒトと類人猿の違いをゲノムから探る」(36ページ)では,チンパンジーやゴリラなどのゲノムとの比較から,ヒトの独自性を探し出そうとしている。外見的な違いはもちろんのこと,言語を使った複雑なコミュニケーションや発情期の消失など,ヒトは類人猿とは違う独自の性質をいくつも備えている。すべてのヒトに共通の性質である以上,環境要因ではなく,ヒトゲノムに書き込まれた遺伝情報が基盤にあることは間違いない。これを探すには,ゲノムを見るしかない。
個人差にせよ,種の違いにせよ,配列の違いが何を意味するのかを知るには,やはりタンパク質の機能などを実験的に調べる必要がある。それでも,塩基配列から興味深い知識がたくさん得られるはずだ。