胎児のときから将来の学歴は決まってる ── 最新科学が裏付けた「親ガチャ」の残酷な事実
例えば1996年に報告されたドーパミンという神経伝達物質に関わるDRD4という遺伝子が、新奇性追求というパーソナリティ特性の個人差に関わることがわかったという具合です(この結果はその後の数多くの追試から検証されませんでしたが)。しかし、単一の遺伝子によって説明できる表現型はそれほど多くありません。
ほとんどの表現型は、複数の遺伝子の作用によって発現するポリジェニックなものなのです。GWASでは、どういう遺伝子がどう働いているのかはわからないにしても、染色体上のどの位置に関連するSNPがあるかが示され、その情報全体から病気などのリスクを確率的に示すことができます。高脂血症、高血圧、糖尿病、がん、心筋梗塞、アルツハイマー病などについて、発症を早期に予測して予防しようという動きが盛んになってきました。
「個人レベルの学歴」も遺伝子解析で説明できるように
病気以外の表現型についてもGWASで明らかにしようという試みは行われていましたが、2016年くらいまでは、あまり成果があがってはいませんでした。
知能テストの成績と参加者のゲノム解析から、知能に影響を与えていると思われるSNPが70個程度見つかってはいましたが、これらSNPの効果量を足し合わせても、その影響はせいぜい数パーセントといったところ。双生児法によって算出される知能の遺伝率50~60パーセントとは大きな開きがありました。
ゲノム解析で個人レベルの能力を明らかにできるのは、不可能か、少なくともまだまだ遠い先のことだろう、私はそう考えていました。ところが2016年頃から状況は急速に変化します。学歴に影響を与えていると思われるSNPがいきなり1200個以上も見つかったのです(一般的に学歴と知能には強い相関があります)。SNP一つ一つの効果量は微小なものですが、足し合わせると12パーセントにもなったのです。
つまり、ゲノム検査の結果によって、個人レベルの学歴について10パーセント以上まで説明可能になってきたということです。
300万人のサンプルから相関を導き出す
70個しか見つかっていなかったSNPが、いきなり1200個以上になったのを不思議に思う人もいるでしょう。
世界各地にはゲノム情報と共に各種の身体的・生理的特徴、生体サンプル、生活状態などの情報を大規模に収集しているバイオバンクとよばれる研究事業があります(イギリスのUKバイオバンクなど)。また23andMEのような遺伝子検査サービスも大規模なデータベースをもっています。
こうしたデータベースには学歴も基本情報として登録されており、それらを合わせると100万人以上のデータになります。そこで知能と0.5の相関がある学歴データも知能の指標として使えることに気づいた研究者がいました。このデータをGWASにかけることで一気に研究が進んだというわけです。さらに2022年の最新の論文では、サンプルがさらに300万人に増え、その説明率は16パーセントにまでなりました。
UKバイオバンクなどのデータから学歴についてのポリジェニックスコアが算出され、これを用いた研究も進んでいます。中でも大きな注目を集めたのが、アメリカの行動遺伝学者キャサリン・ハーデンらが2020年に発表した研究です。
研究対象となったのは、1994年、1995年から4年間、アメリカの高校に在学していたヨーロッパ系の生徒3635人。アメリカの高校では難易度によって数学のコースが分かれているのですが、ハーデンらは学歴に関するポリジェニックスコアが最終的な学歴にどう関係しているのかを調べました。