非翻訳RNAの発現を予測するAIの開発 -ゲノム解析からの疾患理解を促進-(産総研)

2022.11.30更新

理化学研究所(理研)生命医科学研究センター ゲノム解析応用研究チームの小井土大 特別研究員(研究当時、現 客員研究員、東京大学 大学院新領域創成科学研究科 助教)、寺尾知可史 チームリーダー、ピエロ・カルニンチ 副センター長(研究当時)、東京大学 大学院新領域創成科学研究科の鎌谷洋一郎 教授、産業技術総合研究所(産総研)人工知能研究センターの瀬々潤 客員研究員(株式会社ヒューマノーム研究所代表取締役社長)らの共同研究グループは、300種以上の細胞・組織における非翻訳RNA※1の発現をDNA配列パターンのみから予測するAI※2を開発しました。

本研究成果は、創薬標的やバイオマーカーとなる非翻訳RNAの探索に貢献すると期待できます。

多因子疾患などに関連する多型※3はゲノムの非翻訳領域に集積していますが、多型が非翻訳RNAの発現に与える影響の多くが未解明でした。

今回、共同研究グループは数十年前から行われてきた配列モチーフ※4解析に立ち戻り、DNA配列パターンから非翻訳RNAの発現を予測するAIを開発し、「MENTR(メンター)」と名付けました。FANTOMコンソーシアム※5(FANTOM5)が2014年に公開した遺伝子発現データをMENTRで学習し、過去のゲノムワイド関連解析(GWAS)※6の結果の再解釈を行いました。これにより、多因子疾患などのさまざまな形質に関連する非翻訳RNAを1万種以上カタログ化し、非常にまれな多型が非翻訳RNAを介して喘息などの疾患発症に影響する機序を明らかにしました。MENTRは公開され、世界中の研究者が利用可能です。

本研究は、科学雑誌『Nature Biomedical Engineering』オンライン版(11月21日付:日本時間11月22日)に掲載されます。

新しいAI(MENTR)を活用した非翻訳RNAの発現予測と疾患研究への応用

新しいAI(MENTR)を活用した非翻訳RNAの発現予測と疾患研究への応用

今後の期待

GWASから得られた多型と疾患との因果関連を示すデータが日進月歩で蓄積されていますが、GWAS関連領域の大多数を占める非翻訳領域上の多型が疾患発症リスクを増減する生物学的メカニズムを明らかにしたものは限定的です。DNA配列のみから細胞種特異的な非翻訳RNAの発現予測を行う新しいAI技術MENTRを用いると、多型による非翻訳RNAの発現量の増減を高精度に予測でき、創薬標的の探索に有用な生物学的解釈を行うことができます。現在、日本を含む世界各国で数万~数十万といった大規模なヒトの全ゲノムシーケンス解析※7が進行中であり、今後もGWASから複雑形質に関連するまれな多型が非翻訳領域において多数明らかになると考えられます。そのため、創薬研究やバイオマーカー探索におけるMENTRの意義が一層高まるものと期待できます。本発表以外にも、MENTRは既に複数の研究で新知見を見いだすことに貢献しており注1-3)、今後のさらなる活用が期待できます。

同時に、「MENTRがなぜDNA配列のみから非翻訳RNAの発現を予測できるのか」は本研究の過程で生まれた新たな問いです。本研究では、転写開始点から遠方のエピジェネティックな状態が複雑に(非線形に)組み合わさって、非翻訳RNAの発現が決まることをデータ駆動的に見いだしました。今後、MENTRの学習済み機械学習モデルを精緻に分析することで、非翻訳RNAの発現メカニズムを細胞種特異的に解明できれば、分子細胞生物の新知見が創出されることも期待できます。

本研究で主に用いたデータはFANTOM5が2014年などに発表した研究成果ですが、創薬において有用な新知見を8年近く経過した今でも得ることができました。MENTRのようなAI技術をフル活用し、過去に蓄積されたデータを再解析することで、新知見が創出される研究が進展することが今後も期待できます。

MENTRは公開レポジトリGitHubにて公開しており注4) 、本研究で構築したカタログ注5)とともに、世界中の研究者が誰でも利用することができます。

注1)Mishra et al., Stroke genetics informs drug discovery and risk prediction across ancestries. Nature (2022)
注2)2021年6月9日プレスリリース「アトピー性皮膚炎発症の新しい遺伝因子」
https://www.riken.jp/press/2021/20210609_2/index.html
注3)2021年8月19日プレスリリース「日本人の鼠径ヘルニア(脱腸)に関わる遺伝子座を同定」
https://www.riken.jp/press/2021/20210819_3/index.html
注4)MENTR (mutation effect prediction on ncRNA transcription)
https://github.com/koido/MENTR
注5)MENTR results viewer
https://doi.org/10.5281/zenodo.5638259

論文情報

<タイトル>
Prediction of the cell-type-specific transcription of non-coding RNAs from genome sequences via machine learning
<著者名>
Masaru Koido, Chung-Chau Hon, Satoshi Koyama, Hideya Kawaji, Yasuhiro Murakawa, Kazuyoshi Ishigaki, Kaoru Ito, Jun Sese, Nicholas F. Parrish, Yoichiro Kamatani, Piero Carninci, Chikashi Terao
<雑誌>
Nature Biomedical Engineering
<DOI>
10.1038/s41551-022-00961-8

補足説明

※1 非翻訳RNA、長鎖ノンコーディングRNA(lncRNA)
DNAから転写されるRNAのうち、メッセンジャーRNA(mRNA)はタンパク質に翻訳される。タンパク質に翻訳されるmRNAに対して、タンパク質に翻訳されないRNAの総称を非翻訳RNAという。非翻訳RNAは、ヒトの発生や恒常性の維持などにおいて、組織や細胞種特異的に作用する様々なタイプがあることが報告されている。本研究ではこのうち、遺伝子の発現を遠方から制御するエンハンサーが活性化した際にそのエンハンサー領域の両端から同時に転写されるエンハンサーRNA(※8)と、200塩基以上の長鎖ノンコーディングRNA(lncRNA)を主な解析対象とした。lncRNAはlong non-coding RNAの略。
※2 AI
人工知能(artificial intelligence)の略。本研究では特に、データとその学習ルールを指定して、変数間の複雑な関係性・規則性を学習する技術である機械学習(Machine Learning)を指す。
※3 多型
ゲノムのDNA配列が個人間で異なる箇所のうち、ある集団内で一定の頻度で存在するもの。代表的なものに一つの塩基が他の塩基に置き換わった一塩基多型(Single Nucleotide Polymorphism、SNP)がある。
※4 配列モチーフ、転写因子
特定の機能的役割を持つDNA配列パターン。例えば、ゲノム上にある転写因子(特定のDNA配列に結合し、遺伝子発現を制御するタンパク質)が結合する箇所は数多く存在するが、その結合箇所のDNA配列パターンを比較すると同じような配列が頻出する。例えば、2019年のノーベル医学生理学賞で話題になった低酸素誘導因子はACGTGやGCGTGなどの5文字のモチーフがある領域に結合することが知られている。そのような頻出パターンの最小単位として配列モチーフが用いられてきたが、本研究ではヒトが発見できないような長くて複雑な配列パターンも含めてAI技術で探索を試みた。
※5 FANTOMコンソーシアム
理研が主催する国際研究コンソーシアム(https://fantom.gsc.riken.jp/jp/)。本研究では、第5期(FANTOM5)で公開されたヒトのさまざまな細胞・組織で計測したCAGEトランスクリプトームデータを再解析し、用いた。
※6 ゲノムワイド関連解析(GWAS)
多因子疾患や身体測定値などのさまざまな複雑形質に対して、遺伝多型との関連を明らかにするために行われるゲノム解析手法。GWASはGenome-Wide Association Studyの略。
※7 全ゲノムシーケンス解析
次世代シーケンサーを用いて、全ゲノムDNAの配列を解読すること。
※8 エンハンサーRNA(eRNA)
エンハンサーは、遺伝子発現を制御する機能部位のうち、転写開始点から遠方に存在し、転写効率を高めるのに重要な領域。同じmRNAに対しても、細胞種が異なれば別の種類のエンハンサーが機能している。特に、活性化したエンハンサーの両端からは非翻訳RNAが転写されることが知られており、これをエンハンサーRNA(eRNA)と呼ぶ。FANTOMコンソーシアム第5期(FANTOM5)によって65,000個のeRNAが同定され、その周辺に多因子疾患の関連多型が数多く存在することが報告されている。


最新のEMC関連規格動向は『月刊EMC』にて随時掲載しています。


Copyright(C) Kagakujyoho shuppan Co., Ltd. All rights reserved.
※記事の無断転用を禁じます。