Core Concepts
遺伝子発現を調節するための3D染色体相互作用の予測における機械学習手法の重要性。
Abstract
最近の染色体捕捉技術により、3D染色体相互作用を広範囲にプロファイリング可能。しかし、現在の3D構造カタログは不完全で信頼性が低い。機械学習手法は、欠落している3D相互作用を取得したり解像度を向上させたりする代替手段として浮上している。これらの手法は、ゲノムアノテーションデータやDNA配列情報などを使用して、ゲノム特徴と染色体相互作用との関連性を学習する。本レビューでは、EPIs、クロマチン相互作用/ループ、TAD境界の予測向けの計算ツールについて議論し、それらの利点と欠点を分析する。
Stats
Hi-C技術は典型的なRNA-seq実験よりも20倍以上のシーケンスが必要。
4-cutter制限酵素でも理論的に256 bpごとに切断されるが、不均一な切断サイト分布により解像度が変動する。
A/Bコンパートメントは転写活性または非活性クロマチン領域に対応し、DNAアクセシビリティ信号や遺伝子密度などで豊富か貧弱かが示されている。
CTCF結合部位や他の建築タンパク質(RAD21、SMC3など)がTAD境界で豊富であり、転写活性クロマチンマークも存在する。
クラス不均衡問題への対処方法としてROSやRUSなどがある。
Quotes
"Genomic annotations and sequence features may be used to predict the location of higher-order chromatin structures."
"Machine learning methods have emerged as an alternative to obtain missing 3D interactions and/or improve resolution."
"The disruption of higher-order chromatin structures has been shown to lead to developmental diseases, cancer, and other disorders."