NEWS

丸山修教授らの論文がBMC Bioinformatics誌に掲載されました

芸術工学研究院 未来共生デザイン部門 丸山修 教授と芸術工学府未来共生デザインコース修士2年(当時)の古賀吏さんによる共著論文「Class-balanced negative training sets for improving classifier model predictions of enhancer-promoter interactions」が、BMC Bioinformatics誌に掲載されました。

議論していることは、2つのオブジェクトの組(本論文では、ゲノム上のエンハンサー領域とプロモーター領域)が相互作用するか否かを判定する分類器を正負例から学習する際に必要となる「負例が満たすべき条件とその作り方」です。
図1では、プロモーターpを含む相互作用の頻度が正例集合と負例集合で大きく偏っているため、分類器がpを含む相互作用を負例と誤って予測しやすく、本質的な関係性の学習を阻害する問題を示しています。この問題を解消するため、pの出現回数が正例集合と負例集合で等しいという負例集合を仮定します(図2)。しかし、全オブジェクトについて同時にこの条件を満たす負例集合を構築する手順は自明ではありません。本論文では、この課題に対し、最大フロー問題へ帰着させて最大フロー問題を解くアルゴリズムで解く方法とギブスサンプリングで生成する直接的方法という2種類のアルゴリズムを提案しています。
提案した負例生成アルゴリズムはエンハンサー・プロモーター対に限らず、「タンパク質間相互作用」や「商品とユーザー」など、多様なオブジェクトのペア(二項関係)にも理論上適用可能です。
参照リンク