广州CBC2019
作者:互联网
CBC2019-day1
25 August 2019 on 学术前沿huyujia8月24日上午,CBC2019正式开幕。主持人首先对大会情况以及与会嘉宾做了简要介绍;紧接着,校领导、大会主席以及CCF专委工委委员致辞;与会来宾合照之后,会议正式开始。
特邀报告
来自中科院上海马普计算生物学研究所的研究员兼首席科学家李亦学教授带来了题为“肝癌的生物信息学以及多组学研究”的精彩报告。生命科学和医学进入了大数据驱动的颠覆性变革时代,生物医学大数据的来源与类型更是丰富多样。在这样的数据驱动下,教授向我们介绍了NODE新一代生物组学数据的汇交管理平台;并简要介绍了团队在肝癌多组学、肝癌精准医学以及肝损生再生这几个领域的研究情况。
来自香港浸会大学计算和理论科学研究所副所长张晓明教授为我们带来了题为“Clustering on Imbalance Data”的精彩报告。少数类的数据中常常会包含更多有用的信息,例如在癌症诊断中,少数类更应该被关注。处理非平衡数据的方法一般有1)采样方法,包括降采样和过采样;2)权重设置法。目前为止,如何处理非平衡数据仍未有一个较为通用的方法。张教授提出一种SMCL方法:先选择多个小聚点,再通过惩罚学习将小聚点融合成大聚点,最终为数据划分出适当的聚类结果。
来自中南大学计算机学院的院长王建新教授为我们带来了题为“生物医学大数据处理研究探讨”的精彩报告。随着生物分析和计算技术的快速发展,生物医学领域产生了大量的数据。王教授在分析生物医学数据的主要来源以及相关特点的基础上,与大家分享了AI技术在电子健康档案、医学影像数据以及生物组学数据的分析应用等方面的研究工作和挑战,并就生物医学人工智能中存在的主要问题进行了简要分析和探讨。
分会场报告
下午的报告分别在三个分会场举行,分会场的主题分别为:精准医疗,医学图像,表型-基因型分析;组学大数据分析与医疗应用;蛋白质结构预测与计算。下面对其中的部分报告做简单介绍:
来自海普洛斯的陈实富CTO为我们带来了名为“生物信息开源实践”的精彩报告,这是本次大会为数不多的来自企业的报告嘉宾。他为我们介绍了该公司现有的两个产品:极速高敏感度地检测目标突变的MutScan、目标基因融合的敏感检测和可视化GeneFuse。产品的独特性会给公司以及使用者带来最大化的价值,因此工具的特性介绍和使用方法也是必不可少的。
来自云南大学周维教授团队的于小娟学者为我们带来了题为“Exploiting XGBoost for Predicting Enhancer-Promoter Interactions”报告。该篇论文使用表观基因组学数据预测增强子和启动子的相互作用(EPIs),并发现H3K家族特征能表现EPIs;另外,对比常用的机器学习分类方法如GBDT、XGBoost等三种方法,最终发现XGBoost的分类效果最好。报告结束后,实验室小伙伴与她进行了交流和学习。
来自上海脑科学与类脑研究中心的曾涛副研究员为我们带来了名为“Scalable and Adaptive Integration Analysis for Big Omics Data”的精彩报告。在生物大数据时代,如何对多层次匹配组学信息的样本进行整合分析至关重要。而在不同场景的生物学研究中,单层组学和未确定层数的多组学数据广泛存在,因此可拓展性和自适应数据集成方法至关重要。该团队提出一种名为HCI(高阶相关积分)的有效数据集成框架,利用PFA(模型融合分析)结合的高阶矩阵,实现了联合特征提取以及自适应模式。同时还整合了来自TCGA和GEO数据集的异质组学数据,验证了方法的有效性。
来自华中科技大学物理学院生物物理研究所的黄胜友教授,带来了名为“Modeling the Symmetry of Pretein-Protein Complex Structures through Molecular Docking”的精彩报告。黄教授主要介绍了蛋白质与蛋白质相互作用的分子对接方法,主要研究Cn对称蛋白的反应。相互作用的对接基于快速傅里叶变换,建立打分函数,通过迭代优化使得结合自由能最低。黄老师团队在2018年国际蛋白质与蛋白质复合物结构预测竞赛中荣获冠军,并在其他多项重要竞赛中也获得佳绩。
BC2019-day2
26 August 2019 on 学术前沿huyujia8月25日,第四届中国计算机学会生物信息学会议第二天的精彩报告如约而至。
特邀报告
来自中山大学中山眼科中心的刘奕志教授为我们带来了题为“用人工智能进行常见眼病筛查诊断、风险和预后预测的研究”的精彩报告。刘教授团队近年来利用高速发展的机器学习新算法,对眼科诊疗大数据进行挖掘学习,构建了白内障图像识别诊疗决策云平台、青光眼多模态诊断体系、眼底多疾病诊断系统和近视发展预测的一系列人工智能模型,经过内外部的机器数据验证,准确率均可达到90%以上。以上系统已经在临床上初步投入使用,并取得了临床实践上的真实反馈,可辅助或部分代替医生,远程为广大患者提供专家级别的筛查、诊断、诊疗决策、风险评估和预后预测的新型医疗服务。
来自中国科技大学的黄德双教授为我们带来了题为“Motif Mining in Biological Sequences by Deep Neural Networks ”的精彩报告。黄教授今天讲述的主题是使用深度学习方法进行序列的motif挖掘,有研究表明结合位点motif挖掘在转录和翻译中发挥着至关重要的作用,将motif挖掘与深度神经网络相结合已成为研究趋势。接下来列举了多种神经网络模型,如:卷积神经网络、半监督神经网络、大型卷积神经网络等,结合序列和结构信息,用于预测RNA与DNA的motif。在最后黄教授也提出了motif预测的难点,因结构信息是通过序列信息预测,所以可能产生冗余信息,无法保证预测高准确性,进一步来讲,序列编码以及模型选择也对预测准确性有一定影响。
来自中科院“基因组科学与信息”的方向东博士为我们带来了题为“基因组大数据与全民健康”的额精彩报告。方博士主要介绍了目前关于基因组大数据的使用瓶颈以及实现全民健康需要做出的努力。随着基因测序的价格越来越低,越来越多的基因数据积累起来,目前关键技术瓶颈是生命健康大数据不能得到有效利用,如果能够及时获取、结构化整合、快速分析这些数据,并且有效整合临床医疗与卫生健康数据,才能开展精准的疾病分类与诊断,实现个性化疾病防治和健康管理的全新模式。生命健康大数据不能得到有效利用的主要原因在于:数据多元异构、物理分散,亟需集成与融合,需要开发组学和医疗数据集成引擎,建立标准化的、可拓展、可共享的精准医学大数据平台;在充分保障健康数据的隐私和安全的前提下 ,有效实现精准医学大数据的互联、互通、互操作。国家主管部门要及时出台相关的法规和标准,加快建设统一权威、互联互通的人口健康信息平台。
分会场报告
下午的报告分别在三个分会场举行,分会场的主题分别为:生物信息学算法,基因组学分析,生物网络、RNA与疾病关联分析。下面对其中的部分报告做简单介绍:
来自南开大学人工智能学院的张瀚教授为我们带来了题为“Detecting Hidden Batch Factors Through Data-Adaptive Adjustment tor Biological Effects ”的精彩讲座。批量效应是影响高吞吐量研究(如RNA测序)测量技术变化的主要来源之一,有研究表明,不同的实验平台、实验室条件、不同的样品来源和人员差异可能会导致批量效应差异,这些差异会导致假阳性。批量校正算法的一个关键是弄清楚批量因素,但在许多情况下,这些因素是未知的或不准确的,因此,检测隐藏的批量因素尤为重要。张教授团队提出了一种基于数据自适应收缩和半非负矩阵分解的检测未知批量效应的新算法,能够识别原始研究遗漏的新的批量因子,导致差异表达基因的表达不足,同时在检测细微批量效应方面也具有强大功能。
来自大连理工大学软件学院的何增有教授为我们带来了题为“统计显著社区发现及其在生物信息中的应用”的精彩报告。社区发现是数据挖掘以及网络科学等诸多领域中的核心算法问题之一,何教授团队将统计显著社区发现算法应用在蛋白质与蛋白质网络发现等生物信息学问题中,最近提出评估社区统计显著性的P值计算方法(社区划分越合理,P值越小),以及如何利用启发式的方式来对目标函数进行优化,搜索具有统计显著意义的社区。
来自吉林大学周丰丰团队的成员为我们带来了一场名为“Two Straws May Make a Perfect Diamond: Selecting Individually Weak Features for a Better Accuracy ”的精彩报告。由于算法时间复杂度等问题,生物医学大数据的常用分析方法是考察组间差异指标(特征),来发掘表型相关的功能模块。通过理论构造和实验验证多个途径表明,组间差异性较小的单个特征,组合在一起可以取得非常好的数据模型。该团队在IFS方法的基础上,提出了一种名为RIFS的特征打分排序算法,并进一步给出了多个不同生物医学大数据领域的实际应用案例。
来自湖南大学信息科学与工程学院的骆嘉伟教授为我们带来了一场名为“基于癌症基因组学数据的miRNA功能模块识别算法研究”的精彩报告。大量研究表明miRNA的异常表达与癌症的发生、发展有关,且miRNA通常以组合的方式发挥其协同调控作用。本报告主要介绍如何通过聚类手段发现miRNA的功能模块,即利用粗糙集算法识别miRNA调控模块和利用亲和力传播聚类算法发现miRNA预后模块。
最后,中国科学院计算机技术研究所研究员张法进行闭幕式致辞,并宣布下一届CBC会议拟于2020年8月16-19日在哈尔滨华旗饭店举行。期待明年的会议~
标签:CBC2019,报告,来自,教授,广州,精彩,算法,数据 来源: https://www.cnblogs.com/wangprince2017/p/12055462.html