AI周报丨多个国内团队使用人工智能揭示蛋白质相互作用;超参数调优河伯、组合优化器CompBO,华为诺亚开源贝叶斯优化库
作者:互联网
01# 行业大事件
已开源,多个国内团队使用人工智能揭示蛋白质相互作用
PhosIDN:一种集成的深度神经网络,用于通过结合序列和蛋白质-蛋白质相互作用信息来改善蛋白质磷酸化位点预测
通过多尺度卷积神经层进行迁移学习,用于人-病毒-蛋白质相互作用预测
DeepTrio:使用掩码多个并行卷积神经网络的蛋白质-蛋白质相互作用的三元预测系统
pyconsFold:一种使用距离预测进行建模和对接的快速、简单的工具
一种预测生物活性分子结合构象的几何深度学习方法,可预测配体与蛋白质靶标的结合构象
使用纳米孔以单氨基酸分辨率多次重读单个蛋白质
PhosIDN:一种集成的深度神经网络,用于通过结合序列和蛋白质-蛋白质相互作用信息来改善蛋白质磷酸化位点预测
磷酸化是研究最多的翻译后修饰之一,在各种细胞过程中起着关键作用。研究蛋白质磷酸化可以增进对蛋白质互作的研究,对于医疗、疾病、制药等均有帮助。
最近,深度学习方法在预测磷酸化位点方面取得了巨大成功,但其中大多数基于卷积神经网络,可能无法捕获足够的关于蛋白质序列中残基之间的长程依赖关系的信息。
此外,现有的深度学习方法仅利用序列信息来预测磷酸化位点,因此非常需要开发一种深度学习架构,可以结合异质序列和蛋白质 - 蛋白质相互作用(PPI)信息来更准确地预测磷酸化位点。
中国科学技术大学的研究人员提出了一种名为 PhosIDN 的新型集成深度神经网络,通过提取和组合序列和 PPI 信息来预测磷酸化位点。
该研究以「PhosIDN: an integrated deep neural network for improving protein phosphorylation site prediction by combining sequence and protein–protein interaction information」为题,于 2021 年 12 月 15 日刊载于《Bioinformatics》。
在 PhosIDN 中,提出了一个序列特征编码子网络,不仅可以捕获局部模式,还可以捕获蛋白质序列的远程依赖性。同时,在 PhosIDN 中还通过采用多层深度神经网络的 PPI 特征编码子网络提取有用的 PPI 特征。
此外,为了有效地结合序列和 PPI 信息,引入了异构特征组合子网络,以充分利用序列和 PPI 特征之间的复杂关联,并将它们的组合特征用于最终预测。综合实验结果表明,所提出的 PhosIDN 显着提高了磷酸化位点的预测性能,并且优于现有的通用和激酶特异性磷酸化位点预测方法。
PhosIDN 链接:https://github.com/ustchangyuanyang/PhosIDN
论文链接:https://academic.oup.com/bioinformatics/article/37/24/4668/6329824
超参数调优河伯、组合优化器CompBO,华为诺亚开源贝叶斯优化库
贝叶斯优化可以说是一种黑盒优化算法,该算法用于求解表达式未知函数的极值问题。因其具有极强的样本有效性,近年来被广泛使用,研究者只需较少地迭代次数,即可得到一个较好的结果,因此可用于机器学习模型算法调参。
近日,华为诺亚开源了一个新的关于贝叶斯优化的库,该库可用于低维和高维领域的贝叶斯优化,主要包含:
河伯(Heteroscedastic Evolutionary Bayesian Optimization,HEBO):异方差演化贝叶斯优化,可用于超参数调优,华为诺亚凭借该算法赢得 NeurIPS BBO 竞赛冠军;
T-LBO:一种将深度度量学习与潜在空间贝叶斯优化相结合以实现高维优化的算法,该算法可以减少 97% 的数据需求;
CompBO:使用组合优化器进行贝叶斯优化。
项目地址:https://github.com/huawei-noah/HEBO
河伯算法是华为诺亚方舟决策与推理(DMnR)实验室开发的贝叶斯优化库。该算法击败了 NVIDIA、IBM、Jetbrain 等,以 93.519 得分赢得了 AI 国际顶会 NeurIPS 2020 的黑盒优化竞赛冠军。
HEBO 是与前 5 名竞争对手之间差异最大的算法,以非常大的优势获胜。下面是比赛结果的截图:
完整榜单:https://bbochallenge.com/leaderboard/
T-LBO 算法
该算法出自论文《High-Dimensional Bayesian Optimisation with Variational Autoencoders and Deep Metric Learning》,全篇 42 页,研究者来自华为诺亚方舟实验室。
论文地址:https://arxiv.org/pdf/2106.03609.pdf
研究者提出了一种基于深度度量学习的方法,以使用变分自编码器(VAE)在高维结构化空间中执行贝叶斯优化。通过扩展监督深度度量学习的想法,他们解决了高维 VAE 贝叶斯优化中长期存在的一个问题,即如何将判别式隐空间作为归纳偏置来执行。重要的是,研究者仅使用以往工作的 1% 的标记数据就实现了这种归纳偏置,显示出了所提方法面向样本的高效性。
在实验中,研究者展示了在真实世界高维黑盒优化问题(包括属性引导的分子生成)上的 SOTA 结果。他们希望,本文展示的结果可以作为实现高效高维贝叶斯优化的指导原则。
02# 极链新动态
极链AI云元旦活动即将开启!
七大活动等你打卡!
完成任务即可获得丰厚云币券奖励!
完成任意两个活动即可获得惊喜大礼包!
活动将于12月31日开启,持续两周哦~
活动详情请关注【极链AI云】公众号
1. 图像分类分割模型SegNet上线
SegNet是Cambridge提出旨在解决自动驾驶或者智能机器人的图像语义分割深度网络,开放源码,基于caffe框架。SegNet基于FCN,修改VGG-16网络得到的语义分割网络,有两种版本的SegNet,分别为SegNet与Bayesian SegNet,同时SegNet作者根据网络的深度提供了一个basic版(浅网络)。
2. 图像分类分割模型RefineNet上线
RefineNet提出了多路径网络,利用多级别的抽象用于高分辨率语义分割;通过使用带残差连接的同态映射构建所有组件,梯度能够在短距离和长距离传播,从而实现端到端的训练;提出了链式残差池化模块,从较大的图像区域俘获背景上下文。使用多个窗口尺寸获得有效的池化特征,并使用残差连接和学习到的权重融合到一起。
03# 程序员专区
MyBatis 3.5.9 发布
MyBatis 3.5.9正式发布,该版本主要更新是nullable添加到. 如果启用该配置,程序会在遇到null时跳过,而不是抛出异常。如果要全局启用此功能,请在配置中设置 nullableOnForEach=true。此外需要注意的是,MyBatis的pom.xml中Log4J依赖的范围是“可选的”,意味着你可以在你可以在没有Log4J的情况下使用 MyBatis、将MyBatis添加到项目的依赖项中不会隐式引入Log4J、更新MyBatis版本不会使您的项目更安全,因为它不会影响您项目中的Log4J版本。
Apache Pulsar 2.9.1发布
Apache Pulsar 2.9.1 版本在 2.9.0 版本的基础上解决了 log4j2 的漏洞问题。该版本引入了5个新特性和一些重大版本改进,例如PIP-45 Pluggable元数据接口引入了关于ZooKeeper元数据管理的许多变化:一致性、弹性、稳定性、减少代码重复等,升级log4j版本等。
systemd 250 发布重大更新
systemd 250在发布多个候选版本之后,正式版已于上周发布,该版本发布了多项功能更新与改进。例如添加了对加密和验证凭据的支持,systemd-gpt-auto-generator可以自动设置可发现,扩展GPT可发现分区规范等。
R for Windows 4.1.2 发布
R for Windows是应用于Windows操作系统的R语言编程环境,目前发布了4.1.2版本,该版本弃用了旧的S-compatibility macros PROBLEM、MESSAGE、ERROR、WARN、WARNING、RECOVER……并会在R 4.2.0版本中隐藏。Rf_error和Rf_warning一直是R的首选本地接口。
标签:磷酸化,PhosIDN,贝叶斯,河伯,诺亚,版本,优化,蛋白质 来源: https://blog.csdn.net/m0_60673947/article/details/122267065