其他分享
首页 > 其他分享> > 乘风破浪,遇见未来元宇宙(Metaverse)之微软和Meta战略合作,选择Azure作为战略云供应商,帮助加速人工智能的研究和开发

乘风破浪,遇见未来元宇宙(Metaverse)之微软和Meta战略合作,选择Azure作为战略云供应商,帮助加速人工智能的研究和开发

作者:互联网

2022年5月25日,Meta公司选择Azure作为战略云供应商,推进人工智能创新,深化PyTorch合作

https://azure.microsoft.com/en-us/blog/meta-selects-azure-as-strategic-cloud-provider-to-advance-ai-innovation-and-deepen-pytorch-collaboration/

image

微软致力于负责任地推进人工智能的发展,使每个人和组织都能取得更大的成就。在过去的几个月里,我们谈到了我们的Azure基础设施、Azure认知服务和Azure机器学习的进步,以使Azure更好地支持我们所有客户的AI需求,无论其规模如何。同时,我们还与世界上一些领先的研究机构密切合作,使他们能够建立伟大的人工智能。

今天,我们很高兴地宣布,我们与Meta的合作正在扩大。Meta公司已经选择Azure作为战略云提供商,帮助加速人工智能的研究和开发

https://azure.microsoft.com/zh-cn/blog/microsoft-expands-its-aisupercomputer-lineup-with-general-availability-of-the-latest-80gb-nvidia-a100-gpus-in-azure-claims/

作为这种深入关系的一部分,Meta公司将扩大对Azure超级计算能力的使用,以加速其Meta人工智能小组的人工智能研究和开发。Meta公司将利用由5400个GPU组成的专用Azure集群,使用Azure中最新的虚拟机(VM)系列(NDm A100 v4系列,采用英伟达A100 Tensor Core 80GB GPU),用于其部分大规模AI研究工作负载。2021年,Meta公司在体验了Azure令人印象深刻的性能和规模之后,开始使用微软Azure虚拟机(NVIDIA A100 80GB GPU)进行一些大规模的AI研究。与其他公共云产品相比,虚拟机之间的GPU-to-GPU带宽是四倍,Azure平台能够实现更快的分布式人工智能训练。例如,Meta利用这一点来训练他们最近的OPT-175B语言模型Azure上的NDm A100 v4虚拟机系列还为客户提供了灵活性,可以自动和动态地配置任何规模的集群,从几个GPU到几千个,并能够在实验期间暂停和恢复。现在,Meta AI团队正在扩大使用范围,将更多前沿的机器学习训练工作负载带到Azure,以帮助进一步推进他们领先的AI研究。

此外,Meta和微软将合作扩大PyTorch在Azure上的应用,并加速开发者从实验到生产的过程。Azure为PyTorch用户提供了一个全面的自上而下的堆栈,拥有一流的硬件(NDv4s和Infiniband)。在未来几个月,微软将建立新的PyTorch开发加速器,以促进在Azure上快速实施基于PyTorch的解决方案。微软还将继续为PyTorch提供企业级支持,使客户和合作伙伴能够在云和边缘的生产中部署PyTorch模型。

Meta公司人工智能副总裁Jerome Pesenti表示:"我们很高兴能深化与Azure的合作,以惠及全球更多开发者的方式推进Meta的人工智能研究、创新和开源工作。"有了Azure的计算能力和每个虚拟机1.6TB/s的互连带宽,我们能够加快我们不断增长的训练需求,以更好地适应更大和更创新的AI模型。此外,我们很高兴与微软合作,将我们的经验扩展到他们的客户,在他们从研究到生产的旅程中使用PyTorch。"

通过扩展Azure的超级计算能力,为全球领先的研究机构训练大型人工智能模型,并通过扩大开源合作和实验的工具和资源,我们可以帮助为开发人员和更广泛的技术社区释放新的机会,并进一步推动我们的使命,以增强世界各地的每个人和组织。

标签:人工智能,Metaverse,AI,PyTorch,Meta,Azure,GPU
来源: https://www.cnblogs.com/taylorshi/p/16315383.html