微软亚洲研究院公开新MoE库并在InfiniBand网络相关节点进行实验

发布时间：2021-11-29 15:33:40 | 来源：IT之家

据微软亚洲研究院发布，作为目前唯一被证明能够将深度学模型扩展到万亿以上参数的方法，MoE 能让模型学更多信息。

并为计算机视觉、语音识别、自然语言处理和机器翻译系统等提供支持。

日前微软亚洲研究院发布了一个高能 MoE 库 ——Tutel，并在 8x 80GB NVIDIA A100 和 8x 200Gbps 的 InfiniBand 网络的 Azure NDm A100 v4 节点上进行了实验。

让我们来看一看，这个用于促进大规模 DNN 模型开发的高能 MoE 库有哪些优势?其表现又如何?

混合专家(Mixture-of-Experts，简称 MoE)是一种深度学模型架构，其计算成本与参数的数量呈次线关系，因此更容易扩展。

MoE 是目前唯一被证明能够将深度学模型扩展到万亿以上参数的方法，它能让模型学更多信息。

并为计算机视觉、语音识别、自然语言处理和机器翻译系统等提供支持，从而以全新的方式为人类社会提供帮助。

微软亚洲研究院发布了一个用于促进大规模 DNN 模型开发的高能 MoE 库 ——Tutel，并针对已普遍使用的新 Azure NDm A100 v4 系列进行了高度优化。

关键词：微软 MoE库 Tutel

滚动

新闻排行

储水式电热水器储水式电热水器使用方法

lenovo联想a60综合评测与报价联想a60到底具备了哪些优势3全球快播报

国产智能机排行介绍国产智能机的排行都是哪些0天天聚看点

金士顿4g内存条多少钱金士顿4g内存条价格

焦点播报:如何清除系统垃圾介绍几大方法用户可手动删除或选择磁盘清理

家用黑白激光打印机哪款好惠普为何能获得黑白激光打印机霸主地位0环球报资讯

每日讯息!诺基亚1681c怎么样诺基亚1681c性能配置

菲斯曼地暖有什么好处供暖稳定关闭后散热慢月使用费用经济实惠3世界看热讯

数字万用表电路图图集及简析如何使用多用途电子测量仪器

全球今日讯！尼康2470一代和二代的区别尼康2470一代和二代的区别分析

关于我们　-　联系我们　-　版权声明　-　招聘信息　-　友链交换

2014-2020 电脑商网版权所有. All Rights Reserved.

备案号：京ICP备2022022245号-1 未经过本站允许,请勿将本站内容传播或复制.

联系我们:435 226 40@qq.com