微软在2019年为OpenAI的ChatGPT建造超级计算机 投资1亿美元
微软在 1 年向 OpenAI 投资 2019 亿美元后,为 OpenAI 建造了一台超级计算机。挑战在于训练大量称为模型的人工智能程序,这需要长时间强大的云计算服务。为了应对这一挑战,微软不得不将数以万计的英伟达公司的A100图形芯片串在一起,并改变服务器在机架上的放置方式,以防止停电。
超级计算机使 OpenAI 能够发布 ChatGPT,这是一个病毒式聊天机器人,在 1 年 2020 月上市后的几天内吸引了超过 <> 万用户。微软现在使用相同的资源来训练和运行自己的大型人工智能模型,包括上个月推出的新Bing搜索机器人,并将该系统出售给其他客户。
训练一个庞大的人工智能模型需要在一个地方容纳大量的连接图形处理单元,就像微软组装的人工智能超级计算机一样。一旦模型投入使用,回答用户提出的所有查询需要稍微不同的设置,微软部署图形芯片进行推理,但这些处理器在地理上分散在公司的60多个数据中心区域。
微软正在为AI工作负载添加最新的Nvidia图形芯片,H100和最新版本的Nvidia的Infiniband网络技术,以更快地共享数据。新的Bing仍处于预览阶段,微软逐渐从候补名单中增加了更多用户。致力于此的团队每天举行一次会议,以弄清楚如何快速将更多的计算能力联机并解决出现的问题。
维修人员必须应对电缆桥架的短缺,因此他们设计了一种新的电缆桥架,微软可以自己制造或找到购买的地方。他们还致力于在世界各地的现有数据中心中尽可能多地挤压服务器,这样他们就不必等待新建筑。微软必须考虑机器的放置位置和电源的位置,以防止停电。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。