
亚马逊云劳动与芯片初创公司Cerebras书记罢了多年配合条约,将在其数据中心部署Cerebras芯片,用于AI推理规画。
3月13日周五,凭据两边公布的条约,云劳动将把Cerebras芯片与自研Trainium芯片组合部署,以提供更高速的推理规画劳动。
这亦然继本年1月OpenAI与Cerebras签署逾百亿好意思元配合条约之后,这家初创公司再度得到大型科技巨头背书。
Cerebras将其芯片标榜为“极速推融会决决策”,并示意它们不错处理被称为“解码”的复杂任务,即推理规画阶段,东说念主工智能模子在此阶段对用户查询作念出反映,速率比的GPU快25倍。
这次配合对Cerebras的生意邦畿具有挫折真谛。Cerebras首席推广官Andrew Feldman示意:
越来越多的东说念主使用东说念主工智能,使用频率也越来越高,况且用它来处理更复杂的问题。这使得Cerebras-Trainium处理决策或者接入最大的云平台,让咱们有契机战役到多数的客户。
推理市集崛起,GPU主导地位受压
AI行业算力需求的重点正悄然转动。
跟着AI器具和智能体的用户界限马上膨胀,雅博app官网入口考研阶段的算力需求趋于实足,推理规画的挫折性日益突显。企业广漠意识到,GPU虽在模子考研中发达出色,但在条件极致反映速率的推理使命负载上并非最优遴荐,这促使各方加速多元化供应商布局。
AWS四肢大家最大的云劳动提供商,此前主要依赖旗下Annapurna Labs半导体业务遐想的Trainium芯片为数据中心提供算力支撑。
这次引入Cerebras芯片,意在弥补Trainium在高速推理场景下的局限,M6体育app官网并在推理产物线上提供分层订价决策,速率较慢的纯Trainium劳动将以更廉价钱提供,而Cerebras与Trainium的组合决策则定位高端。
AWS伙同创举东说念主、副总裁Nafea Bshara示意,该公司的观点是\"执续鼓动速率提高并裁减价钱\"。Feldman则直言:
要是你但愿得到快速token输出,要是速率对你至关挫折,要是你在从事代码或智能体使命,咱们不仅是完全最快的,而且咱们意在设定行业法子。
英伟达压力加重,定制芯片势力膨胀
开云体育(kaiyun)官网这笔交往是英伟达濒临日益蛮横竞争的缩影。
定制处理器遐想商正以专项场景冲突的情势蚕食英伟达的市集份额,客户对更快速率和更低老本的诉求也在倒逼芯片巨头加速产物迭代。
据报说念,英伟达旧年12月与芯片初创公司Groq签署了一项价值200亿好意思元的授权条约,并规画于近期发布接纳Groq时刻、特意面向推理场景的新式处理系统。
关于Cerebras而言,与AWS的配合发生在其业务高速膨胀的要津节点。
本年2月,Cerebras书记完成10亿好意思元新一轮融资,累计融资总和升至26亿好意思元,投后估值约为230亿好意思元。
本年1月,ChatGPT缔造商OpenAI签署了一项价值逾百亿好意思元的条约,部署Cerebras芯片为其旗舰聊天机器东说念主提供算力支撑,OpenAI规画使用Cerebras芯片部署最高750兆瓦的算力。
这家初创公司背后积蓄了富达照管(Fidelity Management)、Atreides Management、Benchmark、Tiger Global和Coatue等一线机构投资者的支撑,但此前曾一度濒临融资勤勉。
Cerebras曾于2024年9月提交IPO恳求,但约一年后裁撤了上市文献。上市规画何时重启,现在尚无定论。