10月16日,联想在美国西雅图召开了Tech World 2024大会。就像大多数科技公司举办此类活动时一样,联想也一股脑地将自家最新的技术成果公诸于世,发布了新一代Neptune海神液冷服务器;最新的ThinkPad X1 AI PC;联想个人AI 智能体“AI Now”,还有Learning Zone软件平台。
上周,英国风投机构AirStreet资本连续第7年发布了年度AI报告(State of AI 2024)。它火过一阵,但在ChatGPT发布近两年后,AI成为了全球最热的投资领域,科技巨头及其挑战者的进展,早已事无巨细地被迅速展现在投资者面前,它又少了一点新鲜感。
英伟达H100 GPU在2023年3月上市之后,因需求激增供不应求,其租赁价格从最初的每小时4.7美元一度飙升至每小时8美元以上。但今年以来,H100开始“供过于求”,每小时租赁价格降至2美元左右。 价格下跌是多方因素导致的:1)有些长期预订H100的公司完成模型训练之后,转售闲置未使用的算力;2)许多公司不再从头训练新模型,转而微调开放模型,算力需求大幅降低;3)专注构建大规模基础模型的新创公司数量大幅减少;4)H100的替代品出现,如AMD和英特尔GPU,等等。
从2024年开始,采购和租用算力设备的企业减少了;2024年下半年以来,算力中心的机架出现了一定程度的空置;曾被炒到15万元一块的英伟达高性能加速卡A100的价格不再上涨,另一款性能配置相对较低的4090显卡被算力企业频繁采购用作算力加速芯片。
在Advancing AI 2024大会上,AMD正式发布了新款GPU加速卡“Instinct MI325X”。它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。
2024年9月21日,北京猿界云计算科技有限公司(猿界算力)与内蒙古赤峰市红山区人民政府在赤峰市隆重举行了合作签约仪式。红山区人民政府区长赵兰广、副区长赵彤、政府办公室主任贾广盛、发改委主任郭凤军、住建局局长刘金波、综合执法局局长孟昌瑞、政数局局长寇明星、蒙东云计算中心主任王锐、自然资源分局副局长孙剑、区国资公司董事长孙孝康、招商大使兰秀梅等共同出席。猿界算力董事长温享晖、副总经理王超、集成运维部总经理邢递斌、投资部总经理于丽颖,及资本合作方代表韩卫军等共同出席。
在AGI(通用人工智能)这件事情上,OpenAI是个风向标,全世界都在看它的动作、受它的指引。其创始人奥特曼却说,任何试图在我们爆炸半径内建立的初创公司或产品,都会被碾压。 于是一个宿命般的问题放在全球AGI创业者面前:在跟随技术指引的同时,又如何不被巨头碾压?总有些AGI初创企业并不“认命”,在算力和数据资源双双匮乏的不利条件下,力图走出一条不同于OpenAI发展方向的道路。
2020年前后,国内半导体行业GPU创业潮兴起,吸引数百亿资金迅速涌入。但如今潮水退去,一家昔日的独角兽已经站到了悬崖边上。 9月1日,界面新闻从多名知情人士处得知,融资20多亿、估值高达150多亿元的国产GPU公司象帝先计算技术(重庆)有限公司(以下简称“象帝先”)于8月30日召开全员会议,宣布公司遭遇资金危机,计划与员工终止劳动合同。
Hot Chips上,IBM宣布推出针对AI时代的下一代企业计算产品,包括全新Telum II处理器和Spyre AI加速器,预计这两款芯片都将于2025年上市。 首先,是Telum II处理器。早在2021年,IBM就推出了第一代的Telum处理器,当时就采用了全新的核心构架,并针对AI加速优化,采用三星7nm制程技术,核心面积530mm²,225亿个晶体管,8核心16线程,主频超过5GHz。
英伟达“好于预期,但没有大幅好于”的营收表现,以及黄仁勋在财报电话会上类似“今天很好,后天也很好”的解释,没有打动华尔街,盘后股价下跌了8%。它要尽快澄清头顶上的数朵乌云。
韩国总统尹锡烈在今年4月表示,到2027年,韩国将在人工智能领域投资9.4万亿韩元(69.4亿美元),以保持在尖端半导体芯片领域全球领先地位的努力之一。此外,韩国的K-Cloud项目也在大力补贴AI数据中心专用于处理机器学习算法的NPU芯片的开发。韩国总统设定的目标是,到2030年,韩国要成为包括芯片在内的人工智能技术领域前三大国家之一,并在全球系统半导体市场占据10%以上的份额。
7月25日,韩国存储芯片巨头SK海力士发布2024财年第二季度财报。受益于AI对先进存储需求的强劲推动,该公司业绩全面大涨,二季度营收为16.4万亿韩元(约118亿美元),比去年同期大涨125%,刷新了2022年创下的13.8万亿韩元的单季度历史最高纪录。