
SERVICE PHONE
363050.com发布时间:2025-04-09 16:09:26 点击量:
英伟达一夜回血!马斯克狂烧30亿GPU给老黄续命,10倍算力创Scaling Law神线
【新智元导读】一度狂跌的英伟达股价,又被Grok-3盘活了?20万块GPU训出的模型超越DeepSeek和OpenAI,证明Scaling Law还在继续增长!Ai2研究者大佬直言:Grok-3,就是DeepSeek给美国AI企业压力的又一力证。
在算力提升10倍的情况下,Scaling Law仍在呈线性增长。既然能通过扩大预训练规模,成功打造一个性能顶尖的非推理模型,就说明尽管预训练代价高昂,但仍有很大发展空间。
另外,目前Grok-3是闭源的,每月收费30美元,仅在未来几个月计划开源Grok-2。
而DeepSeek已经以开源策略吸引了全球开发者,集成到了微信、百度、腾讯等主流应用,在生态上领先一步。
这引起了xAI的研究科学家、参与Grok项目的林禹臣(Bill Yuchen Lin)的注意,他表示目前Grok-3还在测试,但每天都应该更好、更稳定。
在这道题中,两个模型需要分析马斯克关于AI安全的最近50篇文字,确定关键主题,并与LeCun发表的法语帖子进行对比。
结果是Grok-3完胜,它有效确定了关键主题和对比的位置;而DeepSeek败在了多语言解析和上下文分析这一步。
这一题的任务是,「根据Prater博士在X上关于量子比特扩展的帖子,生成一张FLUX风格的量子计算机设计图。」
使用BeautifulSoup编写一个Python脚本,从EDGAR抓取SEC文件,并包含针对速率限制的错误处理。
艾伦人工智能研究所(Ai2)的Nathan Lambert认为,Grok-3的发布的确意味着AI发展新阶段。
自DeepSeek-V3/R1发布以来,AI技术的发展既不是少数几家公司的专利,发展速度也没有放缓。
Grok 3凭借规模优势超越现有模型的情况,让人回想起Nemotron 340B超越Llama 3 70B的时刻。当时Nemotron虽然成为了开源模型中的佼佼者,但由于其性能提升相对于成本投入来说性价比不高,市场接受度一直较低。
总的来说,尽管Grok-3在技术上取得了重大突破,但这并不意味着在模型高效训练领域的竞争格局发生了实质性改变。