scaling

scaling最新资讯，Scaling Law瓶颈，Cursor编程为什么这么强？新研究掏出秘密武器论文开篇，该团队提到强化学习教父 Sutton 的经典文章《The Bitter Lesson（苦涩的教训）》揭示的 Scaling Law 的两大核心原则：学习和搜索。随着大型语言模型的迅猛发展，人们对于「学习」是否有效的疑虑已基本消除。

当前，#scaling#的话题页面正在精心打磨中。我们即将为您呈现一系列精彩纷呈的文章、图片和视频内容，让您全面而深入地了解这一热门话题的方方面面。我们的团队正全力以赴，从互联网和各大合作伙伴站点中搜集最新鲜、最权威的信息，确保我们的内容始终与时俱进，准确无误。请您持续关注我们的更新，我们承诺，将为您带来最新、最全面的信息，让您不错过任何精彩瞬间！

最新

【上证计算机】大模型Scaling Law开启新范式，端侧智能加速落地

我们认为，OpenAI o1模型的发布，是AGI下半场的开始，强化学习+思维链推理开启了大模型Scaling Law的新范式。苹果首款AI手机发布，荣耀手机首发AI Agent。（1）苹果：9月10日，苹果举行秋季新品发布会，iPhone 16系列、Apple ...

Scaling Law瓶颈，Cursor编程为什么这么强？新研究掏出秘密武器

论文开篇，该团队提到强化学习教父 Sutton 的经典文章《The Bitter Lesson（苦涩的教训）》揭示的 Scaling Law 的两大核心原则：学习和搜索。随着大型语言模型的迅猛发展，人们对于「学习」是否有效的疑虑已基本消除。然而，在...

Scaling Law瓶颈，Cursor编程为什么这么强？团队参与新研究掏出秘密武器

图灵奖得主专访:我不想把大模型未来押注在Scaling Law上

不过当然了，我过去也曾做出过错误的判断，我没想到Scaling带来了ChatGPT，这是我未曾想到的。关于如何提升大模型的性能，AI领域的研究者们仍然存在很大的分歧。有人认为，只需扩大模型规模、增加算力和数据、提升计算效率等，...

Scaling Law会失效吗？李开复、杨植麟、王小川等五家大模型企业CEO表态_未来2%_澎湃新闻-The Paper

北京零一万物科技有限公司（简称零一万物）CEO李开复表示，Scaling Law已被验证有效并且尚未达到顶峰，但利用尺度定律不能盲目堆GPU，仅仅依靠堆砌更多算力提升模型效果，只会导致那些拥有足够多GPU的公司或国家才能胜出。要让...

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它-The Paper

Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实现性能最大化。之前已有不少研究探索过神经语言模型的 Scaling law，而这些研究通常得出的结论是参数和训练 token 数应当一比一地扩展。但是，之前...

智谱AI入局AI生成视频张鹏:积极在模型层面探索更高效的scaling方式

“我们积极在模型层面探索更高效的scaling方式。在智谱OpenDay上，智谱AICEO张鹏表示：“随着算法、数据不断迭代，相信ScalingLaw将继续发挥强有力作用。他认为，在生成式视频模型的研发中，ScalingLaw（规模定律）继续在算法...

非共识问题成为WAIC热议焦点，大模型Scaling Law是否继续有效？

Scaling Law（缩放定律）的“指引”下，此前大模型厂商朝着加大训练数据、加大算力投入、堆积参数的道路前进，模型一代代“膨胀”。但GPT-5迟迟未能推出，又似乎预示着模型快速迭代受阻，Scaling Law遇到困难。“我留意到各方...

C.AI被收购的宿命论与万恶的Scaling Law

聊C.AI不能只聊C.AI，更不能只聊陪聊类产品，因为这些都是表象。如果从背后更深一层的商业逻辑来看，我们就会发现C.AI被收购几乎是一种必然，这就是典型的个体在整个商业世界运作规则之下的命运轨迹的缩影。最近很多人在谈论C....

腾讯混元、北大发现Scaling law“浪涌现象”解决学习率调参难题_澎湃号·湃客_澎湃新闻-The Paper

论文：Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling 论文地址：https://arxiv.org/pdf/2405.14578 1.当使用 SGD 风格的优化器时，应当采用 OpenAI 2018 年给出的结论（https://arxiv.org/pdf/1812.06162...

关注喜欢的作者

参与互动讨论

作品投稿

scaling