DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报-Kaiyun官方定制平台

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报

2025-07-08 00:08:06 小编大中小

　　昨日，X 博主 @legit_api 曝光了马斯克旗下 xAI 即将发布的新一代模型 Grok-4 及其编程版本 Grok-4 Code 的一组基准测试成绩，引发关注。

　　在被称为「人类最后的考试」（HLE）的评估中，Grok-4 取得了 35% 的基础得分，开启推理功能后进一步提升至 45%，显著领先于 OpenAI 的 o3 以及 Google Gemini 系列在该测试中的表现。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图1)

　　不过，部分网友对其成绩的真实性提出质疑，认为该分数「过于理想」，不排除存在测试策略优化甚至「刷榜」的可能。尽管如此，从目前流出的功能配置来看，Grok-4 系列相较前代已实现大幅升级。

　　根据此前的爆料信息，新版本模型将支持多模态输入（文字+图像）、130k token 上下文、结构化输出、数学推理和函数调用等功能。其中，Grok 4 Code 将深度集成在 Cursor 编辑器中，具备智能补全、调试和执行功能，力图打造「主动编程」的 AI 助手。

　　6 月 30 日，华为宣布正式开源盘古系列中的 7B 稠密模型及 72B 混合专家模型。然而，部分网友质疑其模型或与阿里云通义千问 Qwen-2.5 14B 存在高度相似之处，甚至指向「抄袭」。

　　对此，华为诺亚方舟实验室昨日发布声明回应，强调盘古 Pro MoE 模型是在昇腾硬件平台上独立开发和训练的基础大模型，研发过程未基于其他厂商的模型进行增量训练。

　　盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来，在架构设计、技术特性等方面做了关键创新，是全球首个面向昇腾硬件平台设计的同规格混合专家模型，创新性地提出了分组混合专家模型（MoGE）架构，有效解决了大规模分布式训练的负载均衡难题，提升训练效率。其他技术特性创新，请参考昇腾生态竞争力系列技术报告披露内容。

　　感谢全球开发者与合作伙伴对盘古大模型的关注和支持，我们高度重视开源社区的建设性意见。希望通过盘古大模型开源，与志同道合的伙伴一起，探索并不断优化模型能力，加速技术突破与产业落地。

　　我们欢迎并期待大家在开源社区 Ascend Tribe，就技术细节进行深入、专业的交流

　　硅谷热门初创公司 Cluely 在推出其全新企业版 AI 产品后一周内，年经常性收入（ARR）翻番至 700 万美元。

　　ARR 是指基于当前客户订阅合同，预计未来 12 个月内能持续获得的收入。常见于 SaaS 和订阅制商业模式，用来衡量「稳定性」和「未来收入规模」。

　　Cluely 利用 AI 技术，实时分析用户在线对话，为用户生成笔记、提供上下文并推荐提问内容，这些信息以隐蔽形式显示在屏幕上，仅用户本人可见。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图2)

　　创始人 Roy Lee 曾在 X 平台发文称，因其在哥伦比亚大学期间与人合作开发用于「面试作弊」的工具而被学校停学。随后，他将这一技术转化为商业产品并创办 Cluely，早期甚至使用「帮你在一切上作弊」作为营销口号。

　　Lee 介绍称，Cluely 企业版与消费者版本相似，但额外提供了团队管理和更强的数据安全功能，广泛应用于销售、客服和远程教学等场景，其中最受用户欢迎的功能是实时会议记录。

　　不过，一家名为 Pickle 的初创公司在 X 上宣称，已开发出一款名为 Glass 的免费开源产品，具备与 Cluely 相似的实时记录功能。面对免费山寨产品来势汹汹，Cluely 能否维持其增长势头，仍待市场检验。

　　据《晚点 Auto》援引中国供应链的信息显示，特斯拉正在集中调整人形机器人 Optimus 软硬件技术细节，并于半个月前开始暂停采购 Optimus 的零部件。

　　据两位供应商人士说，特斯拉并未明确表示会减少机器人零件订单，但要等到 Optimus 设计调整完后才会确定新的量产计划并重启采购，调整可能需要 2 个月。

　　此次调整始于 6 月初特斯拉 Optimus 项目原负责人 Milan Kovac 离职。据供应商人士称，特斯拉 AI 软件副总裁 Ashok Elluswamy 接手 Optimus 项目，希望改善完设计方案后再推动量产计划。Ashok 此前领导特斯拉 FSD 的软件开发工作，已在特斯拉工作 11 年。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图3)

　　据特斯拉对供应商的反馈，硬件上 Optimus 还面临部分关节电机容易过热、灵巧手负载能力低、传动装置寿命短、续航短等问题。目前特斯拉仍在寻找多个灵巧手供应商送样，尝试至少 3 种不同的技术路线。

　　软件层面，特斯拉可能会使用更多合成数据训练机器人模型，提升 Optimus 的自主操作能力和完成复杂动作的成功率。

　　据悉，特斯拉 CEO 马斯克曾公开表示，新版 Optimus 的性能比特斯拉 2023 年亮相的第二代 Optimus 大幅改进，且加入了 Grok 支持的语音交互功能。

　　据了解，截至今年 5 月底，特斯拉今年累计采购了足够生产 1200 台 Optimus 的零件，并生产了接近 1000 台。此前马斯克承诺今年生产 5000 台。前述两位人士都认为，随着零部件采购中断，该目标基本无法达成。

　　一则题为《演员王一博案，判了》的报道文章称 DeepSeek 因误传艺人王一博涉及某腐败案，已发布道歉声明，并引用了所谓「刑事判决书」作为佐证。文章迅速登上热搜，「DeepSeek 向王一博道歉」成为讨论焦点。

　　经过多轮事实核查，这份道歉声明完全是网友诱导 AI 自动生成的内容，但由于措辞专业、结构完整、语气严肃，部分媒体在未经核实的情况下将其误当成真实公告进行传播，造成了广泛误解。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图4)

　　事件在社交平台进一步发酵，被网友称为 AI「垃圾进、垃圾出」的典型案例——由于虚假文本的广泛传播，这些内容反过来被其他 AI 系统「学习」并纳入语料，形成事实污染。

　　一些不明真相的用户甚至开始引用该声明作为信息来源，使得误导信息呈现出滚雪球式的扩散趋势。虽然 DeepSeek 给王一博道歉是假的，但要警惕 AI 谎言泛滥却是真的。

　　AI 幻觉是其固有的局限之一，当 AI 模型没有得到正确的指导时，它会根据用户输入的数据生成不准确的内容，甚至被用来捏造信息

　　早期搜索引擎也曾因「自动联想功能」被滥用而遭遇尴尬，许多系统在面对用户非正常输入时，容易输出荒谬的内容。随着 AI 的普及，类似的「AI 幻觉」事件可能会越来越多，只有当公众意识到这一点时，AI 的影响力才会回归理性。

　　7 月 2 日，百度在 AI Day上宣布，百度搜索框正式升级为「智能框」。与传统的关键词搜索不同，新的智能框支持更直观的多模态输入：

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图5)

　　此外，百度还进一步整合了基于文心大模型、视频生成模型 Muse Steamer 等的 AI 工具，提供更高效的创作能力。尤其在视频生成方面，百度的技术可以在几分钟内生成电影级别的短视频，为用户提供更加丰富的视觉和创作体验。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图6)

　　这也是扎克伯格持续重金招募 AI 人才行动的一部分。Gross 是知名创业者和 AI 投资人，此次跳槽表明科技巨头之间的人才争夺战正愈演愈烈。此前 Meta 曾试图直接收购 SSI，但被 Ilya 拒绝。

　　Ilya 表示，SSI 将继续保持独立运营，专注于构建「安全的超级智能」。他在社交平台上写道：「我们拥有算力、团队，也知道该做什么。会坚定走下去。」

　　目前，SSI 的技术团队继续向 Ilya 汇报，联合创始人 Daniel Levy 将担任公司总裁。据悉，该公司在 4 月的融资中估值达 320 亿美元。

　　随着 AI 竞赛加剧，科技巨头们纷纷加大投资力度，推动数据中心建设的规模和数量达到前所未有的水平。

　　Amazon 在印第安纳州新建的 1200 英亩数据中心，将与 AI 初创公司 Anthropic 合作，预计将用于训练全球最大规模的 AI 系统，试图用这座「AI 工厂」全力抢占算力高地。

　　而传统科技巨头甲骨文（Oracle）也正在通过一场罕见的 AI 基建豪赌，在全球算力竞赛中实现逆转。尽管市场的聚光灯集中在 AWS 和 Azure 上，Oracle 已悄然通过一系列非典型策略，建立了强大的去中心化、资本效率极高的 AI 云基础设施。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图7)

　　此外，Meta 和 OpenAI 也在各自的项目中投入数百亿美元，建设类似规模的设施。

　　这些新建数据中心不仅能源消耗巨大，预计将耗费超过 3200 亿美元，且每年用电量相当于百万家庭的需求。尽管有专家质疑如此快速发展的 AI 是否能持续，但行业普遍认为，错失机会的风险远大于投资过度。

　　随着越来越多的数据中心相继投入建设，Oracle、Amazon 和其他科技巨头的战略布局，正在推动 AI 基础设施进入新的增长周期。

　　Meta CEO 扎克伯格在当时时间周一发布的一封内部信中透露，MSL 将整合公司现有的基础 AI 研究（FAIR）、大语言模型开发以及 AI 产品团队，并组建一个专门研发下一代 AI 模型的新实验室。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图8)

　　据悉，Meta 计划在未来几年投入数千亿美元于 AI 基础设施、模型训练、可穿戴终端与人才储备上。新团队未来还将启动 Llama 系列之后的下一代模型研发，目标是在一年内实现行业领先。

　　据《Wired》报道，OpenAI CEO Sam Altman 在当地时间周一晚的一封内部信中，对扎克伯格旗下的 Meta 的挖人行动进行了抨击，认为该行为会导致 Meta 的企业文化受到严重影响。

　　Altman 在信中表示，Meta 的挖人行为令人反感，「未来还将会更加疯狂」。

　　同时，Altman 还表示，Meta 确实招揽了一批优秀人才，但很难能让人认为他们能招揽到核心人才，其还称「Meta 不得不从排名列表相对靠后的位置进行选择」。「我为整个行业的使命感感到骄傲，当然总会有一些唯利是图的人。」

　　日前，一个名为「DeepSeek R1T2」的模型走红，值得一提的是，这一个「野生模型」速度比原版 R1 还快。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图9)

　　官方公布的数据显示，「DeepSeek R1T2」比 DeepSeek R1(0528) 版本快两倍，比 R1 快 20%。不仅在速度上有优势，其在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，比较遗憾的是未达到 R1(0528) 的水平。

　　日前，百度 AI 正式宣布，旗下文心 4.5 系列模型正式开源，共计 10 款模型开源，涵盖了激活参数规模分别为 47B 和 3B 的 MoE 模型，以及 0.3B 的稠密参数模型。

　　Kaiyun的服务范围有哪些？

　　据介绍，文心 4.5 系列模型均使用飞桨深度学习框架进行训练、推理和部署。

　　该系列模型在多个文本和多模态基准测试中达到 SOTA 水平，在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。另外，模型权重按照 Apache 2.0 协议开源，支持开展学术研究和产业应用。

　　目前，文心 4.5 系列模型现可在文心一言进行体验。另外，本次发布的全部模型（包括预训练权重和推理代码）和项目均已完全开源至 Hugging Face、GitHub、飞桨星河社区，技术报告也已公布查阅。

　　星流 Agent继承了Lovart海外版本的核心功能，能够根据自然语言生成一整套设计物料，涵盖主图、海报、社交媒体封面、视频动画以及 3D 模型等多种创作形式。

　　用户只需输入简洁的需求，Agent 即可自动拆解任务、确定设计风格，并生成包括主图、延展图和社交媒体封面在内的全套视觉素材。

　　此外，星流 Agent 还加入了「无边画布」和智能协作编辑功能，支持用户进行多轮对话式改图、修图、换图及构图调整，极大提高了设计效率与创作自由度。

　　在技术层面，星流 Agent 接入了多种模型，能够根据需求自动选择最合适的模型组合，完成图像、视频、音频以及 3D 内容的生成，并支持多种格式的导出。

　　目前，星流 Agent 已在 PC 端和移动端同步上线，面向广大中文创作者提供更加智能、高效的设计创作工具。

　　这一版本在原有 DiffuCoder-Instruct 的基础上，进一步引入了 Coupled-GRPO 强化学习算法进行微调，显著提升了在代码生成任务上的表现。根据官方说明，该模型在 EvalPlus 基准测试中性能提升 4.4%，并有效减轻了解码过程中对自回归偏差的依赖。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图10)

　　DiffuCoder-7B-cpGRPO 属于苹果打造的扩散式大语言模型系列，具备 76.2 亿参数，采用 bfloat16 精度训练，支持基于提示词的代码生成。其训练流程基于 DiffuCoder-7B-Instruct 初始化，并在 2.1 万条代码数据上进行一个 epoch 的后训练。

　　开发者可通过 Hugging Face 上的模型卡及 GitHub 页面（）查看详细文档与使用方法。示例代码展示了该模型如何通过扩散过程生成代码，包括提示词构建、模型加载与生成参数配置等内容，便于开发者快速上手集成。

　　值得注意的是，DiffuCoder 的架构和生成工具部分借鉴了开源项目 Dream，用于支持 Hugging Face 平台的部署发布。

　　近日，AI 生成图像创作者 @PatriciaRed_ 分享了一则用 Midjourney 工具创造的视频。该作品描绘了迪拜迈丹赛马场尘土飞扬的内侧跑道上一场赛马比赛的高角度视图。

　　图像呈现为逼线D 横截面，场景位于外圈草坪、观众看台之间，远景则是城市天际线与海岸线，整体画面被隔离于纯白背景之中。生成参数中指定了 Midjourney V7 模型版本及 4:3 的画幅比例。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图11)

　　提示词：Photorealistic 3D cross-section base, high-angle view of horses racing in the inner dust track at Dubais Meydan Racecourse, between the outer turf, the grandstands and the tribune, the sea and the cityscape in the distance, isolated on white studio background --v 7.0 --ar 4:3

　　近日，Y Combinator 更新了李飞飞在旧金山 AI 创业学校的访谈视频。李飞飞回顾了自己从创办 ImageNet 到推动深度学习和物体识别发展的一路历程，并重点提到她如今正攻克 AI 领域最具挑战性的前沿技术——空间智能。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图12)

　　李飞飞解释道，与语言模型的构建相比，空间智能的挑战更为复杂，因为人类对三维世界的感知能力相对较弱，然而她坚信，通过软硬件的融合与创新，这一难题是可以解决的。

　　李飞飞将 ImageNet 的诞生视为计算机视觉与深度学习领域的范式转变，而她现在的目标是通过攻克空间智能，继续引领人工智能的变革。她表示，AI 必须超越生成模型，进入三维世界的理解，才能真正实现 AGI。

　　至于 World Labs 的具体细节，李飞飞透露，目前不便公开过多，但她强调，空间智能的应用将与当前的大语言模型（LLMs）有显著区别，尤其是在推动元宇宙等新兴技术的实现过程中，3D 世界的感知将是不可或缺的一环。

　　格莱美奖主办方——美国录音学院（Recording Academy）CEO 哈维·梅森（Harvey Mason Jr.）在接受《华尔街日报》专访时表示，人工智能正在深刻改变音乐产业的创作流程、版权规则以及听众的参与方式，但他坚信，人类创作者在音乐表达中仍拥有不可取代的价值。

　　作为一位曾与碧昂丝和贾斯汀·比伯等顶级艺人合作过的资深制作人，梅森认为，AI 并非洪水猛兽，而是一种强大的工具，可以生成鼓点、和弦，甚至完整的歌词与旋律。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图13)

　　他指出，AI 的出现将颠覆传统的音乐创作流程，但也为艺术家打开了全新的表达空间，比如让无法再演唱的歌手通过 AI 「复活」嗓音，继续创作与演出。

　　面对 AI 音乐创作日渐普及的现实，梅森提出几个核心担忧：首先是音乐版权归属不清，艺术家如何在 AI 再创作中获得应有的署名和报酬；其次是，AI 若主要基于对过去音乐数据的模仿生成，是否会削弱原创性，导致音乐审美「平均化」。

　　对于业界未来是否会设立专门的「AI音乐格莱美奖」类别，梅森持开放态度，但强调「音乐就是音乐」。录音学院历史上从未按合成器或真实乐器划分奖项，而是始终鼓励一切形式的音乐创新。

　　在他看来，AI 不仅会加速歌曲创作和推荐系统的发展，还可能重塑「粉丝」与「创作者」的关系。未来的粉丝可能不再只是被动聆听，而是能主动参与创作——修改歌词、变换伴奏、甚至让偶像的 AI 分身为母亲唱生日歌。

　　对于未来是否会出现「非人类歌手」走红，梅森并不否认。他预测，AI 虚拟艺人一定会流行，但真正打动人心的，依然是那些有情感、有经验、有共鸣的人类音乐人。「AI 可以模仿技巧，但无法复制经历。」

　　梅森最后表示，AI 时代确实正在改变创作者与听众的比例，但「懂风格、懂情感、懂打动人心」的人类创作者，永远会在舞台上占据核心位置。

　　Kaiyun的服务范围有哪些？

　　日前，知名风投机构 a16z 发布一篇名为《In Consumer AI,Momentum Is the Moat》的博客，讲述了如今 AI 产品、AI 公司需要如何营销，才能在市场中站稳脚跟。

　　文章中指出，现如今 AI 发展速度太快，以至于连一家公司的「护城河」都没办法构建。AI 基础模型和基础建设每周都会出现新的更新，因此 AI 公司没办法像移动时代那样按部就班的发展。

　　而对于获得关注度，a16z 则认为早期宣传十分重要。每家公司都希望能够获得病毒史传播，但目前 AI 产品发布的数量庞大，迭代速度快，社交算法的易变性等难题，都令传播变得越来越困难。a16z 坦言，「教科书上的策略已不再适用，而现如今，需要打破常规。」

　　博客中举出了十分多新的营销案例：举行黑客马拉松、构建 AI 类的社交媒体实验（如邀请用户破解自家 AI 产品）、直播式 AI 产品发布等等。而这些新的营销方案，共同点则是：不需要依赖庞大的市场预算、不需要依赖渠道资源，通过社交网络的快速，一步步放大了产品的传播效益。

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图14)

DeepSeek给王一博道歉被当真年度AI幻觉马斯克Grok 4跑分曝光华为盘古团队回应模型争议Hunt Good周报(图15)

　　歼-10没了？九三大阅兵彩排画面曝光：歼-16/20/35组成新编队，意味着有人掉队？

　　突发！这家A股公司董事长兼总经理、董事被采取刑事强制措施，公司连续两年亏损超亿元

　　vivo X300 Ultra影像浮出水面：主摄再进化，进光与凸起双改善！

　　三星One UI 8 beta测试音频橡皮擦新功能：看视频时即可实时降噪

上一篇：AI导演时代：短视频创作的智能进化论下一篇：从越南厂商视角看生成式 AI 应用如何在当地和全球市场突围返回

免费获取策划方案及报价

联系专业的商务顾问，制定方案，专业设计，一对一咨询及其报价详情

服务热线 18568522466

热门标签

能生成短视频的ai

Kaiyun·（官方定制）-中国大陆未来网站