美国会拟在政府设备上禁用DeepSeek;小米眼镜官微上线,或本月发布;OpenAI升级o3-mini模型思维链 | 极客头条

发布时间:2025-02-07 12:44  浏览量:17

「极客头条」—— 技术人员的新闻圈!

CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

一分钟速览新闻点!

因服务器太繁忙,DeepSeek 暂停 API 服务充值并辟谣

美团成立算法顾问委员会,为改进算法提供常态化咨询和指导

苹果面临反垄断调查

DeepSeek 研究称华为昇腾 910C 推理性能能达到英伟达 H100 的六成

多模态大模型领军科学家加入阿里,加速模型到应用闭环能力跃迁

小米眼镜官微上线,首款设备已经获得入网许可

OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度

苹果或最快下周发布新一代 iPhone SE,有望月内发售美国会拟在政府设备上禁用 DeepSeek

前 OpenAI 联合创始人从 Anthropic 离职

李飞飞团队仅用 50 美元打造 AI 推理新模型 s1

OpenWrt 24.10 释出

Mistral 在 iOS 和 Android 上发布 AI 助手应用

国内要闻

昨日,多名开发者表示,DeepSeek 平台一直提示服务器繁忙,通过硅基流动、国家超算互联网平台等使用 DeepSeek 模型服务,也较为卡顿。深度求索对此声明称,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停 API 服务充值。存量充值金额可继续调用,敬请谅解!”

官方价目表显示,deepseek-chat 型优惠期至北京时间 2025 年 2 月 8 日 24:00,优惠结束后将按每百万输入 tokens 2 元,每百万输出 tokens 8 元计费,deepseek-reasoner 模型上线即按每百万输入 tokens 4 元,每百万输出 tokens 16 元计费。

同时,深度求索还澄清 DeepSeek 官方账号和信息发布渠道。目前 DeepSeek 官方账号仅存在于微信公众号、小红书和 Twitter,其他均为仿冒。官方信息以账号发布为准,官方网站和 App 为 www.DeepSeek.com 和 「DeepSeek(DeepSeek-ai 人工智能助手)」,无广告和付费项目。公司未在国内其他平台设立官方群组,提醒用户注意辨别假冒收费行为。公司将继续研发创新模型,并加强官方信息发布及服务渠道管理。

美团成立算法顾问委员会,为改进算法提供常态化咨询和指导

美团成立算法顾问委员会,由七位专家学者组成,旨在提供算法改进咨询和指导。委员会已参与骑手恳谈会,讨论超时问题处理,提出设置容错空间和鼓励性管理建议。美团将公布相关改正情况,并让委员会深度参与骑手交流会,助力制定更合理规则。

苹果面临反垄断调查

国家市场监督管理总局考虑对苹果发起反垄断调查。知情人士称,国家市场监管总局正在审查苹果的政策,其中包括对应用内消费收取最高 30% 的提成,禁止外部支付服务和应用商店。国家市场监督管理总局去年已经与苹果高管和应用开发者进行了交谈,它认为苹果可能向开发商收取了不合理的高额费用。这些谈判源自苹果就应用商店政策与腾讯和字节跳动等开发商之间长期存在的纠纷。如果谈判顺利,市场监管总局可能不会正式采取行动。

DeepSeek 研究称华为昇腾 910C 推理性能能达到英伟达 H100 的六成

DeepSeek 研究人员称,华为昇腾 910C 的推理性能达到了英伟达 H100 的六成。昇腾 910 原使用台积电 N7+ 工艺制造,而 910C 是中芯国际使用 7nm 工艺 N+2 制造的一个版本。910C 使用 chiplet 封装,主计算 SoC 有约 530 亿个晶体管。DeepSeek 的测试表明,尽管受制于美国政府制裁,无法使用台积电的最先进工艺制造,华为的 AI 处理器性能仍在快速进步。这有助于减少对英伟达 GPU 的依赖。英伟达 GPU 在 AI 训练方面仍然占据了绝对领先地位。

多模态大模型领军科学家加入阿里,加速模型到应用闭环能力跃迁

2月6日,多方消息,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,向吴嘉汇报,负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案。

小米眼镜官微上线,首款设备已经获得入网许可

有网友发现,小米眼镜官微已经上线,认证主体为小米通讯技术有限公司。据悉,小米首款 AI 眼镜已经获得入网许可,型号是 M2442G1,爆料称这款设备原定于 2025 年 3 月至 4 月发布,现提前至 2 月,与小米 15 Ultra 同台亮相。关于小米 AI 眼镜的具体细节暂时不得而知,考虑到小米会在月底举办发布会,相信小米 AI 眼镜很快就会官宣。

国际要闻

OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度

OpenAI 公司在 X 平台宣布更新 o3-mini 和 o3-mini-high 模型的思维链展示方式,使模型推理步骤更透明详细,帮助用户理解思考过程,增强对答案的信心。更新后的模型在输出结果前会进行事实核查,避免常见陷阱,但需更多时间得出解决方案。公司已找到平衡,让模型自由思考后组织成详细摘要,并进行后处理审查和简化,支持非英语用户接收母语思维链,提升用户体验。

2 月 6 日,知情人士称,苹果公司预计最快下周发布下一代 iPhone SE,或本月晚些时候开始发售。据透露,苹果不太可能为这款设备举行发布会,而是会通过官网发布。据报道,iPhone SE 4 的设计与 iPhone 14 类似,将内置该公司的人工智能软件 Apple Intelligence。(彭博社)

据《华尔街日报》报道,美国国会议员计划在周四推出一项法案,禁止在政府拥有的设备上使用 DeepSeek 的聊天机器人应用,理由是该应用可能向其他国家提供用户信息,引发了新的安全担忧。这项法案由伊利诺伊州共和党众议员达林·拉胡德(Darin LaHood)和新泽西州民主党众议员乔希·戈特海默(Josh Gottheimer)起草。

前 OpenAI 联合创始人从 Anthropic 离职

据 The Information 报道,于去年 8 月加盟 Anthropic 的前 OpenAI 联合创始人 John Schulman 在昨日宣布离职。John Schulman 是 OpenAI 创始团队成员之一,是 ChatGPT 的核心架构师之一,他在 2024 年 8 月宣布从 OpenAI 离职,并加入 Anthropic。Anthropic 是 OpenAI 在人工智能基础模型领域的主要竞争对手,年化收入约为 8.75 亿美元。Schulman 尚未透露其接下来的动向。

程序员专区

李飞飞团队仅用 50 美元打造 AI 推理新模型 s1

斯坦福大学和华盛顿大学的科研团队成功开发出低成本 AI 推理模型 s1,训练成本不足 50 美元。不过,该 s1 模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,阿里云确认了这一消息,并回应称:“他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座,在 16 块 H100 GPU 上监督微调 26 分钟,训练出新模型 s1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。”(新浪科技)

OpenWrt 24.10 释出

用于路由器等设备的发行版 OpenWrt 释出了 24.10,距离上一个版本 23.05.0 约一年四个月。OpenWrt 24.10 的新特性包括:支持逾 1970 款设备,比 23.05.0 增加了 100 多款;Linux 内核从 5.15 升级到 6.6;包管理器仍然是 OPKG,APK 包尚不支持,预计下个版本才会切换到 APK;加密库 mbedtls 更新到 3.6;改进了 WiFi6 (802.11ax) 支持,初步支持 WiFi7 (802.11be);改进了 Link Layer Discovery Protocol(LLDP)支持,等等。

Mistral 公司正在对其 AI 助手 Le Chat 发布多项更新。除了网页界面的重大升级外,该公司还将在 iOS 和 Android 平台上发布一款移动应用程序。随着今天对 Le Chat 的更新,Mistral 还推出了专业级,每月 14.99 美元,欧洲每月 14.99 欧元。虽然该公司不再详细说明其使用的确切人工智能模型,但它表示专业计划可以访问 "性能最高的模型",这表明免费账户无法访问顶级模型。

观点

外部推荐