250202 期 AI 周刊：春节期间 DeepSeek 独霸热搜

LeCun批评硅谷傲慢病，DeepSeek新模型R1-Zero成实现AGI关键

DeepSeek的R1-Zero系统因其在推理任务中的表现及对强化学习的依赖，显示出重要的研究价值，可能打破人类输入瓶颈。相比R1，R1-Zero在多项基准测试中表现相近，但无需人工标注，仅通过强化学习实现。这表明在某些领域，SFT并非必要，强化学习或可实现更广泛的推理能力。随着AI系统对计算资源需求的增加，推理系统的效率提升将推动更多应用场景的开发。

Hinton解析AGI时代财富再分配，普通人该何去何从？

随着AGI/ASI的逼近，专家预测AI将取代大量人力工作，加剧贫富差距，使社会结构发生巨大变化。尽管AI可能提高生产力，但可能导致失业者增多，富人更富。当前，AI的发展正引发对监管和控制的讨论，以防止失控风险。

AI狂潮13天：DeepSeek引领业界重新定义未来发展路径

英伟达CEO黄仁勋的中国之行引发关注，而杭州的深度求索（DeepSeek）公司则因开源其推理模型DeepSeek-R1，导致英伟达市值一周内蒸发5520亿美元。DeepSeek-R1在性能、价格和开源方面具有显著优势，引发全球震惊。随后，OpenAI推出全新推理模型o3-mini并开源，试图应对竞争。这场技术变革促使业界重新评估开源价值和AI产业竞争格局。

DeepSeek与华为合作，全国产API低至“白菜价”，硅基流动首发即限流，零门槛部署开启！

华为DeepSeek联合推出的国产大模型云服务平台SiliconCloud上线，提供DeepSeek-V3和DeepSeek-R1两种模型，春节期间价格优惠。DeepSeek-V3输入1元/M tokens，输出2元/M tokens；DeepSeek-R1输入4元/M tokens，输出16元/M tokens。平台稳定且零部署门槛，上线19天日活已达1909万，成为全球增速最快的AI应用。R1在创意写作榜上排名第一，超越Claude。

AI狸谱爆红，年轻网友纷纷“中招”，花式拜年引热议

狸谱App在春节期间推出《万物变挂件》和《新年萌偶摇》新玩法，凭借强大的AI生图能力和情感共鸣需求场景，迅速走红。用户只需上传照片即可生成精美的挂件或玩偶形象，参与拜年、游戏等多种社交活动。狸谱的成功不仅源于其技术优势，还在于深刻理解用户需求，创造出独特的社交体验。

奥特曼深夜带队激战DeepSeek，o3-mini紧急上线免费用引热议

OpenAI发布了o3-mini和o3-mini-high两个版本，免费用户可通过「Reason」体验，Plus用户每天有150次对话限制。o3-mini在数学、编程和科学领域表现优异，响应速度快，价格为输入1.10美元/百万token、输出4.40美元/百万token，比o1-mini便宜63%，比满血版o1便宜93%。该模型在多项基准测试中表现出色，但在安全性测试中仍有改进空间。

DeepSeek一夜登顶，微软Azure、Cursor、亚马逊Bedrock齐助力

DeepSeek R1 模型迅速加入Azure AI Foundry和GitHub，受到多家科技公司支持，展示了其在AI领域的影响力。该模型通过优化技术实现了高性能低成本，颠覆了AI竞赛的传统认知。然而，围绕DeepSeek的争议也在继续，涉及知识产权和硬件采购的调查。这一事件预示着2025年人工智能竞赛的激烈竞争，同时也可能重塑科技巨头间的竞争格局。

DeepSeek一招MLA惊艳全球，150+顶尖人才齐聚共铸辉煌

DeepSeek在AI领域的迅猛发展引起了广泛关注，其训练成本远超600万美元，实际总投资超5亿美元，拥有约5万块Hopper GPU及150名顶尖员工。该公司创新的多头潜注意力机制显著降低了推理成本，其模型R1在短时间内达到与o1相当的性能，展现了快速迭代能力。DeepSeek的成就和开源权重策略使其成为领先的AI实验室之一，挑战了OpenAI的市场地位。

DeepSeek发布OpenAI免费推理模型o3-mini，奥特曼感慨：如果我们之前没开源，那我们真的做错了

OpenAI发布了新推理模型o3-mini系列，包括low、medium和high三个版本，旨在推动低成本推理。ChatGPT Plus及Pro用户即日起可访问o3-mini，企业级访问一周后开放。o3-mini在数学和编码能力上优于o1-mini，响应速度提升24%，重大错误率降低39%。尽管性能提升，o3-mini价格仍高于DeepSeek-R1。奥特曼在Reddit活动中反思开源权重AI模型的立场，并透露未来计划包括更新高级语音模式和增强推理模型功能。

揭秘AI人才身价：年薪高达百万！

AI研究员因全球短缺和高需求，薪资远超传统软件工程师，达到千万美元级别。OpenAI、Anthropic和Tesla等公司提供高至86.5万美元的年薪。顶尖AI研究员因其算法创新能力和对AI模型优化的贡献，尤其在强化学习等领域稀缺。此外，风投推动和科技公司间的激烈竞争进一步推高了这些人才的薪资和市场估值。

OpenAI获2900亿新融资，市值突破2万亿！

OpenAI计划融资400亿美元，估值达3000亿美元，成为全球估值第二高的初创公司，仅次于SpaceX。软银拟投资150亿至250亿美元，可能成为最大单一支持者。此次融资将加速技术研发，拓展市场，并可能改变行业竞争格局。然而，也存在估值泡沫和监管风险。

断网也能用！Fullmoon苹果手机上实现AI大语言模型

Fullmoon AI 是一款可在苹果设备上离线运行的本地大型语言模型应用，支持Mac、iPad和iPhone。该应用强调隐私和高效处理，优化于苹果硅芯片，可定制化并免费开源。用户可根据设备性能选择不同模型，如llama-3.2-1b和llama-3.2-4b，其中后者性能更强但要求更高硬件配置。满月AI适用于追求隐私和便携性的各类用户。

诺奖得主宣布：AI新药临床在即，下一代超级推理系统即将问世！

Demis Hassabis宣布，由谷歌DeepMind研发的首批AI新药将于年底进入临床试验，并透露正在开发代号“Astra”的Agent系统。他还介绍了Gemini 2.0的“思维模型”，强调其能自我核查事实，以对抗OpenAI的推理系统。Hassabis预计，未来一两年内，可能有数十亿个AI Agent在网络上交互，代表供应商和消费者进行谈判。此外，AlphaFold已帮助解析了2亿个蛋白质结构，超过250万研究人员使用该工具。

美国五角大楼启动90天AI计划，加速AI技术在军事实战中的应用与发展

五角大楼启动90天AI计划，与Anduril和Palantir等公司合作，重点测试生成式AI在海军应用中的性能，以提高作战效率和决策灵活性，特别是在与中国的战略竞争中。该计划旨在提升数据与AI系统的互操作性，并解决算力和安全风险等挑战。

OpenAI指控DeepSeek窃取技术，美军介入，Anthropic CEO呼吁加强芯片管控

美国指控DeepSeek利用OpenAI模型数据开发技术，并对其线上服务进行攻击。DeepSeek使用约2048块英伟达H800和560万美元训练出6710亿参数的V3模型，引发市场波动，科技股市值蒸发近1万亿美元。OpenAI和微软正调查DeepSeek是否违规获取数据，而Anthropic CEO呼吁加强对中国芯片出口管制。

梁文锋：AI领域的新晋领军人物

梁文锋带领的DeepSeek开源了多模态模型Janus-Pro-7B，并在多个基准测试中超越了DALL-E 3和Stable Diffusion。此举在美国引起强烈反响，OpenAI和美国政府分别关注并采取行动，而DeepSeek的低成本高效模型也引发了中国大模型价格战。DeepSeek以不到十分之一的成本达到了硅谷需上亿投入才能达到的效果，引起广泛争议。

AI强势回归！用科技传递新春祝福

春节期间，国产AI公司DeepSeek发布了一款训练成本低、能力出色的推理模型，迅速超越ChatGPT成为苹果商店免费应用榜首。与此同时，AI拜年成为新风尚，年轻人通过AI制作红包封面、表情包、对联、视频等，简化了传统拜年方式，吸引了大量关注。然而，AI拜年仍面临生成画面准确度不足和免费使用次数限制等问题。

一个月全靠AI工作是一种怎样的体验？

在过去的一个月里，作者使用AI完成了所有文字工作，包括公众号文章和视频脚本，几乎无人察觉。作者主要使用Claude 3.5 Sonnet进行资料整理、创作提纲及润色，发现其逻辑性强但不适合长文；而DeepSeek R1则文笔犀利但逻辑欠佳。作者认为未来创作者只需提供想法和任务，AI将负责执行大部分文字工作。

美国海军禁用DeepSeek模型，以安全为由发起调查

美国海军因安全和道德问题，要求人员避免使用中国公司DeepSeek的人工智能模型。DeepSeek因其快速成功受到关注，但也引发了关于知识产权盗窃和安全隐患的争议。白宫正在调查其影响，而OpenAI则表示将加强保护知识产权措施并加快产品更新。截至1月28日，DeepSeek仍在美国苹果App商店免费下载排行榜上居首。

阿里云春晚首秀引爆AI热潮，释放了哪些重要信号？

阿里巴巴在2025年春晚中首次以硬科技亮相，成为独家电商互动平台和云计算AI合作伙伴。阿里云提供了云转播和通义大模型技术支持，实现多视角直播和AI多视角呈现等创新，包括武术节目中的“子弹时间”效果。此外，通义AIGC技术将舞台画面转化为静态油画，生成毛毡动画。阿里云在春晚上的表现展示了其在AI和云计算领域的技术实力。

DeepSeek独立发现O1核心思路，OpenAI首席研究官亲自证实，奥特曼作出回应！

DeeSeek的R1模型在短短几天内迅速崛起，从Hugging Face的点赞数激增到登顶美榜APP Store，展示了其在AI领域的冲击力。该模型以较低成本实现了顶级性能，打破了需巨额资金投入才能构建顶尖AI的观念。R1通过精妙的工程设计和先进的技术，如模型蒸馏和强化学习，证明了小型模型也能媲美甚至超越大型模型。这一突破不仅引发了市场对AI成本下降的担忧，也促使OpenAI等公司加快研发步伐。R1的成功挑战了中国AI落后于美国的传统看法，预示着全球AI竞争格局的深刻变革。

DeepSeek揭秘：迅雷5亿收购虎扑的背后真相

DeepSeek发布的R1人工智能模型展示了中国企业在该领域的竞争力，而迅雷以5亿元收购虎扑则体现了老牌互联网企业向新时代转型的努力。这两起事件反映了科技行业正在探索如何适应数字时代的发展，包括利用新技术改进业务模式和社区运营，同时也揭示了体育产业在技术驱动下的潜在变革和新机遇。

斯坦福女神辍学再创业获OpenAI支持，推出全球首款0代码AI工程师平台

Heyboss，一款专为非程序员设计的AI工具，允许用户通过简单指令开发应用、网站和游戏，已获得成千上万个项目创建。该工具支持设计、前端、后端、APP和部署等全自动化工作，且能24/7运行。Heyboss由华人学者Xiaoyin Qu创立，已获OpenAI和亚马逊等投资。

清华NLP发布RAG框架，一键接入知识库无需烦恼模型选择

清华大学THUNLP团队联合多家机构推出UltraRAG框架，简化RAG系统开发流程，提供“单反相机”级精细配置与“卡片机”式便捷操作。UltraRAG强调模型适配用户知识库，支持模块化设计与科研需求快速迭代。框架包含RAG-DDR、VisRAG等技术，已被ICLR收录，MiniCPM-Embedding下载量超30万次。UltraRAG集成多种预设工作流，支持零代码编程WebUI，实现从数据到模型全流程管理。

阿里Qwen2.5-Max除夕发布，性能反超DeepSeek V3，助力小游戏开发提速

阿里通义Qwen发布新版本Qwen2.5-Max，在多项基准测试中超越DeepSeek V3、Llama-3.1-405B及GPT-4，成为超大规模的MoE模型，经过超20万亿token的预训练。该版本支持联网搜索、代码生成及多模态功能，已在多个平台上线。

工程师灵魂拷问：英伟达护城河被DeepSeek一举突破，CUDA竟成摆设？

DeepSeek-V3通过使用PTX语言绕过了CUDA，实现了比Meta等高出10倍的硬件效率，具体做法是对132个流式多处理器中的20个进行改造，以加速服务器间通信。尽管PTX使优化更为精细，但也增加了复杂性和不可移植性。DeepSeek已展示出与AMD、华为等团队的合作，并证明了大模型有能力编写和优化底层代码。

DeepSeek爆火背后：英伟达股价因大规模恶意攻击急剧下跌

DeepSeek因遭受大规模恶意攻击导致AI服务多次宕机，并宣布暂时限制非中国大陆手机号注册。DeepSeek推出的AI模型R1在数学、编程和推理等领域表现优异，但API调用成本远低于竞品。受此影响，英伟达股价暴跌17%，创下美股历史最大单日个股跌幅。特朗普认为DeepSeek的崛起应为美国企业敲响警钟，强调需加强竞争力。

滚烫！Deepseek开源新模型除夕问世，7B表现力超DALL-E 3和StableDiffusion，一夜之间碾压英伟达市值4万亿

DeepSeek发布新多模态模型Janus-Pro-7B，开源并在GenEval和DPG-Bench基准测试中优于DALL-E 3和Stable Diffusion。该模型改进了视觉编码和生成策略，提升了视觉质量和多模态理解性能。与此同时，阿里通义千问Qwen也更新了Qwen2.5-VL模型。DeepSeek的崛起对英伟达等公司造成冲击，引发了资本市场的大幅波动。

xAI即将发布Grok-3，下周亮相推理能力力压OpenAI

Grok-3 AI 模型已开始内部测试，预计下周正式发布。测试显示其表现优于o1和DeepSeek R1模型。xAI公司旨在将其打造为基于事实、追求真理的AI，强调理性、怀疑精神及用户至上原则，优先使用X平台作为信息来源。

两名学生开发AI应用，一年吸引50万用户！

TurboLearn AI是一款由西北大学大二学生Rudy Arora和杜克大学大二学生Sarthak Dhawan共同开发的应用程序，旨在通过AI技术将讲座录音转化为组织化的笔记、闪卡和测验，以减轻学生学习压力。该应用在2024年VentureCat学生创业比赛中赢得10万美元奖金，并通过TikTok病毒式营销和网红合作迅速增长，现已与教育机构如Meharry医学院合作，提供免费基础计划及高级功能。

百度文库凭借AI助力，成功跻身「十亿营收俱乐部」

百度文库AI功能月活用户超9000万，付费用户4000万，年收入达20多亿，仅次于微软Copilot，位居全球第二、中国第一。百度文库通过聚焦AI生产力工具，实现了用户和营收的显著增长，表明AI行业正从单纯追求用户增长转向注重商业化能力的新阶段。

2025年AI趋势全揭秘：从智能眼镜到推理Scaling，8大热门赛道一网打尽

2025年伊始，AI科技领域迎来八大热门趋势：人形机器人量产加速，预计2025年全球市场空间可达12-16万亿元；AI眼镜出货量突破百万，CES上近50款产品亮相，其中Halliday众筹超137万美元；智能驾驶快速发展，L3商用有望成为2025年焦点；AI陪伴从线上转向实体硬件；Inference-Scaling技术提升模型推理能力；视频生成技术突飞猛进，国内外玩家竞相发力；AI Coding从代码补全演进为全流程开发助手；空间智能结合具身智能与3D生成技术，推动AI系统在三维空间中的感知与行动。

Qwen开源长文本处理模型，性能超越GPT-4o-mini，百万Tokens不在话下

阿里云Qwen推出新模型Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M，将开源模型的上下文扩展至1M Tokens，处理长文本任务时比GPT-4o-mini快7倍。新模型在长上下文任务中表现出色，尤其Qwen2.5-14B-Instruct-1M在多项测试中优于其他模型。此外，团队采用长上下文训练、长度外推和稀疏注意力机制等技术，确保模型在长文本和短文本任务上均有良好表现。

测试国产大模型RAG能力，结果出乎意料！

国产大模型在实际应用中需结合搜索技术以提升效能，尤其在中文互联网、企业服务和政务医疗等领域。测试显示，文心一言4.0 Turbo在理解用户意图、提供准确答案、丰富信息和专业性方面表现最佳，体现了RAG检索增强生成技术的优势。

2025年前瞻：35位大模型创业者共同预测智能体将迎来爆发潮

2024年，大模型市场竞争激烈，各大公司发布频繁，创业者们在多个应用场景中取得突破，包括AI Coding、AI视频生成、AI 3D生成等。2025年，AI应用将更加广泛，AI Agent将成为重要产品形态，多模态交互和推理模型将得到进一步发展。AI将在企业级应用和消费电子市场中迎来爆发，端侧AI和智能硬件也将扮演重要角色。

字节跳动推出免费开源项目，网友欢呼省下200美元！

字节跳动的开源智能体UI-TARS在多项基准测试中表现出色，尤其是在Android操作系统上的任务成功率达到了46.6%，超过了GPT-4o的34.5%。UI-TARS通过增强感知、统一动作建模和System-2推理等创新技术，实现了高效的任务执行和自我改进能力，推动了智能体时代的加速到来。

千诀科技推出机器人“通用大脑”，连续完成两轮千万级融资

千诀科技完成亿元级天使轮和天使++轮融资，主要用于研发投入、产品迭代及市场拓展。该公司专注于具身大脑研发，已发布产品级机器人感知与决策大模型，并在多个场景实现落地。其核心技术得到清华大学类脑中心支持，解决了大模型常见幻觉问题，实现连续决策和环境感知。未来，千诀科技将加快市场拓展，推动商业化应用。

杨立昆盛赞中国AI实力：科学家表现令人震撼

Meta计划2025年在AI领域的投资达600亿美元，主要用于计算基础设施建设。杨立昆预测，若用户量达到数亿，需大量计算能力支撑，且强调Meta运营碳中和，是可再生能源最大消费者。美国因资金充足，在AI投资上领先，而中国如DeepSeek等公司的崛起也值得关注。杨立昆认为，未来3-5年人工智能架构可能革新，当前系统在理解物理世界、持久记忆、推理及规划方面存在局限。他还提到，Meta正探索新技术以改善视频生成与智能体系统。

本文部分素材来自网络，侵删请联系站长。

扫码关注本站公众号/加入知识星球，订阅更多精彩内容