2024年12月16日 AI 周刊

Claude 3.5编程收入3年暴涨10倍，估值180亿初创企业搅动硅谷

Anthropic凭借其AI编程助手Claude在技术和商业上取得显著进展，特别是在代码自动化领域，击败了OpenAI的模型。Claude 3.5 Sonnet在多项基准测试中表现出色，吸引了包括微软在内的多家公司采用。尽管OpenAI在营收和资金规模上仍占优势，Anthropic通过聚焦企业客户需求，实现了年化收入的十倍增长。此外，Anthropic注重AI安全性，逐步扩大市场影响力，与OpenAI的竞争日益激烈。

华为重磅发布！开启AI新时代

12月14日，昇思人工智能框架峰会在京召开，18家单位发布了基于昇思的原生开发大模型成果。据预测，2024年中国AI框架市场中昇思份额将达到30%。昇思MindSpore自2019年推出以来，已支持50多个大模型，全球下载量超1100万，跻身全球主流AI框架行列。昇思生态持续扩展，多家上市公司如软通动力、科大讯飞等已成为其建设主力军，推动AI技术在各行业的广泛应用。

探索未来！16种前沿RAG技术大揭秘

RAG（检索-生成）模型在大模型应用中取得了成功，但其落地实践中面临诸多挑战，如场景适用性、信息检索与使用等问题。目前，RAG技术正朝着专业化、多模态融合、安全性增强、效率提升及可解释性提高的方向发展。例如，AutoRAG能自主判断检索信息，CORAG通过蒙特卡洛树搜索优化信息组合，FastRAG采用两步策略提高检索精度。此外，RAG在医疗、金融等领域展现了强大的应用潜力，但也存在安全风险，需采取相应措施保障系统安全。总体而言，RAG技术虽已取得进展，但在实际应用中仍需不断探索优化。

热钱疯狂涌入！AI应用成为投资新风口

AI应用赛道在2023年下半年迎来融资热潮，知名投资机构如高瓴资本、经纬创投等纷纷加大投资力度，瞄准早期项目。数据显示，AI应用项目数量可能远超公布的数据，且在榜单和市场上表现活跃。美股AI相关公司的股价也出现显著增长。投资策略转向“投早、投小”，决策迅速，但整体市场仍存在不确定性。

月薪仅3000元，全球首位AI程序员上线，能为公司带来什么？

Devin AI是一款由Cognition Labs开发的人工智能程序员，每月服务费用为500美元。它能协助完成代码编写、错误检测、代码重构和优化等任务，并可自主执行复杂工程任务。Devin AI在"SWE-bench"测试中正确解决了13.86%的问题，远超此前的最佳水平1.96%，并在Upwork上找到工作。尽管有质疑声音，Devin AI已全面推出，引发关于AI是否将取代真实程序员的讨论。

26岁OpenAI举报人疑似因揭露ChatGPT训练黑幕而自杀

Suchir Balaji，曾在OpenAI工作四年的研究员，指控公司侵犯版权，于11月26日在旧金山公寓中自杀身亡。Balaji认为OpenAI在训练AI模型时违反了“合理使用”原则，并在个人网站上发布文章论证这一观点。他掌握的信息原计划在针对OpenAI的诉讼中发挥关键作用，但其去世引发了对事件真相的广泛质疑。

马斯克力捧的AI机器人获数百万天使轮融资，「TangibleFuture」火了

「TangibleFuture」近期完成了数百万元的天使轮融资，资金主要用于硬件量产、技术研发和全球人才招募。该公司专注于融合机器人硬件、多模态交互和内容叙事，开发了名为LOOI的机器人，该产品具备自我学习和迭代能力，能与用户建立情感共鸣。LOOI在Kickstarter众筹平台上获得成功，首批产品已发货并在主流市场完成现货交付。据预测，2023年全球陪伴机器人市场规模为920,311万美元，未来五年年复合增长率预计达25.68%。

Ilya引爆NeurIPS现场：预训练时代或将落幕！

Ilya Sutskever在NeurIPS 2024上表示，预训练时代即将结束，未来将是超级智能的时代，包括具备自主推理、决策和自我意识的AI系统。他回顾了深度学习十年来的发展，强调了自回归模型、大型神经网络和大数据集的重要性，但也指出了LSTM和并行化的局限。Ilya认为，数据瓶颈将成为未来AI发展的主要挑战，而Agent系统和合成数据可能是突破的关键。

清华姚班高材生退学创业，AI项目获亿级美元融资，2年ARR暴增400%

Cresta，由多位斯坦福大学博士及全球顶尖科技公司专家创立，提供AI驱动的实时客户互动解决方案。2024年完成1.25亿美元D轮融资，累计融资达2.7亿美元。过去两年，公司年度经常性收入（ARR）增加近四倍，客户基数翻倍。Cresta通过Agent Assist、Conversation Intelligence和Virtual Agent三大核心产品，帮助企业在客户服务和销售环节中显著提升效率和客户体验。例如，Snap Finance通过Cresta技术将平均处理时间缩短40%，客户挽留率提升至30%。

神秘东方AI助力猫咪中文说唱火遍TikTok

抖音神曲《因果》借助AI技术让猫咪模仿演唱，在TikTok等平台迅速走红，相关视频播放量超数百万，尤其在抖音和小红书等平台，猫猫说唱视频更受欢迎。数据显示，截至10月13日，话题#老天保佑金山银山全都有#累计播放量已达9亿次。AI对口型工具如剪映、即梦AI及快手的LivePortrait使这一趋势得以普及，尽管部分工具需付费或观看广告解锁。

AI助理助力海外UP主，“一触互动”获百万美元天使轮融资

一触互动（南京）科技有限公司近期完成百万美元天使轮融资，资金将用于产品研发、人才招聘和市场拓展。该公司开发了一款基于Llama开源模型的邮件Copilot工具，帮助海外红人和UP主高效管理品牌合作邮件。该工具已上线三周，有2000多个付费用户，注册到付费的转化率超过20%。未来，公司将扩展至创作者带货交易闭环及普通消费者的邮件处理服务。

4000万用户揭秘：测测CEO任永亮谈行业与AI的距离 | MEET 2025

测测，一个拥有约4000万用户的AI驱动泛心理APP，通过运用AI技术解决了心理咨询服务中的诸多难题。心言集团创始人任永亮在MEET 2025智能未来大会上分享了其公司在AI化过程中的经验，强调了适度应用AI的重要性，并提出了具身化与主动交互作为泛心理服务的新发展方向。此次大会吸引了1000多名线下观众及320万名线上观众。

德州Crusoe Energy获6.86亿美元融资，以清洁能源推动AI数据中心发展

Crusoe Energy 宣布已筹集 6.86 亿美元，计划在德克萨斯州建设一个大型 AI 数据中心，主要租给 Oracle、微软和 OpenAI 等公司。该公司估值近 30 亿美元，与 Lancium 合作开发清洁能源园区，以低碳能源供电。面对快速增长的 AI 和云计算需求，Crusoe 通过多种技术手段应对能耗和碳排放挑战。

揭秘OpenAI实时API：简化多轮对话管理，函数调用与上下文处理轻松搞定

OpenAI推出的实时API支持低延迟的双向音频流，适用于构建多模态AI应用如语音对话Agent。该API通过WebSocket连接管理对话状态，提供短语结束检测和语音活动检测功能，目标语音到语音延迟为500-800毫秒。实时API还支持函数调用和上下文管理，自动缓存对话历史，减少成本。其事件架构适合多种语言和框架，但建议在生产环境中使用WebRTC以降低延迟。

合成数据引领未来：探索通向具身多模态通用机器人的大模型之路

北京银河通用机器人有限公司创始人王鹤在2024年中关村仿生机器人大会上分享了关于通用机器人的最新研究成果。他强调，通用机器人背后的主流技术是基于大模型，该模型通过语言指令和传感器信号直接输出控制信号。然而，高质量数据的获取是挑战之一，为此，银河通用提出了使用三维合成数据的方法，通过自研的千万场景合成大数据训练模型，提升了机器人的泛化能力。该公司开发的端到端大模型已经在多个场景中展示出高效、智能的操作能力，包括物流搬运和家庭服务等。

OpenAI发布新版ChatGPT，圣诞限定彩蛋让AI情感交互更逼真

OpenAI在时隔7个月后，推出了ChatGPT的视频聊天和屏幕共享功能，并添加了圣诞老人限定声音。用户可通过这些功能与ChatGPT进行实时视频对话及屏幕共享，实现更自然、多语言的交互体验。然而，与谷歌Gemini 2.0相比，OpenAI的新功能显得逊色，后者在实时AI功能方面更具优势。

前OpenAI资深专家创立新公司，推出具身智能陪伴机器人

江旭，曾任OpenAI资深算法负责人并参与多项关键项目，于2023年离开OpenAI，创立了专注于具身智能陪伴机器人的公司“亮源新创”（Light Robotics）。该公司旨在打造通用型机器人，目前在深圳和新加坡设有办公室，并计划招聘员工。江旭的公司瞄准的具身智能陪伴机器人将应用于家庭服务、医疗康养及教育培训等领域。目前市场上已有多家公司涉足这一领域，包括优必选、科大讯飞等。

李飞飞揭秘World Labs如何打造「空间智能」技术

斯坦福大学教授李飞飞提倡的“空间智能”引领AI发展方向，她在人工智能领域创建ImageNet数据集，促进了深度学习革命。李飞飞的新创公司World Labs致力于生成可探索的3D场景，以提高AI的“空间智能”。李飞飞认为，解决3D智能问题是实现全面智能的关键步骤，这将极大促进创造力和生产力的发展。实现这一目标需要大量数据和算力支持，目前仍面临巨大技术挑战。

国产全AI游戏来袭：大模型打造开放世界，支持语音交互！

巨人网络发布了“千影 QianYing”大模型，包括YingGame和YingSound。YingGame能根据文字或图片生成可交互的开放世界游戏视频，支持多样动作控制和角色自定义，具备精确的物理仿真能力。YingSound则能为无声视频配音，实现音画同步，具备视频语义理解和高质量音效生成能力。这两项技术有望降低游戏创作门槛，推动游戏行业的创新发展。

Meta发布神经接口腕带，隔空打字引领AR技术新革命

Meta在Connect 2024大会上展示了EMG腕带与Orion AR眼镜原型，实现科幻般的“隔空打字”。EMG腕带通过检测肌肉电信号，让用户能舒适地控制数字内容。Meta发布的emg2qwerty和emg2pose数据集分别包含346小时、520万次按键记录和370小时、8000万个姿态标签，展示了腕带在文本输入和姿态估计方面的潜力，未来有望大幅提升人机交互的自然性和准确性。

实测超强AI营销利器：灵感岛与OpenAI谁更胜一筹？

灵感岛是一款全链路AI营销工具，涵盖从创意灵感、内容生成、批量改写、视频制作到内容分发的所有环节，已在30余种应用场景中帮助数十万创作者生成数千万内容。尤其在AI文案创作、图片生成和视频创作等方面表现出色，还支持数字人视频制作和海外短视频电商等功能。截至12月初，灵感岛已帮助超过2万家门店克隆数字人，并于12月2日成为北京市首批获批的生成式AI服务之一。

Sora上线！AI电商时代老板们竞争激烈大揭秘

Sora是一款集视频生成和编辑于一体的AI工具，已开放给公众使用。它能生成最长20秒的1080P视频，并支持多种功能如文本生成视频、图片生成视频等。AI技术在电商行业的应用愈发广泛，从设计、商品图片和视频生成到数字人主播，显著提升了效率和降低了成本。然而，AI在电商领域的应用仍面临挑战，如内容质量、版权问题及平台政策限制。总体而言，AI正深刻改变电商行业，未来有望带来更多变革。

百度副总裁李震宇投身创业，聚焦具身智能技术革新

原百度集团资深副总裁李震宇近期离职，与原华为车BU首席科学家陈亦伦共同投身具身智能创业项目“它石智航”。这一动向被认为是自动驾驶领域多位大牛转向具身智能创业的最新案例，2024年被视为“具身智能元年”。具身智能得益于大模型技术的发展，具备了快速适应环境的能力，得到了行业专家的认可。

明星厂商Codeway新应用上线2个月狂揽400万用户，强势挺进80余国教育榜前十！

Codeway的Learna AI Tutor应用上线仅两个月，全球下载量已超过400万，尤其在Google Play渠道下载量超300万。该应用主要针对英语学习，功能简洁实用，已在印度等市场取得显著成功。Learna在印度市场下载量占比超21%，总收入为34.5万美元，其中美国用户贡献最多，占比15%。广告投放集中在英语为母语的国家，如美国、加拿大和英国，投放策略侧重于短视频和直接教学内容。

马云未回归牌桌，却将全部赌注押在了“AI”上

马云在蚂蚁集团20周年活动上发表演讲，强调AI将带来巨大变革，但技术和人的需求相结合才能创造价值。蚂蚁集团在AI领域的布局包括推出多款AI产品、启动智能体生态共建计划，并在大模型、知识图谱等领域进行技术布局。同时，蚂蚁金服更名为蚂蚁智能科技，预示其将利用AI等技术革新金融服务。阿里也在AI领域进行了多项布局，包括推出多款AI工具并实现了公共云产品收入连续五个季度三位数增长。

2024科技前瞻：十大革新性产品，AI引领未来潮流

2024年是AI科技创新的大年，涵盖硬件和软件的多个领域。主要亮点包括：OpenAI的o1模型推动AI从生成转向推理；华为的HarmonyOS NEXT实现国产操作系统的独立宣言；荣耀MagicOS 9.0开启手机“自动驾驶”时代；OPPO Find X7引领AI手机潮流；OpenAI的Sora改写了AI视频生成技术路径；宇树G1人形机器人降低了硬件成本；《黑神话：悟空》重塑了中国3A游戏认知；百度文库、支小宝、豆包等AI助手让AI融入日常生活。这些产品不仅展示了技术进步，还预示了未来的科技趋势。

谷歌新旗舰模型引爆网络，免费不限量使用让网友自称论文阅读能力暴涨10倍

谷歌发布了升级版AI模型Gemini 2.0，其生成速度提升2倍，并主打“多模态+Agent”功能。Gemini 2.0在基准测试中得分与Claude 3.5 Sonnet相当，幻觉基准测试跑分为1.3%。目前，Gemini 2.0已在网页端开放，移动端即将推出。该模型还推出了多个智能体，包括Project Astra、Project Mariner和编程智能体Jules，但这些智能体目前仅限受信任的测试人员使用。

“AI自习室”火爆兴起，线下教育全面迈入AI时代？

AI自习室正成为线下教育的新趋势，填补了传统辅导班退出后的空缺。松鼠AI通过软硬件结合，已在全国拥有4000多家门店，但需购买硬件和学习套餐。乐学AI则采取学时制，无需购买硬件，降低了体验门槛。赶考小状元结合AI与真人辅导，但前期投入和运营成本较高。尽管AI教育市场前景广阔，但其普及还需克服家长对AI效果的疑虑。

ChatGPT升级！年底推出视频通话、屏幕共享功能，还有惊喜圣诞彩蛋

OpenAI为ChatGPT推出了视频通话和屏幕共享功能，并新增了圣诞老人限定语音模式。这些更新使ChatGPT不仅能进行文字交流，还能通过视频理解和处理视觉场景，支持超过50种语言。新功能将陆续推送给Team用户及大部分Plus和Pro订阅用户，欧盟地区付费用户需等待。此外，ChatGPT的视觉理解能力仍在发展中，部分细节识别尚待完善。

AI助力日本漫画出海，这家初创公司让全球读者爱上日本漫画

日本初创公司Orange利用Anthropic的Claude大语言模型，将漫画快速翻译成英文，缩短了翻译周期，从两到三个月减少到几天。此举旨在开拓西方市场，但也引发了争议，有人认为AI翻译是对传统艺术形式的不敬。尽管如此，Orange声称已获得部分作者的支持，并认为高质量翻译需要专门训练的大语言模型。美国漫画市场预计到2030年将达到37.1亿美元，Orange希望从中分一杯羹。

普京发起全球AI合作倡议

俄罗斯总统普京表示，俄将与金砖国家及其他国家合作发展人工智能，以抗衡美国的主导地位。俄罗斯联邦储蓄银行牵头成立“人工智能联盟网络”，促进跨国AI合作。根据俄罗斯AI战略，到2030年，AI技术将为其各行业带来11.2万亿卢布（约1090亿美元）的GDP增量，AI投资将增至8500亿卢布，80%的劳动者将具备AI技能。目前，俄罗斯在全球AI指数中排名第31位，远落后于中美印巴等国。

ChatGPT更新版火爆上线，宕机两小时引用户崩溃求修复！

OpenAI在首届开发者大会DevDay上发布了一系列新功能，包括GPTs、GPT-4 Turbo和多模态API等。然而，这些更新导致ChatGPT和API出现严重中断，宕机长达2小时，峰值中断报告达6614次。OpenAI解释称，这主要是由于新功能使用超出预期及遭遇DDoS攻击所致。

英伟达新作将图片秒变3D动画，4K画质打造真实游戏世界！

Nvidia发布Edify 3D系统，允许用户通过简单的文字描述即可生成高质量的4K分辨率3D模型，显著降低了3D建模的技术门槛。该系统能在2分钟内根据文本或前景图像生成详细几何图形和清晰纹理的3D资产，并展示了在不同视图数量下的高效性能和可扩展性。

谷歌Gemini 2.0强势登场，联手最强智能体深夜击败OpenAI！

谷歌在OpenAI Day 5宣布发布新一代原生多模态模型Gemini 2.0 Flash，该模型在性能和速度上均超越前代，并支持多语言及原生调用谷歌搜索等功能。Gemini 2.0 Flash在代码和数学推理方面表现出色，已在SWE-bench Verified基准测试中取得优异成绩。谷歌还推出了一系列基于Gemini 2.0的新智能体，如通用AI助手Project Astra、浏览器智能体Project Mariner和AI代码智能体Jules，旨在推动2025年的智能体工作流。

AI内容平台造梦次元获近亿元融资，顶级风投与大厂联合注资

深圳想法流科技有限公司近期完成了数千万人民币的A轮融资，由锦秋基金领投，多家知名机构参投。该公司专注于多模态AI驱动的新一代内容平台“造梦次元”，提供互动式虚拟角色体验，日均活跃互动时间超100分钟，已吸引大量年轻用户。此轮融资将用于技术研发、市场拓展及海外布局，目标是开创互动内容的全新消费形态。

艺术家亲述：内测Sora团队揭示AI仍缺乏真正创作力

Sora，由OpenAI推出的视频生成产品，在发布后迅速火爆，甚至导致流量爆炸并暂停新用户注册。该产品与艺术家紧密合作，收集反馈并展示其创造力。艺术家Junie Lau认为Sora在使用体验和效果上表现出色，能够提供多样化的输出结果，并且具有较高的艺术性和创新性。尽管Sora仍存在一些学习成本和技术限制，但它在视频生成领域展现出巨大潜力，并受到艺术家们的积极反馈。

谷歌Gemini 2.0发布：全面升级Agent，多模态互动免费体验

谷歌推出Gemini 2.0 Flash模型，主打原生多模态输入输出及AI代理功能，速度提升两倍，多项性能指标超越前代。该模型支持实时音视频流输入、多轮图像编辑和多种语言的音频输出。此外，Gemini 2.0提供包括编程伙伴Jules、数据科学代理和通用AI助手Project Astra等功能，适用于代码编写、数据分析和游戏指导等多个领域。Gemini 2.0 Flash及其API目前免费使用，每分钟最多提问15次，每天最多1500次。

贾樟柯与李少红携手探索AI电影制作，分享最实用功能揭秘

9位知名影视导演与AI视频工具“可灵”合作，各自制作了一部3-5分钟的电影短片，涵盖了多种类型。这些短片展示了AI在动作流畅度、逼真度以及超现实场景等方面的潜力。导演们认为AI有助于降低制作成本、提高效率，并提供了新的创作可能性。尽管AI在某些方面仍需改进，但大多数导演对AI的未来持乐观态度，认为它将成为电影行业的重要合作伙伴。

柜哥柜姐迎来新挑战：AI时代正式上岗

阿里国际和Perplexity AI等公司推出的AI搜索引擎，如Accio和Buy with Pro，正革新电商购物体验。商家和用户只需输入需求，AI即可推荐匹配商品，简化了传统繁琐的搜索过程。据InsightAce Analytic数据，AI电商解决方案市场规模将从2023年的60.1亿美元增长至2031年的198.9亿美元，年复合增长率达16.2%。这些AI工具不仅提升了购物效率，还在优化用户体验，有望成为电商发展的新方向。

全网150万粉丝开发者推出全新高评价AI搜索引擎

2022年AI浪潮下，尽管多家公司试图颠覆传统搜索引擎，但真正成功的通用AI搜索产品仍寥寥无几。360 AI搜索和Perplexity表现较好，前者2024年10月全球访问量达9078万，后者虽快速增长但仍面临版权和商业化难题。BiLin作为一个独立开发者的产品，通过多语言搜索和翻译优化，提供更广泛的信息覆盖，避免了AI搜索常见的准确性问题，上线一个月访问量已达3万。

WebRTC创始人加入OpenAI，揭秘语音AI未来的变革之路

Justin Uberti，WebRTC的早期创建者之一，宣布加入OpenAI，负责实时AI项目。他在Fixie.ai期间，见证了语音AI从文本框向自然语音对话的转变，并强调了低延迟和语气词在语音交互中的重要性。Uberti认为语音交互是AI的未来，人们正回归对话式社会，且语音AI提供了不被批判的交流环境。Fixie.ai开源了Ultravox模型，该模型能实现更快速、更自然的语音交互。

Sora、可灵、海螺、混元大比拼，哪个是当前最强视频生成模型？

OpenAI的Sora正式上线，但面对Runway、可灵、海螺等已推出的模型的竞争，Sora在多场景生成上各有优势与不足。例如，在罗马教堂风视频生成中，Sora与Runway各有侧重；在生成人物行走视频时，Sora更具故事感；而在根据图片生成视频的任务中，Sora在某些场景下表现欠佳。此外，Sora仅对Plus和Pro会员开放，价格分别为每月20美元和200美元，且Pro会员享有更多高级功能。

美团“妙刷AI”刷屏背后，究竟有何独特之处？

美团推出的“妙刷AI”应用通过AI技术将照片主体转换为Jellycat玩偶，并附带养护指南，操作便捷且富有创意。该应用还提供多种玩法，如“疯狂菜单”和“三国刷”，受到用户欢迎。目前，妙刷AI处于限时免费体验阶段，未来可能通过社交分享等方式实现商业化。美团在AI领域的布局广泛，涵盖大模型、机器人、无人配送等多个领域，并已在AI社交、图像生成及儿童产品等方面有所尝试。

两位前华米高管创立AI宠物硬件公司“星联未来”，成功获得千万元天使轮融资

「星联未来」完成千万元天使轮融资，计划将智能穿戴技术应用于宠物领域，推出集成卫星定位和健康监测的AI宠物硬件产品。该公司旨在通过技术创新推动宠物行业向智能化发展，目标市场包括美国和中国市场，预计产品定价在300美元以上，并将采用订阅服务模式。当前市场上宠物智能硬件尚不成熟，星联未来有望填补这一空白，引领行业发展。

众智维科技完成数千万B1轮融资，深耕智能安全运营赛道

南京众智维信息科技有限公司宣布完成数千万B1轮融资，由广州白云金融控股集团有限公司和北京泓沣私募基金管理有限公司共同投资。该公司专注于AI+网络安全产品的研发，计划利用此轮融资进一步迭代产品、扩展行业应用场景及加强市场渠道建设。众智维科技在2021至2023年间已完成多轮超亿元融资，其产品能够实现网络安全事件的自动化、智能化响应，已在多个行业得到应用，包括金融、政务、运营商等，并计划在未来两年将业务扩展至更多省份。

中国版Recraft和Midjourney来了，创意新时代开启！

星流是一款由中国公司Liblib开发的AI生图产品，对标Midjourney v6.1和Recraft，已在小红书上受到关注。Liblib成立于2023年5月，是中国最大的AI图像生成平台，拥有超千万专业AI图像创作者，用户数量国内第一。星流的质感和构图质量优秀，尽管在prompt理解上略逊于Midjourney v6，但其商业化路径清晰，通过生成图片收费维持健康发展。Liblib的成功在于其强大的技术实力和深刻的用户洞察，体现了在AI领域扎实做产品的价值。

OpenAI员工意外曝光下一代ChatGPT，网友质疑是故意还是失误？

OpenAI研究员Karina Nguyen在推文中意外泄露了未发布的模型“ChatGPT ε”，疑似为下一代模型“猎户座”。据传，“猎户座”在训练20%时已达到GPT-4级别性能，但提升幅度小于GPT-4相比GPT-3。此外，OpenAI更新了Canvas功能，免费用户现在也可使用，并支持直接在画布中运行Python代码。

UCLA教授用3个月时间训练AI生成比较文学课程，旨在解决昂贵教科书难题

加州大学洛杉矶分校将于2025年冬季推出一门由AI生成教科书、作业并提供助教的比较文学课程。该课程将使用名为"Kudu"的AI平台，基于教授的教学资料构建知识库，耗时约3-4个月。此举旨在降低教科书成本，目前美国大学生每年在教科书上的花费约为1172美元。AI助手的回答仅基于课程材料，有助于减轻教师负担，促进师生互动，并有望缩小教育资源差距。

探访广州新华书店：AI教育硬件成热门焦点

新华书店正逐渐转变为教育硬件的展示和销售平台，其中AI技术的应用成为关键卖点。教育硬件不仅提供传统学习工具，还整合了AI教师和各类智能功能，如AI答题、语音教练等，旨在辅助孩子学习并减轻家长辅导负担。家长们倾向于选择这类硬件，因其丰富的教育资源和可控性强的特点。书店通过这种转型，增强了其作为教育硬件体验入口的地位。

AI加持手术管理效率暴增200%，融资1.8亿助力掘金百亿全球手术市场

全球手术管理市场预计从2022年的51亿美元增长至2030年的98.8亿美元，年复合增长率为7.62%。Caresyntax，由Dennis Kogan和Bjoern von Siemens创立，通过AI和数据分析技术提升手术室效率和安全性，已筹集1.8亿美元资金，估值达3.35亿美元。该公司最新C轮融资吸引了多家知名投资机构，计划用于技术创新和全球市场扩展。Caresyntax的平台涵盖手术室数据管理、排班优化等功能，已实现手术室效率和安全性显著提升。

Speak获7800万美元融资，AI技术引领语言学习新潮流

Speak宣布完成7800万美元的C轮融资，估值达到10亿美元。此轮融资由Accel主导，OpenAI、Khosla Ventures和Y Combinator等先前投资者也参与其中。该公司通过人工智能技术生成对话，帮助用户通过听和说的方式学习语言。截至目前，Speak已积累超1000万次应用下载，平均每日使用时间为10-20分钟，提供英语及其他语言的学习服务。资金主要用于扩展可学习的语言种类和增强用户体验。

国产AI音乐大军全面迎战Suno，音乐科技争霸战再升级！

国内AI音乐公司在与Suno的竞争中纷纷推出自有模型，如字节跳动的海绵音乐、昆仑万维的天工SkyMusic和趣丸科技的天谱乐。其中，海绵音乐在中文歌曲生成方面表现突出，而天谱乐则具备多模态输入能力和更高的音质。尽管AI音乐模型快速发展，但仍面临音乐版权和创意情感等挑战。目前，已有4600万人注册使用相关应用，累计创作近1000万首AI歌曲。

具身风暴获超千万天使轮融资，为按摩理疗机器人装上“超级AI大脑”

广东具身风暴机器人有限公司近期完成超千万元人民币的天使轮融资，资金主要用于产品研发、量产及运营。该公司专注于具身智能人机交互技术研发，首款AI理疗机器人已实现量产并批量出货。该机器人通过AI技术提供个性化理疗体验，成本显著低于传统理疗师。未来，具身风暴计划收集500万人次的人机交互数据，以训练通用人机交互模型，推动具身智能机器人技术的发展。

可穿戴陪伴公司再获540万美元融资，却用七成资金买域名！

Friend公司，一家专注于AI可穿戴陪伴设备的初创企业，宣布完成了540万美元的新一轮融资，领投方为Pace Capital，Abstract Ventures参投。该公司此前已融资250万美元，并花费180万美元购买了Friend.com域名。其主要产品是一款智能项链，可通过蓝牙与手机APP连接，提供基于AI的语音交互服务。该产品预计于2025年1月交付，售价99美元，无后续订阅费。尽管目前产品壁垒较低且商业模式尚待探索，但创始人Avi Schiffmann希望通过打造沉浸式关系来实现产品的差异化。目前市场上已有Replika和Character.ai等竞争对手，前者拥有50万付费用户，后者则达到350万DAU。

字节内部认为AI对话产品潜力有限，转而优先发展剪映功能

过去一年，AI对话产品如字节跳动的豆包在用户规模上有所增长，但使用时长、频次及商业化能力未达预期，用户日均使用频次为4-5次，时长5-10分钟。字节跳动认为，基于文本的对话产品可能只是过渡形态，正提升剪映和即梦等多模态产品的优先级，以寻求更低使用门槛和更强的商业化潜力。剪映月活高达1.7亿，即梦也被寄予厚望，成为字节未来AI战略的重点。

Canvas免费开放，集成Custom GPTs并支持Python，OpenAI连续12天发布会精彩继续！

OpenAI宣布将Canvas功能对所有用户开放，并新增Python代码执行功能和与自定义GPT的集成。Canvas支持文档编辑、代码编写、协同工作和实时反馈。Python执行功能包括即时执行、调试、库支持和网络请求。自定义GPT集成Canvas，提供了更优化的工作环境。此外，ChatGPT将增加一款新模型，名为“o1”。

2024年中国AI Agent最佳实践案例TOP20揭晓！

《2024中国AI Agent最佳实践案例TOP20》榜单总结了68个企业级AI Agent实践案例，最终精选出20个具有高价值性、实用性、创新性和示范性的案例。这些案例覆盖金融、通信、医疗、能源、IT/互联网等多个行业，展示了AI Agent技术在解决实际问题、提升效率、优化用户体验方面的巨大潜力。例如，重庆公安的“数字干警”提升了工作效率和准确率，广东电网的智能客服体系提高了客户服务效率和质量。这些案例不仅为相关行业提供了可借鉴的智能化升级路径，也为AI Agent技术的未来发展提供了宝贵经验。

ChatGPT升级为生产力神器！Canvas全量开放，开启人+AI全新协作模式

OpenAI 发布了名为 "Canvas" 的新功能，将其整合进 ChatGPT 主要功能中，使用户能够与 AI 共同完成写作和编程项目。Canvas 支持直接在平台上编辑文字、提供审稿建议及运行 Python 代码等功能。此外，它还能生成定制化的圣诞回信，显著提升工作效率。

Agent获连续千万美元融资，强势进军操作系统领域

红杉资本预测，2025年后AI Agent将趋向“群体协作”，操作系统成为释放其潜力的关键。近期，Agent操作系统领域迎来两笔大额融资：Wordware获得3000万美元种子轮融资，/dev/agents以5亿美元估值获得5600万美元种子轮融资。Wordware强调自然语言编程和统一开发环境，旨在降低开发门槛；/dev/agents则聚焦于连接不同AI Agent，打造跨设备和应用场景的操作系统，类比于开发“属于AI的Android系统”。目前，Wordware已有35万开发者和1000万用户，/dev/agents团队成员具有丰富的操作系统开发经验，预计明年发布首个版本。

Ant Design引领AI界面设计新潮流，定义未来标准！

OpenAI发布的ChatGPT 3.5引领了AGI时代的人机交互变革，而Ant Design团队提出了RICH设计范式，包含角色、意图、对话和混合界面四个核心要素，以应对AI产品界面设计的新挑战。RICH设计范式强调AI应具备明确的角色定位、理解用户意图、有效的对话交流以及融合多种交互方式的界面设计，旨在提升AI产品的用户体验。

谷歌量子芯片实现10^25年工作仅需5分钟，马斯克与奥特曼齐声祝贺

谷歌宣布其新量子计算芯片Willow在5分钟内完成了超级计算机需10^25年才能完成的计算，实现了量子比特数量增加时错误率指数级降低的突破。这一成果标志着量子纠错技术的关键挑战被攻克，展示了量子计算在实际应用中的潜力，并引发了关于量子计算与AI结合的未来可能性的广泛讨论。

谷歌搜索面临AI冲击，即将迎来重大变革

谷歌CEO宣布谷歌搜索将在2025年进行“深刻变化”，主要因受到AI搜索引擎Perplexity及反垄断诉讼的双重压力。Perplexity等AI搜索引擎通过对话模式提供搜索结果，改变了传统搜索方式。谷歌在第三季度收入增长但用户点击广告减少，可能因AI摘要展示导致。面对AI搜索的挑战，谷歌考虑引入付费订阅服务，并强调提供更真实搜索结果或能吸引大量用户。

5人团队获4000万美元种子轮融资，Stability AI实现三位数增长

Stability AI 在新CEO Prem Akkaraju的带领下，实现了三位数增长并消除负债，吸引了包括Facebook前总裁Sean Parker和著名导演卡梅隆在内的新投资者，估值大幅提升。此外，新兴语音AI公司WaveForms AI获a16z 4000万美元种子轮融资，致力于打造情感通用智能，实现语音交互的沉浸式体验。

AI搜索迎来变革：内容平台or通用Chatbot？

AI搜索的趋势显示query变长及语音输入成为主流，尤其在低龄儿童和不会用输入法的人群中。小红书和抖音因拥有独特数据源和内容生态，成为AI搜索的重要机会。AI搜索面临数据多样性和真实性挑战，需大量人工投入。搜索需求分化，垂类产品逐渐占据优势，而AI辅助内容生成在质量上仍难以匹敌现有UGC内容。广告是AI搜索商业化的主要方式，但需解决召回率低的问题。垂直领域KOL营销和社交传播成为提升产品知名度的有效手段。

小米投资的“通用大脑”项目再获新一轮融资

小雨智造近期完成亿元A轮融资，专注开发适用于工业领域的大模型机器人技术，旨在打造“通用大脑”。该公司得到小米集团、王田苗教授及北京智源研究院等机构的支持，并与松下等制造业巨头合作，推动传统制造业的智能化升级。北京市、深圳市和重庆市等城市也在积极培育具身智能机器人产业，通过政策扶持和资金投入加速产业发展。预计中国人形机器人市场规模将在未来几年内快速增长。

大模型与AI眼镜的双向救赎：科技融合的新篇章

国内科技圈正迎来“百镜大战”，多家公司如蜂巢科技、百度、Rokid等纷纷发布支持大模型的AI眼镜。Meta眼镜的成功成为市场热点，但其热销更多归功于轻便舒适的设计而非大模型功能。当前，AI眼镜市场仍面临技术瓶颈和消费者需求不足等问题，且智能眼镜整体渗透率低，仅为1%左右。尽管AI眼镜被视为大模型落地的新机遇，但能否成功尚存疑问。

百川智能联合创始人洪涛离职，某小龙1折强制回购员工期权引争议

百川智能商业化负责人洪涛因个人原因离职，公司内部传闻其被迫加大销售额以满足创始人的套现需求。此外，公司被指强制以极低折扣回购员工期权，引发员工不满。百川智能虽宣称已服务数千客户并建立合作关系，但近期未更新社交媒体，暗示其商业化进程可能受阻，面临行业普遍存在的高成本和低收益挑战。

北斗智影AI平台再获近亿融资，全力加速技术研发

北斗智影获得近亿元融资，由南京文投和中科金财共同出资。该公司专注于AI内容变现，提供从创意到分发的全流程支持，涵盖智能创作、数据分析、多语言本地化等功能。平台通过AI技术提升内容生产效率和变现能力，未来将利用新资金升级技术，推动行业发展。

Reddit推出AI搜索工具直接提供站内信息，绕过谷歌

Reddit 推出了名为 "Reddit Answers" 的AI驱动搜索工具，旨在优化信息检索功能。该工具已在美国地区网页版和iOS版上线，后续将扩展到更多地区和平台。Reddit Answers 提供预设搜索建议，界面简洁且信息来源可追溯，但在实时信息检索和AI摘要准确性方面仍有不足。总体来看，该工具具有实用价值，但还需进一步优化。

智能体崛起重塑大模型战场，刷榜时代悄然落幕

2025年预计将成为智能体落地的元年，客户更加注重智能体的实际效果。智能体采购成为市场热点，客户更倾向于效果付费模式。智能体需具备解决业务问题的能力，至少在降本增效方面实现10到20倍的提升。当前，大模型企业正通过构建智能体生态，推动智能体技术的发展，但其大规模应用还需解决幻觉问题，预计需1至1.5年时间。

知名设计公司用AI打造1000个图标，结果竟是如此！

五角设计公司使用AI工具Midjourney创作了1000个图标，用于联邦政府的performance.gov网站，引发设计师群体的争议。该网站由管理和预算办公室及总务管理局运营，因缺乏内部艺术部门和预算，故采用AI生成图标。设计师批评AI创作丧失独特性和灵魂，质疑大公司借此节省开支。

马斯克新文生图模型爆火！网友疯测人物生成惊人逼真

xAI在其应用Grok中上线了一个新的文生图模型Aurora，该模型生成的图像逼真且高清，尤其是在人物图像方面。然而，Aurora仅上线了几小时。xAI未说明原因，但Aurora并未对生成内容施加过多限制。Aurora与现有模型Flux相比，在生成写实图像和理解复杂指令方面表现更佳，但也出现了一些失败案例。此外，xAI员工透露Grok 3即将推出，并分享了团队的工作氛围。

微信公众号上线AI配图功能，向版权问题说再见

微信公众号新增了“AI配图”功能，允许创作者通过输入文字描述自动生成图片，这标志着AI生成图片时代的到来。相比传统的版权图片，AI生成的图片不仅规避了版权纠纷，而且成本低廉。以视觉中国为代表的版权图库常采取“维权式销售”模式，导致众多创作者面临高昂的版权费用和潜在的法律风险。AI技术的发展使得创作者可以轻松获得合格的配图，降低了创作门槛和成本。

美股AI应用板块业绩暴涨，股价飙升随之起飞

财报季中，多家美股AI应用公司展示了亮眼业绩，如Asana、Docusign和Rubrik，这些公司股价随之大涨。Asana第三季度收入1.84亿美元，同比增长10%；Docusign收入7.55亿美元，同比增长8%；Rubrik收入2.36亿美元，同比增长43%。这些公司的表现证明AI正在从概念走向实际应用，尤其在B端市场，AI应用已经开始实现商业化并带来显著收益。美银预计市场焦点将转向软件股和Agentic AI，AI的货币化将在2025年启动并在2026年加速。

马斯克新AI Grok推出Aurora，照片级逼真图像生成几乎无限制

埃隆·马斯克将Grok AI扩展至每个X用户，随后xAI发布了新图像生成模型Aurora，该模型可在Grok助手中访问。Aurora能根据任何提示生成图像，包括有版权的角色，但处于测试阶段且部分用户暂时无法访问。Aurora对免费用户有每日生成三张图像的限制，而X Premium用户可无限制使用。此外，xAI正在开发独立的Grok应用程序，并已完成60亿美元的融资。

Amp Robotics融资9100万美元，引领机器人垃圾回收新纪元

尽管只有32%的可回收垃圾得到妥善处理，但随着机器人技术的应用，回收行业正迎来自动化的新时代。Amp Robotics等公司通过部署机器人提高回收效率，已获得9100万美元D轮融资。Amp Robotics的系统利用AI和摄像头识别可回收物，采用按每吨收费的模式运营。

一个人就是一个团队，我用AI卖大米的故事

姚社长返乡创业卖大米，因高昂的人工成本和缺乏专业运营团队导致电商事业进展缓慢。借助京东云言犀AI工具，他实现了低成本高效的运营，包括智能生成商品详情页、数字人直播和24小时机器人客服，从而显著提升了销售转化率和运营效率。京东云言犀AI平台已帮助超过80万商家，显著提升电商运营各环节效率，尤其在内容生成、精准营销和视频混剪等方面效果显著。

黄仁勋的机器人梦想：探索人工智能的未来

英伟达CEO黄仁勋看好人形机器人市场，计划将其发展成与汽车一样普及的产品。公司通过搭建仿真训练设施（包括Omniverse、Isaac Sim、Isaac Lab平台）和研发专用芯片（如Jetson Thor），致力于提高人形机器人的训练效率和性能。预计2025年推出的Jetson Thor将支持多模态感知和交互，进一步推动人形机器人技术的发展。黄仁勋认为，未来人形机器人将广泛普及，数量可能达到或超过人类总数。

音乐人讨厌AI的背后：从业者收入大幅缩水真相

国际作者和作曲家协会（CISAC）报告显示，未来四年音乐行业的从业者收入将因AI减少近1/4，预计到2028年，AI生成的音乐将占传统音乐流媒体平台收入的20%及音乐库收入的60%。这表明AI正在挤压音乐人的收入，并引发行业反对。CISAC主席比约恩·乌尔瓦斯呼吁制定合理法规保护人类创作者权益。此外，AI技术的进步使得普通人也能创作高质量音乐，加剧了音乐行业的竞争和收入分配问题。

本文部分素材来自网络，侵删请联系站长。

扫码关注本站公众号/加入知识星球，订阅更多精彩内容