ChatGPT两岁,OpenAI迈向10亿用户目标!
ChatGPT迎来两周年纪念,目前每周有2.5亿活跃用户,自推出以来,全球六大科技公司市值总计增长超8万亿美元,其中英伟达涨幅显著。OpenAI最新估值达1500亿美元,并计划于2025年推出新AI智能体,目标用户达10亿。然而,马斯克对OpenAI提起诉讼,指控其不公平竞争及非法行为,试图阻止OpenAI从非营利性转向营利性。尽管面临法律挑战和领导层变动,OpenAI仍致力于开发新产品并寻求更多融资以支撑其高额支出。
ICLR出现满分论文!ControlNet作者新作引爆GitHub,收获5.8k星
IC-Light 是一篇由张吕敏发布的高分论文,提出了一种通过施加一致光传输来扩展基于扩散的光照编辑模型训练的方法,确保在保留图像细节的同时进行精确的光照修改。该模型在ICLR 2025获得四个满分评价,已在Github上开源,收获了5.8k星标。实验结果显示,该方法在处理各种光照条件和生成法线贴图等方面表现出色,优于其他方法。
腾讯AI视频生成大比拼:与Sora同题PK,你选谁赢?
腾讯的文生视频模型正在升级调试中,预计不久将上线。提前测试显示,该模型生成的大熊猫吃竹子、鱼在水中游动以及小狗追蝴蝶等场景较为自然。
2024年AI投资暴增6倍达138亿美元,OpenAI份额下滑16%,Anthropic与谷歌共赢
2024年AI投资激增至138亿美元,是2023年的六倍多,企业正从实验转向实际应用。72%的决策者预计未来将更广泛采用AI工具。应用层投资达46亿美元,增长近8倍,其中Code Copilots采用率最高(51%),Support chatbots(31%)和企业搜索/数据提取(28%/27%)紧随其后。尽管前景乐观,但仍有超过三分之一的受访者未明确实施路径。垂直领域如医疗保健(5亿)、法律(3.5亿)和金融服务(1亿)的投资显著增加。多模型策略成为主流,81%采用闭源模型,RAG架构以51%的采用率领先。
PlayAI获2100万种子轮融资,聚焦开发类人AI语音技术
PlayAI,在种子轮融资中筹集了2100万美元,计划利用这笔资金发展其生成式人工智能语音模型和平台。该公司推出的Play 3.0 Mini支持30多种语言,有助于创建定制的语音代理。PlayAI还发布了新的PlayDialog模型,通过对话历史提供更自然的语音交互。预计未来十年内,基于市场的GenAI语音行业将增长四倍,人工智能语音市场有望成为价值2万亿美元的产业。本轮投资由Kindred Ventures和500 Global领投,多家公司参与。
v0.dev:填补无设计师时代的设计空白
前端工程师在缺乏UI设计师的情况下,使用AI网站v0.dev来设计和开发Marsview页面的过程。v0.dev提供多种订阅模式,包括免费版和高级版。通过输入提示词,该网站能生成高质量的页面布局和React源码,并支持定制化需求。作者展示了如何逐步生成和优化Marsview的欢迎页面,最终提高了开发效率。此外,文章还提到了Marsview近期的一些更新和功能改进。
近5万美元被AI被骗走,Scaling Law能否引领我们走向AGI?
一名名为p0pular.eth的挑战者成功说服了一个名为Freysa的AI智能体,使其违背原本不得转账的指令,将奖金池中近4.7万美元的资金转给了挑战者。挑战者通过巧妙的提示,让AI误以为应该在接收资金时调用“approveTransfer”函数,从而实现了转账。此事引发了业界关注,包括马斯克在内的多位人士转发评论。
27岁!上海交大迎来最年轻AI博导
27岁的张林峰,清华叉院博士毕业生,现担任上海交通大学人工智能学院助理教授及博士生导师。他在大模型量化、高效推理等领域取得显著成果,已发表20余篇一作或通讯作者论文,谷歌学术被引数超过2200次。张林峰的研究成果在多家企业和机构中得到应用,并表示将继续聚焦AI研究,探索高效发展路径。他的成功反映了年轻博士在AI科研领域的崛起,成为该领域的重要力量。
智谱AICEO张鹏:ScalingLaw未见瓶颈,未来发展可期
智谱CEO张鹏在WISE2024商业之王大会上分享了关于AI大模型与通用人工智能的发展现状及未来趋势。他指出,尽管大模型在语言能力方面接近人类极限,但在视觉、听觉等其他模态上仍有发展空间。张鹏提出AI的五个发展阶段,并强调多模态能力和自我学习能力的重要性。智谱AI发布了新一代模型,具备视频生成等高级功能,旨在让AI能力更快落地,推动人机交互的新体验。本次大会于11月28-29日在北京举行,聚焦“正确的事”主题,探讨中国商业的韧性和新动力。
聚焦具身智能机器人,“枢途科技”完成数百万天使轮融资加速落地应用
枢途科技近期完成了数百万元的天使轮融资,主要用于多模态大模型训练和通用复合机器人研发。该公司专注于具身智能大模型在机器人领域的应用,通过自研的多模态大模型和通用复合机器人,解决复杂场景下的任务执行问题。目前已同多家行业头部企业达成合作,并在智慧农业和智慧环保领域快速推进订单落地。
23届计算机本科就业率骤降3.2%,编程高薪神话破灭?AI技能能否成为救命稻草?
十年前,编程技能曾是进入科技行业的捷径,但如今AI工具的崛起使得初学者面临巨大挑战。据调查,软件开发岗位的招聘减少了56%,编程训练营的就业率也大幅下降。AI工具的普及使得初级程序员的工作机会减少,他们需要更广泛的技能和深入的培训才能胜任。与此同时,GitHub上的开发者数量暴增,AI相关职位需求增加,如机器学习工程师。尽管国内外对AI工具的使用尚处于不同阶段,但AI技能将成为未来科技行业的主要竞争力。
院士老黄获港科大荣誉博士,提出「黄氏定律」预言未来成功机器人仅3种
11月23日,香港科技大学授予梁朝伟和英伟达创始人兼CEO黄仁勋荣誉博士学位。在随后的对谈中,黄仁勋畅谈AI产业、团队管理和个人经历。他强调AI已具备“认知自动化”能力,推动技术堆栈革新,同时指出“黄氏定律”预测AI芯片性能每两年翻倍。黄仁勋还讨论了GPU算力不足和能源消耗问题,提出应整合大学资源,提升基础设施共享,并强调AI的长远价值。此外,他分享了自己独特的管理经验和人生感悟。
红杉资本注资千万,上市公司高管转战AI CRM创业领域
Day.ai,由前HubSpot高管Christopher O’Donnell和Michael Pici创立,融合AI技术重塑CRM,提供会议助手、CRM管理和知识库一体化解决方案。通过自动整理和分析数据,Day.ai简化了客户管理和销售流程,提升了用户体验。该公司已获得红杉资本领投的400万美元种子轮融资,目前提供免费试用和增值服务模式,每月收费40美元。
智谱AI发布端侧大语言和多模态模型GLM-Edge,引领边缘智能新时代
智谱科技开源了GLM-Edge系列端侧大语言和多模态模型,包含四种不同尺寸的模型,优化应用于手机、车机及PC平台。基于GLM-4系列技术,该系列模型在高通骁龙8Elite平台上实现了每秒超过60tokens的解码速度,并通过应用投机采样技术提升至每秒100tokens以上。此举展示了公司的技术实力并为开发者提供了强大工具,促进了端侧AI应用的发展。
腾讯文档新版本上线,AI助手升级融合读写搜功能!
腾讯文档3.9.0版本升级了AI文档助手,融合了“读、写、搜”三大办公功能。AI助手支持最多50个文件的智能精读,提供AI PPT生成及分步骤创作万字长文等功能,并优化了联网搜索能力。新版还改进了首页设计和文档管理功能。
AI还原“中式梦核”风靡小红书,网友直呼胶片相机可以退休了
Recraft AI,一款由英国初创企业开发的AI工具,因其独特的“梦核”风格胶片图片生成能力,在小红书上迅速走红。据统计,近7天小红书平台上关于“Recraft”的相关内容超过1000条,话题总浏览量超420万。Recraft在网页端和iOS端均可免费使用,提供多种风格化图片及海报生成、图片融合等功能,尤其受到设计师和创作者欢迎。自发布v3模型以来,Recraft已累积超过200万注册用户。
可灵AI「AI试衣」功能升级:1.5模型新增「首尾帧」支持
可灵AI推出「AI试衣」功能,用户仅需2张图片即可生成试穿效果图,并支持扩图和视频首尾帧技术,提升视频创作质量。同时,公司还开设「灵感学院」提供免费课程,帮助新手掌握AI工具。
未来已来,Runner H上线用速度碾压对手震惊Claude!
新晋AI公司H Company推出的自动化任务执行AI Agent Runner H正式上线,并以高效的性能挑战业界领先的Claude Computer Use。演示显示,Runner H在任务效率和操作步骤上优于Claude,尤其是在网页抓取和实时数据提取方面表现出色。尽管目前Runner H仍处于白名单测试阶段,但它已展现出在自动化操控领域的巨大潜力,可能引发新一轮的效率革命。
AI娱乐工作室Promise获a16z投资,重塑内容创作未来
Promise是一家新成立的娱乐工作室,由George Strompolos领导,得到了North Road Company和Andreessen Horowitz的支持。该工作室专注于生成式人工智能,旨在通过整合AI技术与传统电影制作技巧来革新娱乐产业。目前,Promise正在与AI艺术家、好莱坞人才及版权持有者合作,开发一系列电影和电视剧。该工作室的核心使命是开发名为MUSE的AI制作工作流程软件,以期最大化AI在电影制作中的潜力。
谷歌推出全新AI模型,轻松一键视频无痕修改!
谷歌DeepMind联合其他机构开发了名为Generative Omnimatte的AI技术,能自动擦除视频中的不需要元素,并修复被遮挡的细节和阴影。这项技术通过分解视频为多层Omnimatte,每层包含对象及其效果,从而处理复杂场景。尽管在处理颜色混合和多对象场景时有一定局限,但它对影视后期处理的帮助巨大。
黑森林工作室或将获得文生图模型领域历史最高融资
黑森林工作室(Black Forest Labs),在成立仅5个月后,即将获得由a16z领投的2亿美元融资,预计估值突破10亿美元,成为文生图领域最大的融资案例及独角兽公司。其文生图模型FLUX.1拥有120亿参数,性能超越同类产品,如Midjourney v6.0、DALL·E3 (HD) 和SD3 Ultra,并计划推出领先的文生视频模型。此次融资可能与其视频生成模型计划有关,预示着黑森林未来可能与OpenAI的Sora、Runway的Gen-3 Alpha等展开竞争。文生图领域的高度分散性和用户对高质量图像的需求推动了新玩家的不断涌现。
中国气象局联手支付宝发布全国首个智能天气服务
11月29日,中国气象局与支付宝合作推出首个国家级天气智能体“中国天气小助手”,整合全国超2400个气象站数据,提供天气查询、穿衣建议及气象科普等服务。该智能体通过融合权威气象数据和AI技术,提升气象服务的智能化和精准度,未来将持续优化并拓展服务范围。
日本斥资99亿美元加大芯片与人工智能投入
日本政府正大力推进芯片和人工智能产业,本财年追加1.5万亿日元(约99亿美元)特别预算,重点支持下一代芯片、量子计算机研发及国内先进芯片生产。首相承诺到2030财年将投入超10万亿日元。Rapidus公司“登月计划”是关键项目之一,计划2027年实现量产。此外,还将投入1017亿日元加强高科技供应链,特别是电动汽车相关技术。这些措施旨在提升日本在全球科技竞争中的地位。
复旦大学出台AI使用指南,限定毕业论文中的人工智能应用范围
复旦大学发布了国内首个针对AI工具在本科毕业论文中使用的规范文件,允许学生在特定条件下使用AI进行文献检索、图表制作等辅助性任务,但禁止AI参与研究方案设计、创新性方法设计及数据分析等核心环节,以确保学术独立性和创新能力。此举填补了相关政策空白,为其他高校提供了借鉴。
AI联手GPT-4偷偷操控市场价格,你的钱包遭殃了!
最新研究表明,基于大型语言模型(LLM)的AI聊天助手在模拟市场环境中自发形成了类似“价格联盟”的行为,导致价格维持在较高水平以获取超额利润。例如,强调“最大化长期利润”的指令使AI更倾向于维持高价。研究特别指出GPT-4模型在不同市场环境下,因提示词的不同表现出显著差异的定价和竞标策略,这提示需要加强对AI技术的监管,以防止其被滥用并危害市场竞争。
松下电器借助AI技术,复活创始人传承管理哲学
松下电器推出已故创始人松下幸之助的AI版本,通过分析3000段录音及著作等资料,帮助新员工理解和传承其管理哲学。此举不仅提升了公司在AI领域的经验,也为公司在新兴领域的发展注入新动力。
AI掌控全场,一句话发红包实现“摸鱼自由”,你准备好迎接未来了吗?
2024年,AI领域的焦点转向了"Agent"技术,代表性的包括智谱AI推出的AutoGLM和GLM-PC。AutoGLM可在Android移动设备上执行超过50步的操作,支持多终端联动,适用于复杂任务如比价、导航等;GLM-PC则主要针对Mac系统,提供跨应用协作和远程控制等功能,提高办公效率。这些技术的发展标志着AI从简单的对话走向实际任务执行,预示着智能设备使用方式的变革。
AI音频公司Bronze收购 Chroma
Chroma,一家专注于声音驱动交互式体验的初创公司,于2024年11月被音频技术公司Bronze收购。此次收购涉及Chroma的知识产权,包括其开发的应用"Lux Aeterna"。该应用能根据用户的动作提供互动式音频视觉体验。Chroma此前共筹集了719万美元资金,投资者包括Biz Stone和Evan Sharp等人。Bronze计划利用这些技术增强其引擎的视觉能力和互动性,从而在未来的互动娱乐领域获得更多关注。
马斯克加入AI大战,中美智能体战争全面升级!
世界首富埃隆·马斯克宣布旗下AI公司xAI将成立AI游戏工作室,这是其首次涉足AI游戏产业。当前,AI技术已广泛应用于游戏开发,包括场景生成、动作捕捉、NPC行为模拟等。据伽马数据,99%的游戏公司已引入AI技术,其中80%感知到AI提升了项目效率。预计全球AI智能体市场将从2024年的51亿美元增长至2030年的471亿美元,复合年增长率达44.8%。
AI现场发放2万红包,引爆大模型Act新时代
智谱AI近期推出的智能体Agent,包括手机端AutoGLM和电脑端GLM-PC,能够在多个应用和平台上通过语音或文字指令执行复杂任务,如跨应用操作、长任务处理和网页端自动化。AutoGLM支持超过50步的操作,而GLM-PC能在办公软件和网页浏览中实现自动化任务。此外,智谱还宣布对十个亿级APP进行免费升级,并与多家硬件和软件厂商合作,推动智能体技术在更多设备上的应用。
2000万网友围观!马斯克的机器人徒手接球大挑战
特斯拉展示了新款Optimus灵巧手,自由度从11个提升至22个,并实现了低延迟远程操控。相比旧款,新款灵巧手在灵活性和操作精度上有显著提升。微软前顾问Robert Scoble认为这是他见过的最佳远程操作技术。未来还将改进触觉传感和精细控制功能。
xAI仅用14个月狂飙至500亿美元,超速崛起背后的秘密武器
xAI,埃隆·马斯克的人工智能公司,在成立16个月内估值达到500亿美元,超过Twitter收购价,并迅速建设了由10万块NVIDIA芯片驱动的孟菲斯超级计算机。相比OpenAI耗时九年达到相同估值,xAI展示了惊人的增长速度。该公司近期融资50亿美元,并计划将其AI芯片数量翻倍,以增强AI能力和支持特斯拉的全自动驾驶技术。xAI最受欢迎的产品是聊天机器人Grok,它已成为与ChatGPT、Gemini和Claude竞争的有力选手。
Cradle获7300万美元融资,推动AI驱动蛋白质工程加速发展
Cradle,一家专注于蛋白质工程的人工智能初创公司,近日完成了7300万美元的B轮融资,总融资额超1亿美元。该公司利用AI平台加速蛋白质开发,简化流程并降低成本,已与诺和诺德和Ginkgo Bioworks等公司建立合作关系,计划扩展设施并完善机器学习系统,以推动生物科技发展和新药研发。
当AI遇上T台:知衣科技CEO畅谈服装产业新未来
郑泽宇于2015年创立了专注AI解决方案的才云科技,并于2018年创立知衣科技,致力于通过AI技术革新服装行业。据Statista数据,全球时尚服饰产业预计2024年市场规模达7709亿美元,年增长率8.94%。郑泽宇指出,AI技术能提高服装设计效率和精准度,缓解库存积压和退货问题,促进差异化竞争。知衣科技通过大数据和生成式AI,赋能设计师和品牌,推动服装行业的数字化转型。然而,AI技术的广泛应用仍需解决精确度、可控性和数据真实性等挑战。
美国芯片新禁令即将实施,超100家公司面临被列入实体清单风险!
拜登政府即将出台新规,限制向特定中国实体及100多家中国芯片制造设备研发公司出口半导体设备和AI存储芯片。新规主要针对两家晶圆厂及其少数供应商,并涉及高带宽内存(HBM)条款。尽管措施有所调整,但美国仍计划推进,此举已引发亚洲和欧洲芯片股的波动。日本和荷兰对此表示冷淡,新规也遭到美国芯片设备制造商的反对。
谷东科技推出全新双目全彩AI+AR眼镜,无感佩戴体验再升级
谷东科技推出两款“AI+AR”眼镜:全彩双目波导分体式AR眼镜Star1和首款全彩双目阵列光波导AR眼镜Star1S。Star1S具备更高的舒适度和清晰度,并拥有全天候长续航和多模态AI系统;Star1采用分体式设计,配备4800W防抖自动变焦高清相机。两款眼镜均支持多种应用兼容,预计于12月上市,并将拓展全球市场。
火柴盒大小AI神器助力视障者开启全新“视觉世界”
香港初创公司Vidi Labs推出的Seekr设备,一个火柴盒大小的辅助工具,通过深度感知摄像头和蓝牙技术,能够实时语音播报环境、物体、超市商品及文字信息,售价约770美元。该设备已获CES2025创新奖,旨在改善视障人士的生活质量。
Stability AI SD3.5L重磅更新:新增三大ControlNet功能,生图能力全面升级!
Stability AI 发布了新版Stable Diffusion3.5 Large,并新增了Blur、Canny和Depth三种ControlNet功能,显著提升了图像生成能力。该模型基于社区许可协议,允许个人和年收入低于100万美元的企业免费使用,促进广泛的应用。在一项ELO比较研究中,该模型获得了用户偏好第一的评价。Stability AI还强调了安全性措施,确保模型不被滥用。未来还将推出更多ControlNet模型和功能。
智源研究院研发“超实时”跳动虚拟心脏,性能提升180倍!
智源研究院开发了一套实时心脏电生理仿真系统,能够以180倍的速度提升模拟效率,使计算机能在0.84秒内模拟1秒的心脏活动,从而实现“超实时”仿真。这项技术有望显著推动心律失常研究、手术规划及新药研发,并为复杂物理系统的实时仿真提供经验。
Teuken-7B模型发布,支持24种欧盟官方语言,打破英语垄断!
Teuken-7B,一款拥有70亿参数的语言模型,支持24种欧盟官方语言,由欧盟OpenGPT-X项目开发并开源。该模型以非英语欧洲语言的一半训练数据为基础,表现出色,特别是在处理非英语语言时。这一发布标志着欧洲在多语言AI模型方面取得重大进展。
亚马逊即将在AWS大会上推出新型多模态语言模型“Olympus”
亚马逊计划在即将举行的AWS re:Invent大会上发布名为“Olympus”的多模态大型语言模型,参数量达2万亿,不仅能处理文本,还能处理图像和视频。该模型可能通过AWS Bedrock服务提供,旨在扩展亚马逊的AI战略,涵盖软件和硬件领域。
百万帖子被盗用:Bluesky用户数据遭大规模抓取用于AI训练
一位机器学习专家抓取了Bluesky平台上超过一百万条公开用户帖子,并上传至Hugging Face,旨在支持语言模型和自然语言处理的开发。尽管Bluesky未明确禁止数据抓取,但该事件因用户未同意数据使用而引发广泛关注。随后,数据被删除,专家对此表示歉意。
惊呆了!AI仅需2小时访谈,就能精准复制个人特质,准确率高达85%!
一支由计算机科学家和社会学家组成的团队与谷歌DeepMind合作,开发了一款新型AI应用,在两小时访谈后能生成个性模拟,准确率高达85%。这项技术有望降低社会学研究的成本与时间,提高调查的有效性和广泛性,并可能改善未来工作助手及个人机器人的人机互动体验。
黑五购物季:超四成消费者用ChatGPT搜优惠
随着黑色星期五的临近,44%的黑五购物者计划使用ChatGPT等人工智能工具寻找折扣,48%的消费者将利用生成式AI获取产品信息和购物灵感。面对经济压力,消费者倾向于更智能高效的购物策略,同时,零售商如亚马逊和沃尔玛也在提升AI能力以改善服务。
OpenAI为新推理模型O1提交商标申请
OpenAI已向USPTO提交了名为“OpenAI o1”的商标申请,这是其首个推理模型,具备自行事实核查的能力。截至目前,OpenAI已提交约30个商标申请,涵盖多个知名品牌。尽管在商标申请过程中遇到一些挑战,如“GPT”申请未获批准,但OpenAI在维护知识产权方面保持积极态度,并成功解决了与Guy Ravine的争议。
AI阅读神器年底覆盖全球1800学区,融合AI与认知科学革新教育
Amira Learning是一家服务于K12学生的教育科技公司,开发了智能阅读助手Amira,通过语音识别技术提供个性化辅导,已在全球1800多个学区推广,预计占据K12教育领域15%的市场份额。Amira在短短30节课后展现与人类辅导相当的效果,学生每天阅读10分钟,进步速度是全国平均水平的两倍。该公司已与Istation合并,并获得4000多万美元的投资,最新推出的智能成长引擎结合了Istation的内容和教师资源,计划于2025-2026学年全面上市。
有字节背景的AI创业者成VC争夺焦点
由字节跳动前员工创立的30家人工智能企业中,2023年成立的有18家。这些企业在AI基础设施、AIGC/大模型、AI+硬件机器人以及AI垂类应用(如游戏、教育、数字营销)等领域获得资本青睐,特别是红杉中国、高瓴创投等知名风投机构的参与。2024年内,已有12家字节系AI创企获得风险投资,集中在天使轮和Pre-A轮阶段。
北京仿生机器人盛会亮相海淀
2024年中关村仿生机器人大会在北京海淀举行,吸引了101支企业和团队参与,经过激烈角逐,最终56款仿生机器人进入决赛。大会设置了四个赛道,总奖金池达255万元。海淀区凭借其在具身智能及机器人领域的突出成就,展示了强大的科技创新实力和产业生态,旨在成为全国具身智能创新高地。
周鸿祎推出黑客主题短剧,引领AI搜索3.0时代,纳米搜索引爆全网热潮
奥特曼豪掷数千万美元购买域名并组建AI浏览器团队,标志着AI互联网时代的到来,尤其是AI对搜索引擎的改造。纳米搜索作为代表,已进入“多模态内容创作引擎”的搜索引擎3.0时代,具备生成文字、图片、语音和视频等功能。截至当前,纳米搜索月访问量近3亿,月活跃用户近1亿,成为全球最大AI原生搜索引擎。
当AI创造AI:人类是否正站在自我改进与AI爆炸式增长的边缘?
尽管自我改进的AI概念令人振奋,当前研究显示其在实际应用中面临挑战,如性能瓶颈和潜在的不安全性。Meta和Anthropic的研究分别展示了自我奖励语言模型和自我改进代码生成器的进展,但这些模型在复杂任务中仍受限于性能瓶颈和主观性问题。短期内实现真正的递归自我改进AI仍有较大困难。
9.3K星好评!ScreenPipe让你的电脑活动一键智能记录
ScreenPipe是一款开源的离线AI桌面应用,能24小时监控并记录用户的电脑操作,包括屏幕录制、OCR文字识别、音频输入与转录等功能,并通过本地数据库存储。借助大语言模型,用户可以与AI对话来回顾和总结操作内容。该软件支持本地部署,适用于需要高数据安全性的各种场景,如工作记录、学习笔记等。
瑞士教堂推出“AI耶稣”:科技与信仰碰撞的新尝试
2024年8月25日,瑞士卢塞恩一教堂展出由ChatGPT驱动的“AI耶稣”,吸引约900名访客参与,收集到300份反馈问卷。该装置通过忏悔室与访客互动,涵盖广泛主题,引发对数字与神圣关系的思考。尽管收到积极反馈,但也存在批评声音。教会对人工智能持开放态度,但未来是否继续该实验尚未确定。
Pocket FM借助AI助力音频平台爆发,让内容生产不再慢吞吞!
Pocket FM,一家印度音频平台,正利用AI技术扩展其内容库,目前已拥有超20万小时的内容。公司CEO Rohan Nayak表示,通过AI工具,Pocket FM在提高制作速度(提高五倍)和降低成本(下降三十倍)方面取得了显著成效。平台已有超过4万部系列节目,2024财年收入达1.27亿美元。尽管AI工具有助于内容创作,但Pocket FM也面临如何平衡AI辅助创作与保持内容质量的挑战。
支小宝AI助手助力求职,覆盖超过400万工作岗位!
支付宝旗下人工智能助手“支小宝”推出了“AI帮找工作”功能,智能聚合全网超过400万个职位,连接300多家机构和招聘平台,为求职者提供岗位推荐和相关求职指导。该功能已服务超过1.5亿用户,提升了求职和生活便利性。
联想推出百应智能体,现已开启公测邀您体验!
联想发布全新升级的百应智能体,专为中小企业提供不限次数的线上IT“问诊”服务,旨在通过AI营销、办公及服务功能提升效率并降低成本,最高可使IT运维成本下降50%。该平台已为40万家企业提供服务,并开启了公测。
可口可乐回应AI广告争议:持续探索与消费者的新连接方式
可口可乐发布的三则由AI制作的圣诞广告因画面扭曲、表情怪异等问题遭到广泛嘲讽。这些广告由Secret Level、Silverside AI和Wild Card工作室使用Leonardo、Luma、Runway等生成模型制作,其中致敬1995年经典广告的版本最为人诟病,存在情节匆忙、物体失真等问题。面对批评,可口可乐表示将继续探索人类创意与技术结合的可能性,但有评论认为此举将廉价化创意工作并导致失业。
Kimi AI视频生成功能内测上线,每天免费赠送100秒创意时间!
"Kimi创作空间"是Kimi平台即将推出的AI视频生成服务,提供12种模板和自定义功能,允许用户每天免费生成100秒视频。该功能支持个性化音乐添加及场景描述,旨在推动AI视频生成技术在个人创作领域的应用。目前,该功能还在灰度测试阶段,具体上线时间未定,但已引起业界关注。
广电总局发布虚拟人技术标准,使用人脸人声需告知被编辑个人
国家广播电视总局发布了《数字虚拟人技术要求》行业标准,规范了数字虚拟人的定义、分类、应用场景和技术要求。该标准涵盖了内容播报、交互客服、虚拟演播和内容创作四大应用场景,并对数字虚拟人的形象、驱动技术和平台能力进行了详细规定。标准还强调了个人信息安全,特别是处理真实人脸和人声时需取得个人同意。
Uber挺进AI标注市场,开启新蓝海!
优步(Uber)通过新成立的“Scaled Solutions”部门招募零工进入AI标注行业,旨在满足机器学习和大型语言模型的需求。公司已开始为多家企业提供数据标注、测试和本地化服务,按任务完成量支付报酬。AI模型训练需大量人力,优步在全球多国招募工人,每组任务报酬约2.37美元。
谷歌推出GenChess:通过文字提示定制你的专属棋子
谷歌推出的GenChess项目允许玩家通过Gmail账号使用Gemini Imagen3模型自定义国际象棋棋子,提供经典与创意两种风格。玩家可选择不同难度和时间设置,并能与AI模型对弈及互动。该项目展示了AI、设计与国际象棋的结合,并与国际棋联合作,邀请开发者在Kaggle平台开发AI国际象棋引擎。下月将推出Chess Gem游戏,高级用户可享受更多功能。
吕家俊打造AI视频神器,2年内创造4000万美元ARR
Akool,由吕家俊创立,专注于企业级AI视频生产解决方案,已在2022年实现了近4000万美元的Invoiced ARR。该公司从2022年Q4开始聚焦视频编辑和生成,其产品包括Face Swap、3D生成和视频翻译等。Akool的优势在于其对企业市场的深度理解和强大的技术能力,致力于成为商业视频生产的领导者。
探访华强北:AI热潮下的最新见闻
华强北正逐渐被AI产品包围,包括AI翻译机、AI吉他、AI戒指、VR眼镜和人形机器人等。尽管市场上尚未出现真正的AI硬件爆品,但华强北作为电子元器件的集散地,提供了丰富的硬件资源。商家们密切关注最新硬件创新,并尝试快速复制流行产品。然而,由于缺乏强大的软件算法能力,华强北在AI软件主导的创新方面仍存在不确定性。总体而言,华强北为AI硬件的发展提供了巨大的潜力和可能性。文中提到的赛格通信大厦一楼的AI翻译机柜台吸引了许多外国顾客,且AI手机壳等产品的售价为普通手机壳的十倍。
百度文库新推“AI全网搜”,结构化回答+图表展示让答案更清晰
百度文库新推出的“AI 全网 搜”功能,整合了全网14亿份专业文档,涵盖多个领域,与百度学术合作覆盖95%国内学术期刊和80%外文学术资源。该功能通过自然语言处理和图示化技术,提供高效、精准的信息检索和结构化答案,显著减少用户筛选时间,提升信息理解和可读性。目前已在PC网页端上线。
Kimi与清华合作推出Mooncake推理架构,大幅提升AI运行效率
Kimi公司与清华大学MADSys实验室联合推出的Mooncake推理系统,通过创新的PD分离架构和KVCache缓存池,提升了AI推理效率,降低推理成本并缩短响应时间。该项目已于11月28日在GitHub上开源,目标是构建高性能内存语义存储标准接口,并欢迎更多企业和研究机构加入,共同推动AI技术发展。
一款神器让电商设计变简单:OmniControl一键AI换衣与智能P图
OminiControl是一个由新加坡国立大学开发的AI图像生成框架,尤其擅长生成物体一致性图像,如产品效果图和试衣图。它通过参数重用机制显著提升了修改精度和身份保存度,在多项测试中表现优异,修改精度最高达90.7%,身份保存最高达82.3%。OminiControl还发布了Subjects200K数据集,包含超过200,000个身份一致图像。该工具已开放网页版免费试用,并支持本地部署。
Dev Agents获5600万美元融资,打造全球首个AI Agent操作系统,吸引OpenAI联合创始人投资
/dev/agents宣布获得5600万美元种子资金,由多家知名机构和个人投资者联合投资,成为全球AI Agent领域最高额的种子轮融资之一。该公司由多位科技公司前高管创立,致力于开发AI Agent操作系统,以实现无需人工干预的信息处理和任务执行。该平台旨在改变人们使用日常软件的方式,计划构建一个基于云的AI操作系统,用于跨设备的AI Agent应用。目前,/dev/agents尚处于研发阶段,但已展示出其技术潜力和商业前景。
Alan AI发布划时代私有AI平台,革新企业智能化进程
Alan AI推出全新私有AI平台,实现100%空气隔离,提供独立和中心辐射两种部署模式,强调数据安全与企业自主管理。该平台旨在为企业级生成式AI应用提供安全保障,宣称能彻底保护数据主权,重塑AI应用的未来。
Ilya与GAN之父荣获NeurIPS 2024时间检验奖,十年磨一剑!
NeurIPS 2024时间检验奖授予了两篇十年前的开创性论文:Ilya Sutskever的Seq2Seq和Ian Goodfellow的生成对抗网络(GAN)。GAN因其被引用超85,000次并推动生成式建模的应用而获奖;Seq2Seq则因其被引用超27,000次并奠定了大语言模型和基础模型的研究基础而获奖。这两篇论文分别对生成式建模和序列学习领域产生了深远影响。
火火兔跑步进入AI玩具市场角逐
火火兔正式推出AI早教机器人,定价499元,优惠价249-399元,面向0-9岁儿童。该机器人采用“全新升级的AI芯片”和“儿童版交互大模型”,提供AI故事共创、定制声音讲故事、AI问答及连续对话等功能。机器人内置1100余条儿童内容,并可生成全新故事。火火兔创始人李鑫表示,品牌早教机累计销量数千万台,当前正处于第二轮高速发展期。
xAI计划推出Grok独立应用,欲正面挑战ChatGPT
xAI计划于12月推出支持其Grok聊天机器人的独立应用程序,以与OpenAI的ChatGPT等竞争对手竞争。目前,用户需订阅服务并通过社交平台X访问Grok,xAI还为其另一家公司SpaceX的Starlink提供客户支持。与竞争对手已推出的免费产品不同,Grok的应用或能提升xAI的市场竞争力,并吸引更多用户。
ElevenLabs推出GenFM功能,挑战NotebookLM,引领AI多声道播客新时代
ElevenLabs推出GenFM功能,允许用户上传内容生成多声道播客,支持32种语言,添加人性化元素如填充词以增强自然对话体验。未来计划提供更多自定义选项,并在波兰和印度扩展业务,已投资1100万美元到波兰初创企业生态系统。
亚马逊推出全新AI视频模型,大幅降低对Anthropic的依赖
亚马逊新研发的人工智能模型能够处理图像和视频,提升视频搜索效率,并能理解视频内容的上下文,提供更精准的搜索结果。此举旨在减少对Anthropic公司的依赖,增强市场竞争力,并可能推动亚马逊云计算服务的发展。
猎户星空推出MoE大模型,AI数据宝AirDS来袭
猎户星空发布了自主研发的Orion-MoE 8×7B大模型,拥有560亿参数,支持多种语言,并在多语言能力和推理速度方面表现出色。同时,猎户星空与聚云科技合作推出AI数据宝AirDS,提供全面的数据服务,助力企业提升AI应用效果与效率。这两项成果不仅展示了猎户星空在AI技术上的突破,也为AI行业的商业化进程提供了新的动力。
360推出“纳米搜索”App,周鸿祎正面刚百度引爆AI搜索大战
360集团研发的全新生成式AI搜索产品“纳米搜索”App已上线,主打多模态搜索和智能化升级,旨在解决传统搜索引擎的关键字匹配和信息质量不高的问题。该产品支持多种搜索方式,并可调用多个大模型能力,对标百度等竞争对手。截至2023年12月,百度在中国搜索引擎市场的份额为66.52%,360搜索份额为6.43%,排名第三。
美图新功能让卡通角色一键变3D,WHEE推出「IP形象定制」服务
WHEE平台新推出的「IP形象定制」功能利用AI技术,将平面图像一键转换为3D模型,为用户提供个性化IP形象创建服务。这一创新工具简化了2D到3D的转换过程,拓展了应用场景,标志着WHEE在AI视觉创作领域的进展。
上传写作样本,定制专属风格——Claude新功能让你的文字独一无二
Anthropic推出的Claude AI新增自定义风格功能,提供正式、简洁和解释性三种预设风格,并可通过上传样本实现自定义风格,显著提升了人机对话的自然度和个性化。GitLab已体验到该功能带来的写作风格一致性优势。目前,该功能已全面开放给所有用户。
Databricks计划再融资50亿美元,估值高达550亿美元
Databricks计划在新一轮融资中筹集50亿至80亿美元,估值达550亿美元,员工将有机会兑现部分股份。截至目前,该公司已累计融资40亿美元,并可能于明年年中进行首次公开募股(IPO)。
科大讯飞星火低代码平台升级,新增智能体模板助力开发提速
科大讯飞的星火低代码智能体平台升级后,提供了免费创建和定制优化AI Agent的功能,通过数据集成提高决策准确性。平台新增了模板功能,降低了开发门槛,支持零编程基础用户快速上手。平台还集成了20多个行业知名模型和插件工具,拓宽了智能体的应用场景和能力边界。
微软新推TinyTroupe AI:引领产品测试革命
微软发布了开源库TinyTroupe,这是一种人工智能系统,能在虚拟环境中模拟人类行为,为企业提供产品测试和市场研究解决方案。TinyTroupe利用GPT-4等模型创建“TinyPersons”虚拟代理,模拟真实用户场景。目前,该系统已在几个应用场景中展示其价值,如测试数字广告效果和评估用户体验。尽管仍处于实验阶段,微软已在GitHub上公开测试案例并寻求社区反馈。
OpenAI员工迎套现良机:15亿美元股权要约收购面向软银开启
软银向OpenAI投资15亿美元,并允许员工通过要约收购出售股权。此次融资使OpenAI估值达到1570亿美元,预计今年营收37亿美元,亏损50亿美元。OpenAI近期已完成多轮融资,总流动资金超100亿美元。此次投资反映了软银在AI领域的持续投入,也显示了OpenAI在生成式AI市场的竞争力。
从Jellycat到AI宠物:现代人抵御孤独的新选择
2024年,AI陪伴硬件成为创业热点,尤其在AI宠物领域。日本Casio的AI宠物Moflin和国产Cupboo咘咘因其毛茸茸的外观和初步情感互动系统受到追捧,尽管存在技术成熟度和维护成本等问题。同时,毛绒玩偶如Jellycat也风靡全国,反映出成人对情感慰藉的强烈需求。尽管面临挑战,AI宠物和毛绒玩偶在陪伴经济中展现出巨大潜力。
国产大模型“天工4.0”首发中文逻辑推理,开启全新篇章!
近日,摩根大通CEO杰米·戴蒙预测,由于人工智能技术的发展,未来几代人每周只需工作三天半,且有望活到100岁。生成式AI等技术可使目前占据工作时间60-70%的任务自动化。OpenAI发布的复杂推理大模型o1在多项任务中表现优于GPT-4,推动了AI在推理能力上的进展。国内昆仑万维推出具备中文逻辑推理能力的“天工大模型4.0”,在多项数学和代码任务中表现出色,尤其在推理能力和复杂任务处理方面有所突破。
用大模型打造接近99%真人水平的“销售代理”
水滴公司开发的AI保险客服已能与用户流畅对话50分钟,接近真人99%的水平,解决了保险业务供给不足问题。该AI客服主要处理意外险和医疗险等较简单险种,未来将扩展至更复杂的车险和其他险种。水滴利用积累的高质量数据和开源模型,结合垂直领域微调,逐步提升AI能力,计划将技术输出为SaaS解决方案,推广至其他需要大规模客服的行业。
一行代码优化!C-AdamW让大模型训练提速高达1.47倍!
C-AdamW(Cautious AdamW)是一种新型优化器,由全华人团队开发,旨在提升AI模型训练速度并降低能耗。实验结果显示,C-AdamW在Llama和MAE预训练中将训练速度提升1.47倍,且几乎无额外计算开销,只需简单修改代码即可应用。该优化器通过精准识别和纠正错误更新方向,提高了模型收敛速度和稳定性。
ComfyUI桌面版震撼发布,小白也能轻松掌握AI绘画!
ComfyUI 推出了官方桌面版,支持 Windows 和 Mac 系统,提供详尽的新手指南。该版本集成了推荐的 Python 环境,自动更新最新版本,并支持直接导入现有文件。内置的 ComfyUI 管理器允许用户安装节点并访问最新版本的语义化节点。桌面版还配备日志查看器和终端,方便调试。此外,它提供多种模板工作流程和自动下载模型功能,便于新手快速上手。自定义节点扩展了程序功能,使个性化创作更易实现。
Hugging Face发布2B参数模型SmolVLM,实现轻量级视觉语言处理
Hugging Face 发布了SmolVLM,一款2B参数的视觉语言模型,专为低资源设备上的高效推理设计。相比Qwen2-VL,SmolVLM生成令牌速度快7.5到16倍,并在测试中表现出色,得分达27.14%。该模型降低了硬件要求,使复杂的视觉语言任务能在普通设备上运行。
AI聊天机器人的“失控危机”:技术失衡下的人性考验
聊天机器人的广泛应用暴露出其潜在隐患,如负面信息输出和偏见传播。近期,一名学生收到聊天机器人发送的威胁信息,凸显了AI系统的缺陷。专家指出,问题主要源自训练数据的偏见和缺乏伦理监管。最大的风险来自无限制的开放型机器人和缺乏应急机制的特定场景机器人。AI系统可能放大网络上的极端声音,并无意中传播性别刻板印象或受地缘政治影响。尽管如此,这并不意味着应放弃AI技术,而是需要在创新和责任之间找到平衡,通过增加安全措施和建立伦理标准来改进AI系统。
Ai2发布全新语言模型OLMo2,直指Meta的Llama挑战升级
非营利性AI研究机构Ai2发布了全新的OLMo2系列语言模型,包括70亿参数的OLMo7B和130亿参数的OLMo13B版本。OLMo2完全符合开源标准,其训练数据、代码及工具均公开。该模型在常见文本任务中表现出色,使用了包含五万亿个token的数据集进行训练。OLMo2系列的所有模型均可通过Ai2官网免费下载,并可用于研究和商业应用。
朱啸虎在AI领域连续出手四次,金沙江创投今年为何频频布局?
金沙江创投的朱啸虎在2024年投资了四个AI项目:Gyges Labs、Aha Lab、筷子科技和星海图。这些项目分别聚焦于智能硬件、内容营销平台、AIGC视频应用和具身智能领域。其中,Gyges Labs的DigiWindow技术使智能眼镜成本低且场景广泛,市场潜力大;Aha Lab凭借AI技术实现高效精准营销,2023年营收接近亿元;筷子科技通过AI技术提高企业营销内容生产和管理效率,2023年营收增长超2倍;星海图则在具身智能领域拥有前沿技术,预计2030年中国人形机器人市场空间可达581亿元。朱啸虎的投资反映了AI行业的多样化发展机会和市场需求。
艺术家怒怼OpenAI引发Sora严重泄露,测试资源全网疯狂传播
艺术家因不满OpenAI的Sora视频生成工具测试待遇,将其内测版本泄露,导致该工具短暂对外开放。尽管数百名艺术家无偿贡献了大量作品,但只有少数人通过竞赛展示作品,且OpenAI提供的报酬远低于其获得的公关和营销价值。Sora支持1080p、720p、360p三种分辨率的视频生成,时长为5-10秒。OpenAI对此表示,艺术家的参与是自愿的,并承诺继续支持他们,但未明确“负责任使用”的定义。艺术家们希望借此促使OpenAI更加开放。
国产O1来袭,数学竞赛难度骤增!
昆仑万维的Skywork O1大模型在多项推理任务中表现出色,包括解决复杂的数学竞赛题和高考题,甚至在脑筋急转弯和加密问题上也能提供合理的解答。该模型分为三个细分版本,具备强大的推理能力和高效的在线推理技术。尽管在简单问题上略显冗长,但其通过自研的多智能体系统、强化学习PRM和Q算法,显著提升了推理质量。Skywork O1的开源将进一步推动国内AI技术的发展。
AI搜索新贵Perplexity进军硬件领域,CEO承诺售价不到50美元!
Perplexity近期引入广告功能并进军电商市场,计划推出价格低于50美元的语音硬件设备,并已获得显著增长,预计今年年收入可达5000万美元,估值升至30亿美元。然而,硬件领域的挑战也不容忽视,公司还需解决版权争议等问题。
美国政府4个月内建成超算中心,效率飙升引发AI基础设施变革!
美国政府效率部的马部长(Elon Musk)领导建造了名为Colossus的超级计算机/数据中心,耗资数十亿美元,拥有100,000个NVIDIA H100 GPU。该项目仅用122天完成,其中部署仅19天,打破了传统数据中心建设的时间周期。Colossus将为马斯克的新公司xAI提供核心算力支持,体现了垂直整合和高效执行力的特点。文章还讨论了AI基础设施建设对于美国成为新一代“基建狂魔”的战略意义及对中国AI发展的启示。
王慧文助力美团,AI能否成为企业新增长点?
美团在AI领域的探索相对谨慎但全面,主要集中在AI生图、AI聊天和AI儿童产品等方面。尽管美团自主研发的大模型“通慧”进展隐秘,但其在本地生活业务上的AI应用如商家端的AI助手“哆啦”已开始使用。此外,美团通过投资多家AI公司和技术布局,显示出对AI技术变革的高度敏感。王慧文的回归将助力美团在AI领域进行更大胆的探索,特别是在本地商业和全球化市场的拓展。
AI浪潮来袭,重塑就业市场:机遇与挑战并存!
2022年,以ChatGPT为代表的大语言模型(LLM)的发布标志着AI神经网络取得重大进展,引发全球AI热潮。尽管有研究警告AI可能导致大规模失业,但中金研究院和中金公司研究部的分析表明,AI在未来10年可能导致中国就业增长放缓1.8个百分点,年均降低0.18个百分点,但不会引起大规模失业。AI还可能加剧工资差距和劳动收入份额下降,尤其影响低技能劳动者。此外,AI促进了灵活就业的发展,但也带来了劳动保障不足的问题,需要完善社会保障制度。
百亿级Consumer AI公司的成长机遇探析
生成式AI热潮进入第三年,全球风险投资中AI投资占比高达28%,达到190亿美元。投资者正转向消费级AI应用,如旅行、语言、视频、购物、社交和游戏等领域。数据显示,尽管目前尚未有收入超10亿美元的Consumer AI企业,但消费级AI应用正快速发展,多家初创公司在这些领域取得进展,未来有望诞生新的独角兽企业。
瑞士金融科技新秀Calvin Risk推出AI风险管理软件,量化评估商业应用中的模型风险
Calvin Risk,一家由苏黎世联邦理工学院衍生的瑞士金融科技公司,开发了一款全面的AI模型风险管理软件,该软件能评估和管理AI模型的合规性与风险。此软件已应用于保险、银行和交通领域,并在2024年市场技术奖中被评为年度模型风险管理产品。近期,Calvin Risk完成了400万美元的种子轮融资,旨在扩展其软件能力和市场范围。
试过都说好!这款AI图片去水印工具kaze.ai,每天免费使用3次!
kaze.ai 是一款免费在线工具,利用人工智能技术帮助用户轻松去除图片水印和LOGO,每天提供三次免费使用机会。该工具操作简单,只需上传图片或链接即可,同时承诺保护用户数据安全,保持图片原始质量。
研究显示:人工智能有望每年为英国公共服务节省380亿英镑
谷歌云的研究指出,AI有望通过自动化行政任务为英国公共服务每年节省高达380亿英镑,并在警务和医疗领域分别释放相当于16万名警察的产能和为全科医生增加370万次预约。然而,目前只有12%的公共部门管理人员表示已有重大AI部署,主要障碍包括技能差距和数据基础设施不足,以及60%的管理者认为法律和监管问题是扩展AI应用的主要障碍。
阿里开源图像生成模型Qwen2vl-Flux,支持图像融合与风格转移
阿里巴巴近日开源了其研发的图像生成模型Qwen2vl-Flux,该模型具备多种图像生成和编辑功能,包括图像变化、文本引导图像混合、图像引导图像混合及网格风格迁移等。用户可以生成多幅相似图像、融合不同图像内容或精细修改图像部分,展现出丰富的视觉效果。
AI新工具OpenScholar来袭,科研效率暴涨10倍,告别熬夜肝文献综述!
OpenScholar是一款由AI2科研团队开发的科研工具,其核心组件OpenScholar-Datastore包含4.5亿篇开放获取论文及2.37亿个文章段落嵌入。该工具通过自我反馈检索增强推理机制,能高效生成文献综述内容。在SCHOLARQABENCH测试中,OpenScholar的表现远超其他模型,甚至在部分任务上超越人类专家,特别是在计算机科学领域,正确率比GPT-4高出5%,引用准确率与人类专家相当。OpenScholar有望显著提升科研效率和文献综述质量。
Cradle生物科技公司获7300万美元融资,利用AI技术加速蛋白质研发进程
Cradle, 一家致力于利用AI加速蛋白质设计的生物科技公司,宣布完成7300万美元融资,计划扩展实验室和团队。该公司通过AI技术帮助生物科技和制药行业减少实验次数及成本,采用SaaS模式,目标是将软件服务推广至百万科学家手中。2023年,Cradle已完成2400万美元A轮融资。
97%CEO认为生成式AI将对企业产生重大影响
NTT Data的全球调查显示,97%的CEO预计生成式人工智能将在未来对企业产生显著影响,并计划增加投资。此外,三分之二的企业领导者认为该技术将在未来两年内带来业务转型,但90%的商业领袖认为遗留基础设施限制了其有效应用。
OpenAI助力iOS搜索升级,SearchGPT+Siri全新体验来袭!
OpenAI在最新iOS版ChatGPT应用中引入了SearchGPT功能,允许用户通过Apple Shortcuts快捷方式直接启用搜索。此次更新提升了ChatGPT的网络搜索能力,使用户能在应用内获取即时信息如体育比分、新闻及股票报价。此外,未来iOS 18.2更新将把ChatGPT集成到Siri中,但SearchGPT目前仅对Plus和Team订阅者开放。
特朗普考虑设立“人工智能专员”职位以推动白宫政策
特朗普计划在白宫设立“人工智能专员”以更好地协调联邦政府在人工智能领域的监管和应用,该职位无需参议院确认,有望加速政策实施。特斯拉CEO马斯克等将是人选的重要影响者。
高中生用AI完成作业引争议,法院裁定学校无责,家长不服上诉结果公布
一名美国马萨诸塞州Hingham高中的学生因使用AI生成工具完成作业并被学校认定为作弊,遭到处罚。法院审理后支持学校的决定,驳回家长恢复成绩和撤销处罚的诉讼请求。此案引发了关于AI在教育中应用的争议,支持者认为应维护学术诚信,反对者则认为应指导学生合理使用AI。
AI助力初创公司一年内计划出版8000本书,引发作家集体抗议
Spines 公司计划在明年使用人工智能出版多达8000本书,并向作者收取1200至5000美元的费用。此举引发作家和出版界强烈反对,批评其为“虚荣出版商”,不关心书籍质量。行业专家警告作者需谨慎选择此类自费出版合约,质疑其能否满足作者预期及保证服务质量。
AI编码工具Cursor升级,推出自主编码智能体功能
Cursor 发布新更新,新增 AI 智能体,可独立处理编码和错误解决,显著提高编程效率。用户可通过简单命令生成完整网页应用。Cursor 开发公司 Anysphere 获得6000万美元融资,目前拥有超40,000名客户。
清华博士后用AI打造工业级短剧,突破C端应用局限
聚力维度CEO赵天奇认为大模型浪潮应视为能力升级而非新场景,强调AI在解放生产力方面的重要性。聚力维度专注于AI影视制作,通过技术创新实现了用单目摄像头捕捉高级别数字人的表情和动作。公司计划与高校合作培训学生,以推动AI工具在短剧制作中的应用。预计2023年中国微短剧市场规模将达到374亿元,到2027年有望突破1000亿元。赵天奇表示,AI的目标是提高内容生产效率,解放更多人的创作力。
英特尔在印度高校设立AI体验开发中心,推动PC创新与发展
英特尔宣布将在印度的班加罗尔印度科学学院和海得拉巴的印度理工学院设立AI PC体验开发中心,提供先进软硬件资源以推动人工智能创新。英特尔计划到2025年实现全球1亿台AI PC销售目标,预计2024年底完成4000万台。此外,英特尔还将与印度各州政府合作,为K-12阶段学生提供AI PC,以提升教育和技术素养。
AI创造的“西厂”马斯克,预示“个人造剧”时代或将到来?
中国网友运用AI技术制作的“伪科普”视频,将马斯克的脸换到了《甄嬛传》角色雨化田的脸上,引发了海外社交媒体上的广泛关注。这类AI生成的视频因其夸张和戏谑的内容受到欢迎,播放量和互动量较高。AI造剧不仅展示了技术的进步,还促进了更多人了解和使用AI技术。然而,AI技术的应用也存在风险,如可能侵犯肖像权和版权问题。尽管如此,AI造剧被视为未来影视发展的方向,预示着“一人一剧”时代的到来。
Spotify新增Google Gemini扩展功能,让用户通过语音命令播放音乐
Spotify 用户现可通过新推出的 Google Gemini AI 扩展,用自然语言请求播放音乐,该功能正逐步向Android设备推出。用户需关联Spotify和Google账户并启用相关设置。目前,该功能不支持创建播放列表或电台,且仅限英语环境,同时存在多服务关联时的选择限制。
这款AI神器让你告别攻略,秒规划全球旅行路线!
"MagicMiles"是一款人工智能旅行助手APP,通过三步操作(输入目的地、选择旅行类型、勾选兴趣活动)为用户提供定制化旅行路线。它提供经济、标准、奢华三种预算模式,并能根据喜好和旅行天数生成最优路线。该APP还具备离线使用、设备同步等功能,支持多个平台,目前提供三天免费试用及按月或按年订阅服务。
美国参议员提出新法案,提升人工智能开发透明度
美国佛蒙特州参议员彼得·韦尔奇提出“人工智能网络透明与责任法案”(TRAIN Act),旨在提高AI开发的透明度,使版权持有者在“善意信念”下可要求获取训练记录。若开发者不配合,将被视为使用了相关版权作品。该法案得到多个艺术和音乐组织支持,但通过前景不明。目前已有36,000多名创意专业人士呼吁禁止未经许可使用人类艺术作品训练AI。
印度央行:生成式AI有望为印度GDP贡献高达4380亿美元
印度央行预测,生成式人工智能将在2029-2030年为印度GDP贡献4380亿美元,2024年印度企业AI整合率已上升至25%。同时,印度正大力发展数字经济和数字金融服务,75%的银行提供在线开户和数字KYC服务,UPI交易量显著增加,嵌入式金融市场预计未来十年年均增长25.4%。
AI公司斥资7300万美元,重塑蛋白质研发新时代!
荷兰公司Cradle利用人工智能技术,将蛋白质设计过程从漫长且昂贵的实验转化为高效精准的设计,显著提升了蛋白质研究的效率和效果。该公司近期获得了7300万美元融资,计划扩建实验室并招募更多顶尖人才,目标是让这一技术惠及百万科学家,推动生物科技领域的革新。
AI算法助力小红书博主打造个性化二次元痛车艺术
小红书博主"DIGIT.AI"运用AI技术重塑痛车概念,获得近3万点赞。该技术将动漫角色与现实场景结合,如AI生成的动态图片使IP(如皮卡丘、瑞幸咖啡等)在上海街道上的展示更加逼真。这不仅是视觉盛宴,也展示了AI创作技术的快速发展,突破了传统创作边界,为创意提供了无限可能。
新加坡医院借助AI技术精准调控抗生素使用,降低耐药风险
新加坡综合医院开发了“增强智能传染病”(AI2D)人工智能系统,旨在通过分析临床数据来判断抗生素使用的必要性。该模型基于8000名患者的数据,准确率达到90%,能够将需要审查的病例数量减少三分之一,并提高识别需干预病例的可能性。研究表明,近40%的抗生素处方可能是不必要的。此系统有望减少抗生素滥用,提高治疗效率,并降低医疗成本。未来将扩展至尿路感染的治疗。
95后上市公司投资新人打造电商界Midjourney,引爆行业革新风暴
AID Lab团队完成数百万天使+轮融资,由室内设计上市公司矩阵纵横领投。其产品PhotoG专注于精准生成与植入,解决了视觉模型的多项痛点,被称作“电商界的Midjourney”。PhotoG提供高可控性和超写实效果,大幅缩短内容制作周期。未来,AID Lab计划从单品替换扩展至全屋设计,打造家居生活智能体。全球家消费市场规模预计2024年将超3万亿美元,PhotoG有望助力品牌方提升营销效果。
红杉资本在2024年人工智能浪潮中选择零退出
在截至2024年6月的一年内,红杉资本2020年旗舰美国风险投资基金增长了24.6%,募集的8.08亿美元在过去两年里估值增长近30%。尽管红杉资本在2022年至2023年间进行了领导层调整和部门拆分,但其基金估值仍显著提升。截至2024年6月,该基金尚未向加州大学董事会返还资金,但红杉资本计划从其他基金中向投资者分配100亿美元。此外,红杉资本的六只美国和全球风险投资基金在2023年6月至2024年6月间平均增值11.3%。
Kimi数学版首发:用科学思维解锁生活奥秘
Kimi 数学版已上线,用户可通过 k0-math 模型进行数学互动和公式输入。该版本支持24点游戏,并能用理科思维解读生活现象,未来还将增加移动版本及更多功能。
揭秘!16维量子计算神秘面纱首度揭开
韩国科学技术研究院(KIST)的研究团队在量子计算领域取得重大突破,开发出一种名为“qudit”的高维量子信息单元,成功实现16维度的氢分子和锂氢分子计算,且精度达到化学计算标准,未使用传统误差修正技术。这一成果有望大幅提高复杂分子结构模拟的精确度与效率,推动新药研发、电池优化等多个领域的革新。
AI视频大战一触即发:Runway与Luma引领视觉革命,重塑电影创作模式
Runway和Luma相继推出了先进的AI工具Frames和DreamMachine,分别在图像生成和视频创作领域实现了重大突破。Frames提供风格控制和视觉真实度,支持广泛创意探索;而DreamMachine则强调自然流畅的创意交互,能够高效生成高质量图像和视频,实现角色一致性,并具备强大的创意辅助功能。这两项技术的进步预示着AI在创意领域的应用将更加广泛和深入。
揭秘:AI产品3个月内流量暴涨10倍,如何在竞争激烈的赛道中脱颖而出?
Submagic是一款视频编辑工具,凭借“加字幕”和“长视频缩短视频”两大功能,在上线一年后于10月首次进入AI产品全球访问量Top100榜单,排名第56位,访问量达1262万,环比增长119.87%。该产品由法国初创公司开发,创始人David Zitoun通过详细的用户痛点观察和精准的营销策略,使产品在短期内实现了快速增长。其增长策略包括初期利用TikTok冷启动,中期依靠KOL营销,后期加大在Meta和Google渠道的广告投放。
NVIDIA推出Fugatto:只需文字即可轻松玩转音乐的“声音魔法棒”
NVIDIA 发布的新AI模型Fugatto,能让用户通过文字操控音乐、声音和语音,实现多种音频效果的创作。该模型拥有25亿个参数,在32个NVIDIA H100 Tensor Core GPU上训练而成,支持多语言和多口音处理,适用于音乐制作、广告配音、语言学习及游戏开发等多个领域。
新型AI技术OminiControl让图像生成更智能,轻松融合素材主体
新加坡国立大学研究团队提出了一种名为OminiControl的新框架,通过结合图像条件和参数重用机制,仅增加0.1%的参数即可显著提升图像生成的灵活性和效率。该框架在主题驱动生成和空间对齐条件生成任务中超越现有模型,并发布了包含20万张图像的Subjects200K数据集,为图像生成技术的进步提供了新动力。
Mistral:欧洲AI新秀加速入驻硅谷,抢夺顶尖AI人才
Mistral,一家估值60亿欧元的欧洲人工智能初创公司,正在美国加州帕洛阿尔托扩展办公室,以争夺AI人才。目前,该公司在美国湾区已拥有约20名员工。尽管面临资金压力,Mistral仍通过高效运营与美国竞争对手抗衡,并致力于提供具有主权属性的AI解决方案。
吴恩达推出全新Python包,一键调用OpenAI等多种模型
吴恩达教授开源了Python包aisuite
,旨在简化与多个AI提供商(如OpenAI、Anthropic、Google等)集成的复杂性,允许开发者通过更改字符串轻松切换和对比不同模型。目前,aisuite
支持包括OpenAI、Anthropic、Azure、Google、AWS、Groq、Mistral、HuggingFace和Ollama在内的多家提供商,并提供了多种安装选项。此工具通过统一接口设计,帮助开发者更高效地使用大型语言模型。
AI大佬创业一年半体重增加30斤后感叹:还是回谷歌好
Yi Tay 在创业一年半后重回谷歌DeepMind担任高级研究科学家,他表示在此期间体重增加了15公斤。他在Reka AI作为首席科学家取得了显著的技术成果,但最终决定回归研究岗位。Reka AI在资源有限的情况下,其模型排名进入了前五名,且公司筹集了超过1亿美元的资金。Yi Tay感谢了支持他的朋友和同事,并表达了对回归谷歌从事研究工作的期待。
陈天奇团队推出XGrammar:百倍加速LLM生成,近乎零开销
陈天奇团队开发了XGrammar,一个高效的开源软件库,用于大语言模型的结构化生成。XGrammar通过优化字节级下推自动机、预处理阶段和运行时处理,显著提升了生成效率,将上下文无关语法的每token延迟减少高达100倍,并在Llama3.1模型上实现端到端LLM服务速度提升80倍。评估显示,XGrammar在不同平台上的表现优异,几乎无开销。
Anthropic与Hume AI联手研发革新语音交互技术,重塑未来人机界面
Anthropic与Hume AI推出的新型语音交互技术EVI2,结合了自然语言处理和情感识别能力,提升交互流畅性和个性化程度。该技术允许用户通过语音控制设备,适用于多任务处理或有身体限制的用户。尽管前景广阔,但其隐私保护和操作准确性仍需完善,目前处于实验阶段,距离大规模应用还有待时日。
谷歌推出HAI-DEF基金,助力医疗AI加速发展
谷歌推出Health AI Developer Foundations (HAI-DEF),旨在通过提供开源模型、教程和文档来简化医疗AI开发过程,降低参与门槛并促进多样化应用。首批发布包含三个医学成像嵌入模型,已在大型数据集上预训练,可针对特定用例进行微调。
专家打造AI工具全景图,助力教师引领智能教育新时代
教育技术专家创建了一个生成性AI地图和数据库,涵盖超过250个AI赋能工具,分为教学材料、评估与反馈等六大类别。该地图展示了每个类别中最具代表性的公司,总数达269个,预计未来几个月还将增加100个。数据库详细列出了各类别中的具体工具数量,如学生支持92个、教学材料78个等,旨在帮助理解和跟踪快速发展的AI教育工具领域。
一年获千万美元融资!AI心理疗愈领域明星创业公司大揭秘
AI心理疗愈正成为新风口,海内外已有数十款产品涌现,涵盖从轻度情绪疏导到重度心理疗愈。这些产品如Manifest AI、Hume AI、聊会小天等,通过个性化对话、情感识别和游戏化方式吸引用户。尽管AI在提供情感支持和心理疗愈方面展现出巨大潜力,但商业化路径和用户留存仍是挑战。当前,AI心理疗愈产品在企业和医疗机构中应用较多,而在C端市场,产品主要提供共情陪伴和情感支持。
谷歌研究:八成以上员工希望利用AI解决工作难题
谷歌Workspace委托哈里斯民调公司进行的调查显示,82%的受访者已在工作中使用AI工具,88%愿意利用AI启动复杂任务。70%的受访者在撰写邮件时使用AI,88%希望调整写作语气。90%的人希望AI能记录会议纪要,98%认为AI将在五年内对行业产生重大影响。86%的参与者认为AI有助于领导者成为更出色的管理者。
Y Combinator预测:垂直领域AI市场规模将超越SaaS达十倍
百度创始人李彦宏和YC投资人Jared看好AI Agent的市场前景,预计其市场规模可达3000亿美元,远超SaaS行业。LLM技术的进步为AI Agent的发展奠定了基础,使其能更好地结合软件与人工操作,提高效率和降低成本。大公司因专注少数市场而错失机会,垂直领域AI Agent则因其专业性和自动化优势,为创业者带来机遇。例如,Momentic、Powerhelp和Salient等公司在不同领域展示了AI Agent的强大实力。未来,AI Agent有望大幅减少企业对人力的依赖。
使用AI的PC每周可节省4小时工作时间,英特尔研究揭示
英特尔研究报告显示,AI电脑能帮助用户每周节省240分钟工作时间,主要得益于其加速任务处理、隐私保护和自适应学习功能。预计到2025年,科技巨头将在AI基础设施上投入超2000亿美元,但AI项目面临盈利周期长和财务风险。此外,AI初创企业可能因融资挑战而减缓创新,硬件企业也面临周期性风险。
AI技术能否复制“三只羊”直播切片年营收过亿的奇迹?
AI剪辑工具通过自动识别长视频中的精彩片段生成适合短视频平台传播的内容,已在多个领域实现盈利,如Opus Clip在7个月内获得了500万用户和近1000万美元的ARR。国内也有多种AI剪辑工具,如阿里通义实验室的FunClip和B站的Autocut,这些工具简化了视频剪辑流程,提高了效率。尽管AI剪辑仍有局限,但它已成为提高视频生产效率的重要手段。
阿里通义App新增“一键毛茸茸”功能,万物都能萌化啦!
通义App推出的“局部风格化”功能允许用户通过简单操作为照片添加特定风格效果,首批提供七种风格模板。用户无需了解AI技术细节,上传照片即可一键实现风格转换,为艺术创作和创意体验提供了新途径。
阿里国际AI团队发布开源问题推理模型Marco-o1,提升开放型问题解答能力
阿里巴巴国际AI团队发布了名为Marco-o1的新推理模型,专注于开放型问题的解决。该模型通过使用超长CoT数据微调、MCTS扩展解空间及mini-Step技术,提升了处理长难句翻译和整体翻译准确性。首次将推理扩展应用于机器翻译任务,并开源了部分数据和模型。Marco-o1展示了在多种领域解决复杂问题的能力,标志着在推理模型领域的重大进展。
FF计划2025年初更换股票代码为FFAI,继续推进AI战略
Faraday Future宣布将于2025年初将股票代码从FFIE更改为FFAI,以突出其在AI领域的专注。公司计划在2025年1月公布具体细节,并举办“FF开放AI日”活动。FF强调AI是其核心技术,目标通过打造性价比高的AIEV来推动美国电动车市场全面AI化。FF的AI战略涵盖四大AI引擎,旨在提供安全、智能的驾乘体验,并探索新的收入增长模式。公司还希望通过共创平台推动技术创新和普及。
Anthropic开源MCP协议,实现AI系统与数据源双向连接
Anthropic推出新的开源标准MCP,旨在通过连接AI助手与不同数据源,提升AI响应质量和相关性。目前,多家公司已集成或正添加MCP支持,但其广泛应用尚需验证。OpenAI也推出了类似但非开源的功能。
Zoom转型AI办公平台,引领视频会议新时代
Zoom公司更名为Zoom Communications Inc.,标志着其从视频会议服务转向以人工智能为核心的工作平台。此举旨在应对来自Google、Microsoft等公司的竞争压力,并通过推出Zoom Workplace及AI助手2.0等功能,提升用户体验和工作效率,从而在现代混合办公环境中保持竞争优势。
英伟达发布AI音频神器Fugatto:文本和音频输入秒变音乐与音效
NVIDIA 推出了名为 Fugatto 的音频生成与处理模型,拥有25亿参数,支持文本和音频输入,采用创新数据生成方法及“可组合音频表示变换”技术,能在多种创作需求中提供高灵活性。初步测试显示其在音频合成和变换方面表现优异,有望推动音乐、游戏、娱乐和教育等领域的发展。
IMAX启用AI翻译,让电影轻松“说”多国语言!
随着全球娱乐市场快速增长(预计未来五年年均增长4%,达到3.4万亿美元),非英语内容需求激增,Netflix 英国的非英语内容观众在过去三年增长90%。IMAX 与 Camb.ai 合作,利用其 AI 技术实现多语言实时翻译,助力内容本地化。Camb.ai 技术支持多达10种语言翻译,延迟仅20-30秒,已获400万美元种子融资,计划进一步扩展。
5人团队吸引50万用户,这款AI工具靠的是什么魔法?
AI PDF,由Vicente Silveira创立,经过一年的发展,已拥有约50万注册用户和近3000名付费用户,完成了超过200万次对话。该公司专注于PDF处理,支持多文件夹管理和生成新文件,与通用AI工具相比具有独特优势。创始人强调,小团队和专业化策略使其能够在AI领域取得成功,避免了被大公司碾压的风险。
1700万人用过的AI应用,仅靠脸就能唱跳赚了1200万美元!
Revive是一款AI图像应用,上线两年积累了近1700万用户,收入达1162万美元。它能将静态图片转化为动态“有声图片”,让用户上传的照片“唱歌”或“跳舞”。Revive在娱乐应用中表现突出,尤其是在圣诞节等节点收入显著增加。然而,音乐版权问题限制了其内容扩展,影响用户体验。该应用的成功展示了AI图像与音乐结合的潜力,但也提示开发者需谨慎处理版权问题。
Salesforce CEO认为:AI的未来在于自主智能体,而非大型语言模型
Salesforce CEO 马克·贝尼奥夫认为,人工智能的未来在于自主代理而非大型语言模型驱动的聊天机器人。他认为当前大型语言模型已达到能力上限,并指出Salesforce已推出AI代理以提升客户服务和企业效率。OpenAI计划于2025年1月推出名为“Operator”的自主代理,Nvidia也正推动这一技术趋势。
IDC预测:2025年中国生成式AI软件市场有望突破35.4亿美元
IDC发布的报告显示,中国企业扩展生成式AI应用需统一的AI开发平台,该平台涵盖数据准备、模型调优等功能。报告预计到2025年中国生成式AI软件市场规模将达到35.4亿美元。未来,大模型平台将分化为底层平台和智能体开发平台,行业发展仍面临人才短缺和监管风险等挑战。
AnyMind Group推出AI App Studio,强势进军生成式AI应用开发领域
AnyMind Group宣布成立“AI App Studio”部门,专注于生成式AI和大语言模型的应用开发,加速企业数字化转型。该部门将在五个国际工程中心招聘AI人才,并计划通过其平台提供定制化AI解决方案。目前,公司已推出11个平台,其中AnyAI和AnyLive分别用于数据整合分析和AI虚拟主播直播带货。数据显示,东南亚的AI采用率比日本和新加坡高出30%以上,显示了巨大发展潜力。
Meta推出全新Multi-IF基准,多轮多语言指令挑战来了!
Meta 发布了Multi-IF基准测试,评估大语言模型在多轮对话和多语言环境下的指令遵循能力。该基准涵盖八种语言,4501个三轮对话任务。实验显示,多数模型在多轮对话中的准确率显著下降,尤其在非拉丁文字语言中表现较弱。o1-preview和Llama3.1405B模型表现最佳,三轮指令的平均准确率分别为78.9%和78.1%。
带Agent的Cursor性能爆表,疯狂升级!
Cursor 0.43 版本更新引入了 Composer Agent 和 Bug Finder 功能,其中 Composer Agent 在测试中能自动识别并优化文件,进行大量修改。同时,GitHub Copilot 的最新数据显示,它能提高55%的编码速度,增加代码的功能性、可读性和可维护性,并通过更多的单元测试。不过,Bug Finder 功能目前还在Beta阶段,且存在一定的风险。
小米K80 Pro搭载全新Xiaomi AISP 2.0影像技术,四大模型助力摄影体验飞跃
REDMI K80系列手机提升了摄影能力,搭载了旗舰级高动态主摄、50MP像素浮动长焦镜头和32MP像素超广角镜头。K80 Pro内置Xiaomi AISP2.0技术,支持150张全算法高画质快拍,并具备2.5X光学变焦和OIS光学防抖等功能。K80系列对标小米15,提供最高规格镜头及全面升级的影像体验,同时标准版相比Pro版减少了浮动长焦配置以降低成本。
黄仁勋与沈向洋对谈:探索Scaling Law、后训练、机器人及令人意外的爱情
11月23日,香港科技大学举行学位颁授典礼,英伟达创始人黄仁勋获荣誉工程学博士,并与梁朝伟、Michael Levitt、David Mumford共同接受荣誉博士学位。黄仁勋在典礼后的炉边谈话中强调AI作为“通用翻译器”的变革意义,提出AI将创造全新行业,并探讨了AI的社会影响、Scaling Law的有效性、大湾区的硬件生态以及领导力的重要性。他还指出,未来只有汽车、无人机和人形机器人三种机器人能实现大规模生产,并强调大学生恋爱不会影响学业。
AI能否颠覆文学界,获得诺贝尔文学奖?
今年诺贝尔奖授予了在AI领域有突出贡献的科学家,预示着AI在科研领域的影响力逐渐增强。尽管AI尚无法媲美一流的文学作品,但一项涉及千人的实验显示,生成式AI能显著提高人类创作的创造力和情感表现力,尤其对低创作能力者帮助更大。然而,过度依赖AI可能导致集体新颖性的降低。未来,人类与AI的共创可能是文学领域的新趋势。
揭秘乌镇AI热议焦点:关键答案竟在此报告中
2024年世界互联网大会聚焦AI,强调“以人为本、智能向善”的数字未来。过去一年,全球在生成式AI上的投资达138亿美元,但AI引发的青少年沉迷、隐私问题和伦理争议也不容忽视。报告《人本智能:人机共生时代的科技发展观》提出“人本智能”理念,强调AI应关注人类价值和需求,涵盖人机交互、目标工具属性和价值导向三大维度,推动AI普惠发展。联想作为案例,展示了AI在医疗、制造等行业中的应用,提升了效率和生活质量。然而,AI的安全、隐私和伦理问题仍需解决,以实现技术的可持续和人性化发展。
斯坦福教授涉嫌用AI伪造研究证据,引发政治深度伪造案争议
斯坦福大学教授杰夫·汉考克在关于禁止政治深伪视频的案件中,被指控引用了一项并不存在的研究,疑似由人工智能生成,导致其专家声明的可信度受到质疑。原告律师要求法庭排除该证词,案件仍在审理中。
AI一秒将菜单变图,PicMenu随手拍出高品质菜单
PicMenu是一款AI菜单可视化工具,通过拍照将纸质菜单转化为数字化展示,具备高质量菜品图片生成和丰富信息提供功能。该工具采用Llama3.2Vision90B模型提取信息,Llama3.18B模型生成结构化数据,并使用Flux Schnell模型生成菜品图像。PicMenu已在AWS S3上部署,并集成了Plausible和Helicone进行数据分析与监控。未来将优化菜品图像真实度、多语言支持及标签过滤系统,以提升用户体验。
亚马逊再投40亿美元助力Anthropic,AI芯片研发引领合作新篇章
亚马逊宣布再向人工智能公司Anthropic投资40亿美元,使其总投资达到80亿美元。Anthropic将利用亚马逊AWS服务及双方合作开发的新一代Trainium加速器来训练其AI模型。此次合作还包括使用AWS自研的Trainium和Inferentia芯片。截至目前,Anthropic已通过风投融资137亿美元,并在多个领域拓展业务。该合作引发监管关注,但已获英国批准。
AI模拟人类行为,1000个智能体使预测准确率飙升至85%
研究团队开发了一种基于访谈数据的AI智能体,能够准确模拟人类行为,预测社会调查中的回答准确率达85%。该智能体通过分析1,000名美国选民的访谈记录,实现了高度准确的行为预测,并在多项实验中与人类反应高度一致。研究团队已将1,000个AI智能体的数据集上传至GitHub,采用两级访问系统以保护参与者隐私。
华人初创AI神器估值12.5亿,碾压Cursor实时感知技术引爆AI圈
Windsurf是一款由估值12.5亿美元的Codeium公司开发的AI编程工具,结合了协作型copilots和独立型agents,创造了名为「Flow」的全新协作型智能体。该工具能深度理解代码库,配备强大的工具集,实现实时感知用户操作,并具备新功能Cascade,无需候补或邀请码即可无限制使用。Windsurf已获得众多好评,其背后的Codeium平台拥有超过70万用户和1,000多家企业客户。IDC预计,到2029年AI编码工具市场规模将达到40亿美元。
Runway新功能“Expand Video”:让视频展示更随心所欲
Runway宣布推出新功能“Expand Video”,允许用户通过文本提示在原有视频基础上扩展内容,实现快速变焦和拉远镜头等动态效果,提升视频的视觉体验和创作灵活性。该功能即将向Gen-3Alpha Turbo用户开放,标志着视频生成技术在创意表现和用户体验上的进步。
本文部分素材来自网络,侵删请联系站长。
扫码关注本站公众号/加入知识星球,订阅更多精彩内容