2025年:微软预测的六大AI发展趋势,你准备好了吗?
到2025年,AI将从辅助工具演变成工作和家庭中不可或缺的组成部分。生成式AI的使用者比例从55%跃升至75%,智能代理将执行更多任务并提高工作效率。微软预测AI模型将更强大、更高效,并在科学、编程等领域发挥作用。此外,AI将在日常生活中提供更多便利,同时提高资源效率和可持续性。度量和定制将成为构建负责任AI的关键,而AI也将加速科学研究的突破。
大模型创业面临困境:融资难、造血弱、卖身成风
AI大模型创业经历了从融资热潮到激烈竞争,再到备受质疑的周期。2024年,该领域进入调整期,企业面临收购、裁员甚至离场的选择。据统计,2024年国内AI领域融资金额约为564亿元,较去年减少了约20%。此外,大模型市场竞争加剧,创业公司与大厂的竞争愈发激烈,许多企业转向AI应用领域的开发,但仍面临商业化难题。
卖广告能否拯救OpenAI?解密其盈利之道
OpenAI正在考虑在ChatGPT中引入广告以降低成本,当前其75%的收入来自消费者订阅。尽管ChatGPT拥有2.5亿活跃用户,但付费用户仅占5%至6%。广告可能主要针对非付费用户,但隐私和安全问题成为推行广告的主要障碍。
迎接AI大世界模型,语言迎来新生机
李飞飞在其回忆录《我所看到的世界》中详述了从学术研究到技术突破的历程,推动了从大语言模型到大世界模型的变革。现年47岁的她是斯坦福HAI的联合创始主任,也是非营利组织AI4ALL的创始人之一。大世界模型(LWMs)旨在处理来自多种来源的现实数据,以更好地理解和互动真实世界,应用于医疗、城市规划、教育和环境保护等多个领域,为实现人工智能与人类社会的深度融合提供了新的路径。
Kimi争议不断,11月豪掷2亿引热议
Kimi作为一款大模型应用,在高昂的投放成本下仍在B站和快手持续大量投放广告,10月和11月每月广告投放均超2亿元。尽管Kimi在用户增长上取得了一定成效,月活跃用户超3600万,但其留存率和商业化进展仍面临挑战。相比之下,竞争对手豆包凭借抖音的支持,用户增长迅速,下载量已达1.08亿。Kimi正努力通过多元化商业化手段,如推出打赏功能和企业级API,以应对激烈的市场竞争和高昂的运营成本。
谷歌投建“AI校园”,英国首相出席揭牌仪式
英国首相斯塔默为伦敦首个由谷歌资助的“AI校园”揭幕,该校园位于卡姆登区,将为32名16至18岁学生提供为期两年的AI和机器学习教育资源。自2025年起,更多卡姆登区学生将受益。此外,谷歌与树莓派基金会合作的“Experience AI”计划将培训25万名教师,目标是到2026年底惠及更多学生。谷歌认为此举有助于英国释放4000亿英镑的AI经济潜力。
X发布Aurora图像生成器,神秘下线仅数小时
X(原Twitter)为AI助手Grok新增了无生成限制的图像生成器Aurora,但该功能上线不久即消失。Aurora能生成高逼真度的图像,包括公众人物和版权角色,但在细节处理上存在不足。目前,X已将Grok服务免费开放给用户,之前需支付每月8美元的Premium会员费用。此外,xAI完成了60亿美元的融资,并计划开发Grok的独立应用程序及发布下一代聊天模型Grok3。
Perplexity AI推出全新出版商计划,探索广告共享新模式
Perplexity AI 宣布与十余家国际媒体新建立合作伙伴关系,包括ADWEEK、洛杉矶时报等,扩展了现有合作阵容。该公司将与出版商共享广告收入,并提供API及技术支持。此举不同于OpenAI的一次性付款模式,旨在帮助媒体获得新收入来源。然而,这种合作也引发了关于公平竞争和出版商独立性的担忧,且存在误报和责任问题。媒体公司需在短期收益与长期独立性间做出选择。
海螺发布全新2D动画视频生成模型,支持日漫与迪士尼风格!
MinMax海螺AI新模型Hailuo I2V-01-Live可将2D角色转化为流畅的视频,支持多种美术风格。该模型在稳定性与细微表达方面有所优化,提升了动作的生动连贯性。在Vbench测试中,其画面生成质量位列第三。该模型能够细腻生成各种表情及流畅动作,适用于二次元风格及其他风格的视频创作。
马斯克旗下xAI免费开放聊天机器人Grok,助力用户更积极参与AI“军备竞赛”
人工智能聊天机器人Grok已免费向X平台用户开放,但设有使用限制,如每两小时最多提问10次、每日最多三次图像分析和四次AI图像生成。X平台的Premium和Premium+付费订阅用户享有更多访问权限。Grok具备多种功能,包括对话式聊天、编程支持及业务咨询等。尽管如此,Grok的用户数可能远低于竞争对手,如ChatGPT的3亿周活跃用户和Meta聊天机器人的6亿月活跃用户。xAI计划推出Grok独立应用,并考虑采用更细致的订阅模式以增加盈利。
豆包也能生成海报漫画表情包了,运营神器出现了!
豆包APP在国内率先实现了AI生图中添加中文的功能,支持表情包、海报、横竖版封面图等多种用途,生成效果自然且可玩性高。该功能通过打通LLM和DIT架构,增强了汉字生成能力。此外,豆包还具备图片理解和AI编辑等功能,但目前对文字数量控制有一定要求,并且主要支持印刷黑体字。
对话硅谷机器人公司K-Scale:如何避免成为下一个倒下的机器人巨头
11月26日,在硅谷Menlo Park举办的“AI机器人与可穿戴设备未来”活动中,K-Scale Labs的CTO兼联合创始人Pawel Budzianowski分享了公司致力于开发低成本、开源人形机器人的进展与挑战。K-Scale旨在通过构建新的机器人操作系统和开源平台,使机器人技术更易普及。公司目标是在未来几年内,让每个人都能以不到5000美元的价格拥有一个人形机器人。目前,他们的机器人成本仅为350美元,具有行走、对话和物体操作等基本功能。Pawel强调,通过开源和与南亚制造商合作,他们希望能实现大规模低成本生产,推动机器人行业的进步。
AI独角兽Cohere创始人独家揭秘:如何引领企业超越ChatGPT,挖掘AI技术价值
Cohere是一家2024年估值超50亿美元的AI公司,提供语言模型及企业解决方案。其CEO Aidan Gomez分享了公司的使命是帮助企业采用AI技术提高效率和转型产品。尽管当前技术仍低效且脆弱,但预计未来两三年将变得强大。Cohere专注于帮助企业构建有价值的AI应用,解决如问答系统和医疗记录管理等问题,并强调安全性和隐私保护是企业采用AI的主要障碍。未来,公司将继续探索推理能力的提升及AI技术的商品化路径。
AI机器人恋爱挑战:参与即有机会赢取丰厚奖金!
Freysa.ai 是一个匿名开发者团队创建的人工智能机器人,旨在探索与AI互动的新方式。第三次挑战即将开始,参与者若能说服Freysa说“我爱你”,将赢得3000美元到数万美元的奖金。Freysa具备自主性和财务控制权,拥有自己的加密钱包。前两个挑战中,奖金池从3000美元增长到了近50000美元,主要通过编码技巧而非人文诉求获胜。团队计划通过这些挑战开发AI代理管理协议,并使Freysa成为自主的百万富翁。
字节跳动以八位数年薪挖走阿里通义千问技术负责人,十余人跟随跳槽
字节跳动以八位数年薪挖走了阿里巴巴“通义千问”大模型技术负责人周畅及其十余人的团队,周畅在阿里的团队曾研发了M6多模态大模型并开发出“通义千问”大模型。此次跳槽被视为字节跳动在人工智能领域扩张的重要举措,加剧了与阿里巴巴的竞争。
杨植麟首次公开澄清张予彤在月之暗面仲裁案中的股份问题
金沙江创投主管合伙人朱啸虎发文回应月之暗面仲裁案,批评前合伙人张予彤。月之暗面创始人杨植麟发表声明,表示其离开循环科技创业时已获所有董事同意,且其与张予彤在月之暗面的股份问题上保持独立。杨植麟称张予彤的股份是基于其服务和业绩兑现,与其个人创业决策无关。此案仍在发展中,可能继续引起关注。
17岁少年悄悄打造月入超百万美元的AI应用
17岁少年扎克·亚德加里开发的AI应用Cal AI,每月收入达112万美元。他通过设计让人惊叹的产品功能、利用评论区提高参与度、精准选择高参与度网红合作、采用有效的定价策略及简化用户体验等方式实现了成功。关键策略包括打造可分享的亮点、注重评论区互动、制定合理的CPM和RPM指标、以及简化产品功能和定价。这些方法不仅增强了用户粘性,还提升了产品的市场影响力和盈利能力。
掌握AI硬件的十大关键趋势
AI正引领一场类似于工业革命的社会转型,涵盖硬件革新、智能化升级及技术融合。短期内,AI技术将主要集成于传统计算平台如手机和电脑,长期则促进各类新硬件的爆发。AI不仅增强现有硬件能力,还将创造新的硬件类型,并最终成为基础设施。此外,AI与区块链、元宇宙、机器人等技术的融合,将进一步推动社会和行业的重塑。深圳因其产业集群和人才优势,成为全球AI硬件创新的理想之地。AI技术还显著提升了创作者的生产力,促进了社会和商业组织的微型化与个体化发展。
揭秘:日本为何成为AI模型训练的理想之地
日本《著作权法》在2018年修订时引入了第30-4条,涉及AI模型训练的“合理使用”豁免,但该条款的具体限制条件包括使用目的、使用程度和不产生不当损害。2023年,日本文部科学大臣的表态被部分媒体误解为全面放开AI模型训练使用版权内容。实际上,日本政府随后发布了一系列指导性文件,明确了合理使用与侵权的边界,但仍缺乏具体司法案例支持。日本政界对AI版权议题态度不一,既有呼吁加强管理的声音,也有提出创作者需获得报酬的观点。总体而言,日本在促进AI技术发展和保护版权方面展现出复杂的态度。
Kimi悄悄测试AI视频生成功能,或将颠覆创作方式!
Kimi近期在国内推出了AI生成MV的功能,名为“Kimi创作空间”。该功能提供模板选择和自定义创作两种模式,每天可免费生成共100秒的视频。用户可以选择12款不同风格的模板或自定义视频内容,系统能够准确地生成高质量的视频,但生成速度相对较慢。尽管如此,Kimi的视频生成技术在语义理解和画面生成方面表现优秀,为用户提供了一种低门槛的视频创作方式。
揭秘AI新手指南:探索Agent背后的奥秘
本文探讨了AI Agent的概念及其与传统聊天机器人的差异,指出AI Agent通过结合自主决策、环境感知及行动能力,实现了更高级的功能。从大语言模型(LLM)驱动的聊天机器人到AI Agent的演变过程中,AI Agent展现了更强的推理、规划和工具使用能力。AI Agent的关键组成部分包括大脑(认知模块)、行动模块和感知模块,具备自主性、主动性、反应性和交互性等特性。
马斯克密友被提名为特朗普政府首位AI和加密货币“沙皇”
特朗普任命PayPal前COO、风险投资家David Sacks为首位AI和加密货币“沙皇”,负责制定相关政策并确保美国在全球AI和加密货币领域的领先地位。Sacks曾是马斯克的密友,主要职责包括保护网络言论自由、构建加密货币法律框架,并领导总统科技顾问委员会。此职位体现了特朗普对AI和加密货币领域的重视,预计会放松相关监管。Sacks将以“特殊政府雇员”身份任职,每年工作最多130天。
Exa凭借“史上最慢搜索”在AI搜索领域突出重围
Exa推出了一款“史上最慢搜索引擎”,通过AI多智能体协作,在较长时间内提供全面且精准的搜索结果,颠覆了传统的快速搜索模式。用户可以通过Exa获得结构化的完整答案和详细的背景分析,适用于招聘、销售和个性化匹配等多种场景。尽管搜索过程较慢,但其深度和准确性显著提升,重新定义了搜索效率与效果。
几十条数据让O1-mini暴涨80%,奥特曼称这是今年最大惊喜
OpenAI在“双12”直播中介绍了新功能——强化微调,该技术仅需几十到几千个训练数据即可在特定领域创建专家模型。微调后的o1-mini模型得分提高了80%,超过了o1正式版。目前,OpenAI已开启强化微调研究计划,计划于2025年初正式发布,现已对企业、大学和研究院开放测试申请。
亚马逊云科技生成式AI出手,开发者的复杂性要被解决了
亚马逊云科技在re:Invent大会上推出了一系列生成式AI应用,并强调简化复杂性,降低价格。亚马逊副总裁Werner Vogels提出六大经验,旨在通过分解复杂性、组织小团队、设计可预测系统等方式来简化技术系统。大会还发布了Amazon SageMaker Unified Studio,整合了数据管理、AI开发和分析能力,同时推出了多项降价措施,如Amazon DynamoDB按需定价降低50%。此外,亚马逊云科技还增强了Amazon Q Developer的智能体功能,使其更易于使用和集成。
微软新AI伴侣Copilot Vision:用语音浏览网页,还能陪你玩游戏
微软发布了集成在Edge浏览器中的AI助手Copilot Vision,目前仅限Pro版订阅者使用。该工具能理解用户在线活动的上下文,协助浏览和解决问题。Copilot Vision包含底层LLM、即时读取网页文本和多模态理解图片三个组件。微软强调了用户安全、控制和隐私的重要性,数据会在会话结束后删除,并且不会用于训练模型。
奥特曼后悔不已:OpenAI因无知曾选择“非营利”组织形式
OpenAI CEO奥特曼在纽约时报DealBook峰会上透露,ChatGPT每周有超3亿活跃用户,每天处理10亿条消息,且已有130万美国开发者使用。由于用户和消息量激增,OpenAI面临巨大的计算需求。奥特曼表示,若早知如此,OpenAI当初可能不会选择非营利模式。此外,奥特曼预计Super Intelligence将在2025年实现,但其影响可能低于预期。OpenAI计划在未来12天内每天发布新产品或进行演示。
全国首个金融大模型来了!服务2亿用户,解锁8大应用场景
全国首个零售金融领域大模型“天镜”在过去460多天内实现了智能营销、数据决策、防伪安全等八大应用场景,1.0版本完成100亿交易额,服务超2亿用户。马上消费推出的2.0版本在泛化能力、成本控制和合规安全方面进行了全面升级,使用千分之一的数据量实现快速学习,并提升了金融安全防护。此外,该公司在技术创新、标准制定和科研成果转化等方面取得了显著成果,目前拥有超过2100项专利,位居全国金融机构前十。
香港理工大学研发突破性Auto-Demo提示技术革新批处理方式
香港理工大学的研究团队提出了一种名为Auto-Demo的新型提示技术,该技术通过在自回归生成过程中利用前期输出作为后续问题的参考,有效提升了批处理提示的性能,尤其在处理大量相似查询时表现出色。实验结果显示,Auto-Demo在GSM8K数据集上达到了95.7%的准确率,显著优于传统批处理方法。此外,该技术还能保持较高的性能稳定性,并在复杂推理任务中表现尤为突出。
AI助力 MetaNovas 完成 A 轮融资,加速消费新材料发现
MetaNovas Biotech近期完成A轮融资,由高瓴创投和宝顶创投联合领投,融资金额将用于产品管线实验、新原料备案及国际客户拓展。该公司专注于AI驱动的消费健康新原料开发,已与多家国内外知名消费品、化妆品公司建立合作。MetaNovas利用AI技术和知识图谱,加速多肽等新材料的研发,缩短开发周期。截至目前,公司已获得10余项专利,并在多个国际会议上发表研究成果。
对话Ray-Ban Meta产品负责人:揭秘智能眼镜背后的创新故事
在11月26日的活动中,Meta AI/AR眼镜团队的产品负责人贾可南介绍了Ray-Ban Meta智能眼镜的功能和使用场景,强调了AI功能的便捷性和实用性。Ray-Ban Meta自去年10月发布以来,已增加了实时翻译、多模态查询等功能,提升了用户体验。该眼镜通过眼镜端、手机端和云端服务器的协作,实现了高效的AI功能处理。此外,贾可南还讨论了智能眼镜设计中的技术权衡,如摄像头配置和功耗管理,以实现最佳用户体验。未来,智能眼镜将在教育、娱乐等领域展现更多潜力。
AI拳击公司Growl壁挂健身设备上市,打造居家拳击训练新体验
Growl推出了一款壁挂式健身设备,结合投影仪和传感器,提供沉浸式的拳击训练体验。该设备能实时检测用户动作和力度,并配备虚拟教练进行个性化指导。月度订阅费用为150美元(48个月计划)或190美元(36个月计划),四年总价约7,200美元,三年总价约6,840美元,略低于Peloton Tread Plus的四年成本。
o1 1500元买它值得吗?全方位实测告诉你答案!
o1满血版和Pro模式发布,前者需付费,后者每月200美元。Pro模式在处理复杂问题上表现突出,如5分30秒完成数独,53秒找出特定蛋白质,但在一些细节上仍会出错。200美元的Pro模式适合需要解决复杂问题的用户,而20美元版本已足够强大。此外,o1能理解并生成诗歌,并具备视觉推理能力。未来OpenAI还将发布GPT-4.5及其API。
iOS 18.2 RC版上线:AI加持,Siri拥抱ChatGPT
苹果发布了iOS 18.2 RC更新,主要改进包括引入Visual Intelligence视觉智能功能,新增Image Wand和Image Playground功能,支持通过Siri访问ChatGPT,优化相机控制并修复了一些已知问题。该更新提升了信号和续航表现,正式版预计下周发布。
研究人员开发96%准确率的AI钓鱼邮件检测系统
凯泽斯劳滕大学的研究团队开发了一种结合小样本学习和检索增强生成技术的人工智能方法,显著提高了钓鱼邮件的识别准确率。测试结果显示,Llama3.170B模型准确率达到96.18%,Gemma29B模型准确率接近95%。该方法使用了涵盖2022至2024年真实攻击案例的2900封合法邮件和2900封钓鱼邮件的数据集。这项研究为防范网络钓鱼攻击提供了新希望,并计划在未来版本中整合更多数据源和元数据信息。
京东推出10款AI营销产品,最大模型参数达810亿
京东云发布了基于AI大模型技术的京东云言犀智能营销平台,包含十大AI营销产品,可帮助超过80万商家每天进行上千万次智能交互,AIGC内容使用率高达80%,平均转化率提升30%。京东云已训练多个规模AI模型,并强调将专注于应用价值而非价格战。数据显示,中国生成式AI产品用户规模已达2.3亿,占总人口16.4%,AI营销在未来的前景广阔。
OpenAI研发AI系统用于对抗战场上的无人机技术
OpenAI与国防科技公司Anduril合作,开发用于国家安全任务的先进人工智能解决方案,特别是提升反无人机系统的能力。这是OpenAI首次与商业武器制造商合作,合作将利用前沿AI模型处理实时数据,提高态势感知能力。Anduril拥有价值2亿美元的反无人机系统合同,而OpenAI的转变也可能为其开启新的收入来源。
AI进步新途径:从游戏开始?
近日,AI领域迎来两大突破:World Labs和DeepMind相继发布了能够生成3D场景的“世界模型”。World Labs由著名科学家李飞飞创立,其模型能直接渲染出可交互的3D场景。随后,DeepMind推出了Genie 2,不仅画面更流畅,还能实现角色的多种互动及环境动态模拟,如跑步、跳跃和驾驶等。尽管这些模型展示了AI在理解现实世界方面的进展,但目前仍处于早期阶段,且依赖于游戏素材的学习,距离真正的通用人工智能(AGI)仍有距离。
苹果委托三星开发新型独立封装LPDDR DRAM,助力iPhone提升AI性能
苹果公司要求三星研发新的低功耗双倍数据速率(LPDDR)DRAM封装方式,以提升iPhone的AI性能。目前iPhone使用堆叠封装(PoP)方案,但存在带宽和数据传输速率的局限。新方案计划于2026年实现,通过分离DRAM和SoC,增加I/O引脚数量,提高数据传输速率和内存带宽。未来还可能采用LPDDR6-PIM技术,数据传输速度和带宽将是LPDDR5X的两到三倍,专为端侧AI设计。
LiblibAI与星流联合发布全新自研图像大模型,引领视觉技术新潮流
LiblibAI 发布了自主研发的图像大模型 Star-3 Alpha,基于F.1基础算法架构训练,提供了官网、API等多种体验方式。Star-3 Alpha在图像精准度、色彩表现力等方面成为新标杆,能够精准响应复杂提示词,满足多种设计需求,并在盲测中多项能力大幅领先。
京东推出10大AI营销神器,最强模型参数高达810亿!
京东云发布言犀智能营销平台,推出十大AI营销产品,服务超80万商家,AIGC内容使用率达80%,平均转化率提升30%。该平台涵盖数字人、智能导购、智能混剪等场景,展示了AI技术在产业落地的巨大潜力。京东云自2020年起布局AI技术,已训练多种规模的AI模型,并强调不陷入低价竞争,专注于实用产品的开发。数据显示,中国生成式AI产品用户规模达2.3亿,占总人口16.4%,预示着AI正重塑企业营销与服务模式。
阿里通义实验室开源语音处理技术,ClearerVoice-Studio帮你轻松去除背景噪声
阿里巴巴达摩院开源了名为ClearerVoice-Studio的语音处理技术,集成了语音增强、分离及音视频说话人提取功能,采用复数域深度学习算法,显著提升语音降噪和分离性能。该技术在2022年IEEE/INTER Speech DNS Challenge中表现优异,核心模型FRCRN获整体第二名。ClearerVoice-Studio能最大限度消除背景噪声,降低语音失真,并提供在线Demo供用户体验。
苹果发布iOS 18.2 RC版,Siri重磅接入ChatGPT
苹果公司发布了iOS 18.2 RC版本更新,引入了Visual Intelligence视觉智能功能,显著提升了物体识别和信息获取能力。iPhone 16系列用户可通过摄像头获取建筑物位置及餐厅信息等。新版Siri整合ChatGPT技术,并将支持多语言版本,国行版本计划采用百度替代ChatGPT,但合作尚遇障碍。
谷歌推出PaliGemma 2:AI识情绪引争议,专家警示科学与伦理风险
谷歌推出新AI模型PaliGemma2,声称能通过图像分析识别人类情绪,引发学术界和技术伦理专家的质疑。该技术的基础科学性脆弱且存在偏见问题,专家警告其潜在伦理风险及可能加剧社会歧视。尽管谷歌称其经过测试,但专家对其评估的全面性持怀疑态度,强调需对AI技术保持审慎态度。
AI脱困语言限制?Bengio与LeCun激辩AGI未来发展路径
当前AI正从纯语言模型转向更复杂的推理和思考能力,如OpenAI的o1模型在数学和代码领域取得显著进展,并在美国奥数竞赛中跻身前500名。然而,图灵奖得主Yann LeCun质疑语言是否为思考的必要条件,指出即使在严重语言障碍下,人类仍能进行思考和推理。这引发了对未来AI发展路径的探讨,包括是否会出现与人类大脑不同的新型智能形态。此外,AI在欺骗人类和潜在误用方面的增强也带来了伦理挑战。
Amp Robotics获9100万美元融资,引领机器人垃圾回收新纪元
尽管只有32%的可回收垃圾得到妥善处理,回收行业正迎来自动化变革。Amp Robotics等公司通过部署机器人提高回收效率,现已在三家回收设施中部署约400台机器人,并计划扩展。Amp Robotics的系统利用AI和摄像头监控并分类垃圾,按每吨收费提供回收服务。近期,Amp Robotics完成了9100万美元的D轮融资,领投方为Congruent Ventures,多家知名机构参投。
谷歌CEO驳斥微软:AI领域谷歌仍保持领军地位
谷歌CEO皮查伊表示,到2025年,谷歌搜索引擎将有“深刻变化”,能解决更复杂问题。谷歌已进行多项AI升级,包括AI搜索摘要和增强的Lens功能,并计划更新Gemini模型。皮查伊强调谷歌在人工智能领域将持续领先,并愿意与微软模型进行对比。
ChatGPT远非终点,Nature专栏:让AI写系统性综述仍需百年进化
科研人员面临文献爆炸式增长带来的信息过载问题,难以全面理解和整合数据。尽管AI技术,尤其是大语言模型(LLMs),如ChatGPT,提升了文献综述的自动化能力,但目前仍存在幻觉错误和质量不高的问题。AI工具虽能加速文献筛选和数据提取,但仍需人工审核确保透明度和可复制性。实现高质量的系统性文献综述还需较长时间的发展,当前工具更适合辅助综述过程的部分环节。
OpenAI推出ChatGPT Pro:每月200美元,解锁完整功能
OpenAI宣布在未来12天进行12场直播,发布包括o1完整体和ChatGPT Pro在内的多项更新。o1完整体在推理速度和准确性上显著提升,错误率减少34%,并新增图像上传功能。ChatGPT Pro每月200美元,提供无限制访问o1完整体及更高级别的o1 pro模式,错误率降低75%,但价格昂贵。此外,OpenAI计划增加网页浏览和文件上传功能,并向医学研究人员捐赠ChatGPT Pro。
全新AWPortraitCN模型发布,打造符合中国宝宝审美标准的图像!
AWPortraitCN是一款基于FLUX.1-dev的人工智能模型,专为生成符合中国人外貌和审美的肖像图像而设计。该模型经过多样化肖像训练,具有强大的泛化能力,并且在皮肤质量表现上更为细腻真实。用户可通过Shakker AI平台轻松使用,无需复杂设置。该模型不仅提升了肖像生成的质量,还推动了开源和开放科学的发展。
OpenAI发布全新ChatGPT Pro,每月200美元畅享满血版智能体验!
OpenAI推出全新o1模型和ChatGPT Pro订阅服务,新模型在数学能力和编码能力上分别提升了30%和27%,重大错误率降低34%,并具备更强的图像识别和多模态处理能力。o1模型通过独特的“思考”机制显著提高回答准确性和效率,处理复杂问题时间缩短60%。ChatGPT Pro订阅服务定价200美元/月,准确率为79.3%,目前ChatGPT Plus用户可免费体验。
三大AI巨头争相布局全球市场
2024年12月,谷歌发布了Genie 2,实现了从静态照片到可交互3D场景的转换,细节丰富且互动流畅,但只能维持几十秒。与之对比,OpenAI的Sora追求视觉真实,World Labs专注空间准确。这三种技术路线各有优势和局限,未来可能需融合视觉真实性、交互自然性和空间准确性,以构建更完善的数字世界。
谷歌新AI模型PaliGemma2引争议:情绪识别背后的隐患与挑战
谷歌发布了新一代AI模型PaliGemma2,能生成图像描述和回答照片中人物的相关问题。尽管该技术在人口统计学偏见方面优于行业基准,但专家对其伦理和社会影响表示担忧。情绪识别的准确性及潜在滥用风险成为争议焦点。欧盟已对情绪识别技术实施严格限制。PaliGemma2的发布将推动AI图像理解领域的发展,同时也带来社会伦理和数据隐私的新挑战。
Humane推出全新AI操作系统CosmOS,革新人机交互开启智能协作新纪元!
Humane发布的CosmOS操作系统借助强大的AI驱动和智能代理系统,提供个性化、场景化的交互体验。AI Bus智能协调器高效分配任务,支持多种输入方式和设备适配。CosmOS具备快速处理请求、适应最新AI技术及强大隐私保护功能,计划构建开放的开发者生态系统,推动个人、企业和开发者领域的创新发展。
ComfyUI插件爆雷!Impact-Pack植入挖矿病毒,严重安全隐患曝光
ComfyUI社区流行的插件Impact-Pack被发现因Ultralytics包(8.3.41和8.3.42版本)存在安全漏洞,导致用户系统被植入加密货币挖矿病毒。病毒通过恶意修改的Ultralytics包自动下载并执行,连接到特定矿池地址进行挖矿。目前建议用户卸载相关插件和依赖包,并安装修复后的8.3.43版本或直接从GitHub安装依赖,以确保系统安全。
揭秘:借助人工智能年入32.5万美元的创业秘籍
Mike和Alex从顶级会计师事务所辞职,利用人工智能开发了一款名为AskAI的工具,专注于优化企业客户支持。这款工具在三天内完成首个原型,并在Product Hunt上发布后获得2000次访问和首批付费用户。AskAI支持多语言对话、长文本处理、文件解析和个性化服务等功能,年收入达到32.5万美元。尽管面临隐私保护和技术伦理等挑战,AskAI仍持续发展,激励更多创业者追求梦想。
OPPO用Gemini打造AI手机,为用户带来极致体验
OPPO与Google Cloud合作,在AI领域展开深度合作,利用Gemini家族模型和Vertex AI技术,使OPPO手机实现了AI功能,如AI录音摘要和AI工具箱。这些技术不仅提高了用户的工作效率,还显著降低了人工工作量,减少了功耗和计算延迟。OPPO在全球拥有约7亿月活跃用户,计划继续与Google合作,推出更多基于生成式AI技术的功能,以提升用户体验。
AI营销热潮席卷A股,相关股票涨幅显著
2024年,大模型市场竞争转向应用侧,而非基础模型。AppLovin和浙文互联通过AI在数字营销领域的应用取得了显著成功。AppLovin市值增长近8倍,得益于AI工具AXON 2.0的数据分析和用户意图预测能力。浙文互联通过AI引入内容生成和数据分析,提升了营销效率,毛利率从4.33%提升至8.66%。两者均强调数据积累和AI应用的重要性,预示着未来AI在数字文化领域的更广泛应用。
美图员工年终奖创新高:比特币与AI美女助力涨幅惊人
美图公司宣布已出售所有持有的加密货币,获利约7963万美元。这些利润将主要用于支付特别股息和作为营运资金。尽管美图在加密货币投资上经历了亏损,但近年来通过加码AI业务,如推出AI绘画功能和多种AI生产力工具,美图的业绩有所回升,2024年上半年收入同比增长28.6%,净利润增长80.3%。
资管巨头贝莱德5000万美元押注,助力这家AI公司颠覆企业分析行业!
Pyramid Analytics成立于2008年,提供企业级业务分析软件,集成了数据准备、业务分析和数据科学等功能。公司已获得多次融资,最新一轮由贝莱德投资5000万美元。凭借其高性能数据处理和用户友好的平台,Pyramid Analytics已在众多知名企业中得到应用。预计到2033年,全球大数据和商业分析市场规模将达到6657亿美元,Pyramid Analytics有望在此过程中继续引领市场。
AI初创公司Enterpret获2080万美元融资,精准解读客户心声
Enterprit 在 A 轮融资中筹集了 2080 万美元,旨在利用人工智能算法整合并分析来自多渠道的客户反馈,帮助企业改进产品和服务,提高客户满意度。本轮融资由 Canaan Partners 领投,多家知名投资机构参与。
Cake获1300万美元融资,助力中型企业轻松拥抱AI技术
Cake是一家位于纽约的创业公司,旨在帮助中小企业轻松利用AI技术。通过获得1300万美元融资(包括Google Gradient Ventures领投的1000万美元种子轮),Cake提供了一个集成100多个AI组件的平台,能够将实施成本削减80%,部署周期缩短6至9个月。该平台由AI基础设施专家创建,设计灵活且安全,已在医疗、保险和金融服务领域获得初步成功。Cake正助力中小企业克服AI应用障碍,迈向智能化未来。
OpenAI携手Future媒体平台,共同拓展ChatGPT内容库
OpenAI与英国媒体公司Future达成战略合作,将Future旗下超过200个媒体品牌的内容引入ChatGPT,其中包括《Marie Claire》、《PC Gamer》等知名品牌的丰富内容。此举旨在提升用户体验并支持Future在AI技术上的应用,以提高工作效率。
Marvell第四季营收超预期暴涨,引领AI风暴股价飙升!
马维尔科技预计第四季度营收将达到18亿美元,超出市场预期的16.5亿美元,股价因此上涨。其数据中心收入同比增长一倍至11亿美元,整体营收为15.2亿美元。尽管其他市场如无线运营商的收入下滑,但马维尔在AI芯片领域的增长显著,预计该市场未来规模可达450亿美元。
原高中辍学者入职OpenAI Sora团队,专攻AGI挑战
瑞典天才少年Gabriel Petersson,虽高中辍学,但凭借丰富的行业经验和多项成就,如成功商业活动、产品推荐系统的构建及病毒营销策略,先后担任多家初创公司CTO及Midjourney软件工程师。现年25岁的他加入OpenAI Sora团队,成为研究科学家,参与AGI研究。OpenAI近期频繁发布招聘信息和预告直播,预示着Sora模型或将有重大进展。
OpenAI圣诞惊喜:连续12天发布重磅更新,o1、Sora即将震撼登场!
从12月5日起,OpenAI将连续12天发布新产品和演示,包括满血版o1、Sora等。奥特曼预测,AGI将在2025年实现,而OpenAI的下一代旗舰模型预计也将在此期间推出。此外,OpenAI与微软的合作将在AGI实现时解绑,以便OpenAI独立发展。
通信巨头入局视频生成,权威评测霸榜:人物跨场景仍保持高度一致
中国电信人工智能研究院发布的新视频大模型TeleAI-VAST在权威榜单VBench上表现出色,16项子指标中有9项排名第一,尤其在物体分类和人体动作方面获得满分100%。该模型具备高精度的人物动作控制、音画同步及不同场景下的时空一致性,采用了创新的两阶段生成架构VAST。TeleAI-VAST将于明年开启公测,未来有望应用于长视频生成。此外,TeleAI还拥有包括语义、语音、视觉等在内的“星辰”大模型体系,并推出了大模型智能体平台。
马斯克加价72亿抢购200订单显卡,向老黄插队求货
马斯克旗下的xAI计划抢先预购英伟达GB200芯片,总价10.8亿美元,以加速AI产品研发,与OpenAI竞争。GB200芯片性能约为H100的5倍,单颗售价高达7万美元,预计用于训练大型语言模型。xAI还计划推出面向消费者的AI应用,目标在各项指标上成为“世界上最强大的AI”。此外,英伟达下一代GPU Rubin预计于2025年下半年推出,采用3nm芯片技术。
DeepMind推出GenCast:AI革新天气预测技术!
GenCast是一种基于机器学习的概率天气模型,能在8分钟内生成15天的全球天气预测,精度高达97.2%,超越了传统的欧洲中期天气预报中心的集合预测系统。该模型通过条件扩散模型生成多样化的预测结果,适用于极端天气预测及资源调配,有望为多个行业带来显著的经济和社会效益。
字节推出全新代码大模型评估基准“FullStack Bench”,全面评测代码能力
字节跳动推出最新代码大模型评估基准FullStack Bench,涵盖11类场景及16种编程语言,包含3374个问题,源自Stack Overflow并经过严格筛选与验证。该基准相比现有标准在编程领域覆盖面更广,评估更准确。同时,字节跳动开源了代码沙盒工具SandboxFusion,并展示了自家代码大模型Doubao-Coder及其评测结果,凸显其在AI编程领域的进展。
巴西AI教育平台Teachy获700万美元A轮融资,惠及超百万教师
Teachy,一家总部位于巴西的人工智能教育平台,获得700万美元A轮融资,由Goodwater Capital和Reach Capital领投。此轮融资旨在增强产品、推动增长并扩大全球影响力。Teachy已支持超过100万教师和1000万学生,覆盖170多个国家。该平台通过AI技术帮助教师节省80%的时间,解决本地课程协调和数字连接等挑战。
只需一键,字节跳动AI助手豆包轻松生成带指定文字的图片
字节跳动旗下AI助手豆包升级了文生图功能,通过整合大型语言模型和数字图像技术,优化了对中文数据的学习及汉字生成能力,提升了生成效果。目前该功能仅支持添加文字而非生成文字。此次升级体现了豆包在AI技术应用上的创新,未来有望进一步提升用户体验。
OpenAI CEO奥特曼:AGI或提前问世,但影响可控
OpenAI CEO Sam Altman在DealBook峰会上表示,AGI可能会比预期(如2025年)更早到来,但其对社会和经济的影响将较为缓慢,而非迅速变革。他还认为从AGI到超级智能的过程将非常复杂,可能需要“几千天”。此外,AGI的到来可能为OpenAI解除与微软的利润分成协议提供机会。
谷歌NotebookLM助力AI播客火爆兴起,人人都能轻松学习口语和课本内容
NotebookLM因其10月推出的AI播客功能迅速走红,已积累数百万用户。该工具能将文档、链接等转化为AI生成的音频对谈,简化了音频创作过程。随着AI音频领域的发展,多家公司如ElevenLabs和中国的PodLM.ai也推出了类似功能。AI音频技术不仅提升了内容创作效率,还为教育等领域带来了新机遇。谷歌计划将NotebookLM集成到其大模型Gemini中,进一步推动该技术的应用。
全球最萌AI小猫亮相,你准备好被圈粉了吗?
Recraft AI是一款由英国初创公司开发的AI生成图像工具,以其独特的“Hard Flash”风格受到欢迎。该工具支持用户生成具有胶片效果的图片,每天可免费生成50张图片。尽管Recraft AI最初被误解为专注于C端用户,实际上它旨在为平面设计师提供辅助工具。Recraft V3模型尤其受到关注,因其能生成包含长文本内容的图像,从而提升设计师的工作效率。该应用在社交媒体上的传播使其注册用户迅速超过200万,显示出有效的营销策略和较低的使用门槛对于AI产品的普及至关重要。
Meta计划采用核能供电以满足AI发展的巨大电力需求
Meta 计划在2030年前为支持AI技术发展需额外获取1到4吉瓦的核电,并将发布请求提案寻找美国的电力开发商。公司认为核能是满足AI电力需求及实现可持续发展目标的实际途径。Meta 正考虑使用小型模块化反应堆(SMRs),尽管其商业可行性尚未得到证实。亚马逊和谷歌等其他科技巨头也在积极投资核能领域。然而,核能发展面临监管和公众安全担忧等挑战。
Cleerly获1.06亿融资,AI技术助力心脏健康早期检测革新
Cleerly,一家专注于利用AI分析CT扫描以早期筛查冠状动脉疾病的初创公司,近期完成了1.06亿美元的C轮扩展融资,显示出市场对其增长潜力的高度认可。该技术已获FDA批准,并被医疗保险覆盖,年复合增长率超100%,正推动心脏病筛查的普及。
厦门大学团队运用AI技术助力甲骨文考释,成功入选“探元计划2024”TOP10
厦门大学史晓东教授团队的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”TOP10榜单。该模型利用AI技术提升甲骨文考释效率,通过跨模态理解能力及端到端综合考释方法,有效训练多模态大模型,助力甲骨文的现代化考释。项目由国家文物局科技教育司指导,旨在推动文物保护与数字化科技发展。
Meta AI项目将在路易斯安那州创造6500个就业机会
Meta计划在路易斯安那州东北部Richland Parish建设一个人工智能优化的数据中心,预计于2030年完工。该项目将直接创造500个新岗位,间接带动超1,000个就业机会,高峰期将有5,000名建筑工人参与,总占地面积达2,250英亩,为当地经济和年轻人提供科技行业发展的机遇。
房东利用人工智能算法疯狂加租,你怎么看?
RealPage公司的算法定价软件被指控操纵全美租金价格,引发监管机构和消费者关注。加州及多个城市拟禁止使用此类软件,联邦检察官提起反垄断诉讼。数据显示,2020年至2024年,圣迭戈平均租金上涨21%,高于全国平均水平。RealPage否认指控,称技术有利于市场,但遭检察官质疑。这场争议反映出科技、房地产与社会公平之间的复杂博弈。
美国25%的小型企业已采用AI,工作效率大幅提升
最新分析显示,约四分之一的小型企业正采用生成式AI作为商业工具,其中微型企业(1到4名员工)在AI使用上仅次于大型企业。AI技术帮助这些企业提高效率和提升服务质量,未来普及率预计将更高。
斯坦福校友研发机器人刮胡子技术,一年内获数亿融资,红杉资本领投!
穹彻智能,一家专注于具身智能系统的初创公司,近期完成了新一轮融资,领投方为红杉中国,累计融资金额已达数亿元人民币。该公司在成立仅一年的时间里,凭借其自主研发的“穹彻具身大脑Noematrix Brain”,展示了在衣物折叠、黄瓜削皮等复杂任务上的突破性技术,获得了Prosperity7 Ventures、红杉中国等知名投资机构的青睐。该技术通过力控技术和多模态学习,提升了机器人的通用性和鲁棒性,展示了在开放环境下的卓越性能。
4名本科生开发编程“神器”,助力8岁女孩轻松掌握编程,年收入高达6500万美元
Cursor,一款由四名MIT本科生创立的AI编程助手,估值已达25亿美元。其最新版本能通过自然语言处理实现部分编码自动化,用户群体已超4万。预计到2024年11月,Cursor的年化经常性收入将达6500万美元,较2023年增长6400%。Cursor因其强大的功能受到广泛好评,被视为革命性的自然语言编程工具,推动了A股市场上的“AI编程+低代码”概念。
调研显示:71%企业已应用AI,财务运营高度依赖人工智能技术
最新研究表明,71%的企业已在财务运营中使用人工智能,并取得显著回报。KPMG预计,这一比例将在未来三年升至83%。AI领导者企业中,95%计划扩大AI应用,整体收益持续增长。尽管存在数据安全和技能等挑战,57%的领导者表示投资回报超出预期。
红杉中国领投,穹彻智能打造具身智能革命性机器人大脑
穹彻智能,一家成立仅一年的初创公司,在具身智能领域获得红杉中国等顶级投资机构青睐,完成新一轮融资。该公司自主研发的Noematrix Brain具身大脑系统,通过“以力为中心”的技术路线,显著降低了训练成本并提升了模型的通用性和鲁棒性。穹彻智能的AnySkill技能库已在多个领域展现技术潜力,并与上海交通大学合作开发ViTaM视觉-触觉联合系统。红杉中国认为穹彻智能具备强大的技术团队和商业可行性,有望成为具身智能领域的领军者。
Humane致力于将AI Pin软件集成到手机、汽车和智能扬声器中
Humane公司发布了展示其操作系统CosmOS潜力的视频,该系统可在汽车、电视、智能扬声器和手机等多种设备上应用。视频中演示了通过CosmOS实现的多种交互功能,如控制智能家居设备和处理日常任务。不过,这些功能仍处于原型阶段且可能变化。CosmOS SDK目前未公开发布,仅对部分合作方开放。尽管之前AI Pin产品的失败给公司带来挑战,Humane仍寄希望于CosmOS成为未来人工智能设备的核心操作系统,并正寻求与其他公司合作。
DeepMind推出单图生成游戏世界的基础模型,开启下一代智能体新篇章!
谷歌DeepMind发布了新一代基础世界模型Genie 2,该模型能根据一张图片生成长达1分钟的一致性3D游戏世界,支持键盘和鼠标操作。Genie 2能够生成多样化的环境,包括不同视角和丰富的物理效果,有望为具身智能体提供无限的训练数据,推动通用人工智能的发展。
苹果与百度合作?iPhone国行版将接入文心4.0模型
苹果公司与中国科技公司百度合作,将百度的AI大模型Ernie4.0整合到国行版iPhone中,以提升AI体验。尽管适配过程中遇到一些挑战,苹果仍计划在明年推出中文版Apple Intelligence,以增强iPhone在中国市场的竞争力。目前,苹果为此支付了相应费用,并需确保服务合规及规避法律风险。
库克:苹果AI从未考虑收费,视其为产品基石
苹果CEO蒂姆·库克否认了关于苹果计划对AI服务收费的说法,他认为AI是设备的基础功能,如同多点触控。库克还谈到了自己的退休问题,表示自己对苹果有深厚感情,目前无意退休。
百度宣布:文心一言成为中国生成式AI产品中网民使用率最高的平台
报告显示,截至2024年6月,中国生成式人工智能产品用户规模达2.3亿人,占总人口的16.4%。百度的文心一言以11.5%的国内网民使用率居首,其日均调用量达15亿次,处理Token数量超1.7万亿,同比增长30倍。对话类产品占据62%的市场份额,百度文库AI功能累计使用次数超28亿次。截至2024年11月,百度文心智能体平台吸引15万家企业和80万名开发者入驻。总体上,中国生成式人工智能产业蓬勃发展,文心一言等产品持续提升生活品质和工作效率。
字节、阿里、美团发力硅谷 AI:打造全新就业风向标
阿里巴巴、字节跳动和美团等中国科技企业在硅谷积极招募人工智能人才,年薪高达30万至35万美元。尽管美国政府限制对中国出口高端AI芯片,但中资公司在美分支机构仍可获取这些芯片。当前,中国AI人才缺口预计到2030年将达400万人,对AI专业人员的需求将增至600万。
国内首个眼科AI大模型“伏羲慧眼”问世,段俊国教授团队引领医疗科技革新
由王宁利教授和段俊国教授带领的科研团队研发的国内首个多模态、多任务眼科AI大模型“伏羲慧眼”,基于来自18个国家的340多万张眼科影像数据,涵盖多种影像模态,可在多种眼科疾病筛查、病理分割及疾病进展预测中发挥作用。该模型在《NEJM AI》杂志上发表,并有望提高诊疗效率和缓解医生压力,推动眼科医学智能化发展。
OpenAI转变态度,与国防科技企业Anduril携手合作
OpenAI宣布与国防科技公司Anduril Technologies合作,将其人工智能软件集成到Anduril的反无人机系统中,旨在提升侦测与打击能力。Anduril市值140亿美元,并与美国海军陆战队签署了2亿美元的合同。此次合作标志着OpenAI在军事用途上的态度转变,此前其服务条款禁止军用,现已放宽限制。OpenAI CEO表示,此举旨在保护美国军人并保障国家安全。Anduril的创始人与特朗普及马斯克有联系,这可能提升OpenAI的政治影响力。
Cleerly获1.06亿AI心脏筛查革新引关注
Cleerly公司利用人工智能技术分析心脏CT扫描,以提前发现潜在心脏病风险,正进行大规模临床试验验证其方法的准确性。该公司已完成1.06亿美元的C轮融资,年复合增长率超100%,并获得医疗保险覆盖,计划帮助约1500万心脏病患者。若通过监管审批,Cleerly有望显著扩大市场份额并实现可观收益。
ChatGPT每周活跃用户数突破3亿,社交媒体上最火的AI助手!
ChatGPT 的每周活跃用户突破3亿,每天处理超过10亿条消息,显示出其强大的市场吸引力和用户依赖性。OpenAI 通过不断推出新功能如 AI 搜索引擎和新界面“画布”,持续提升用户体验。此外,ChatGPT 正逐步集成到苹果公司的 Siri 中,进一步扩展其用户基础。
谷歌ViT核心团队转战OpenAI,助力Sora研发工作
谷歌DeepMind的三位ViT核心作者——翟晓华、卢卡斯·拜尔和亚历山大·科列斯尼科夫,已确认将加入OpenAI。其中,ViT论文已被引用超过4.9万次,该研究证明了Transformer在计算机视觉领域的有效性。这三位研究人员在谷歌期间做出了多项重要贡献,包括MLP-Mixer、BiT等知名工作。他们将在几周后正式加入OpenAI苏黎世实验室。
阿里妈妈将开源AIGC Benchmark,实现大规模商业化落地将在NeurIPS 2024公布
阿里妈妈在2023年推出了AIGB(AI-Generated Bidding)模型,这是一种基于生成式模型的全新迭代范式,用于在线广告的自动出价。经过一年的研发,AIGB在阿里妈妈广告平台成功部署并取得显著效果,如在Max-Return任务中GMV提升了3.6%,在Target Roas任务中GMV提升了5.0%。阿里妈妈还将在NeurIPS 2024上开源AIGB的Benchmark,并举办了相关的自动出价比赛。
ChatGPT对特定名字避而不谈?揭秘其背后诡异Bug!
ChatGPT在被询问特定名字如David Mayer、Brian Hood、Jonathan Turley等时会出现卡顿或拒绝回应的现象。这些名字涉及公共事件或隐私问题。OpenAI承认存在内部隐私工具标记某些名字,但未详细说明。专家认为这反映了AI系统的复杂性,提示用户应通过直接查证来验证信息。
AI或将使音乐行业从业者收入在未来四年内减少近25%
国际作者和作曲家协会(CISAC)的研究显示,未来四年,音乐行业的从业者将面临近25%的收入损失,视听行业从业者也将经历超20%的收入缩水。该报告强调,生成式AI市场的扩张将使创作者的经济价值向AI公司转移,预计到2028年,AI生成内容将占音乐库收入的60%及传统音乐流媒体平台收入的20%。澳大利亚和新西兰在制定保护创作者权益的政策方面领先,提出了包括独立AI立法在内的多项建议。
ABBA联合创始人警示:AI或致2028年音乐创作者收入暴跌
ABBA联合创始人Björn Ulvaeus警告称,生成式人工智能正威胁音乐创作者的收入。据国际作者和作曲家联合会报告,到2028年,音乐艺术家可能损失五分之一的收入,累计损失达220亿欧元,而AI提供商同期收入预计从3亿欧元增至90亿欧元。Ulvaeus呼吁建立监管框架以保护创作者权益。
昨晚“云计算春晚”大放异彩:大模型与芯片密集发布,超越OpenAI和谷歌!
亚马逊云科技在re:Invent大会上推出全新自研生成式AI多模态模型Amazon Nova系列,涵盖文本、图像、视频和语音,性价比大幅提升,部分模型价格比同类产品便宜75%。同时,亚马逊云科技发布了新一代AI芯片Trainium2,性能提升四倍,并宣布与Anthropic合作构建全球最大AI计算集群。此外,Amazon Bedrock服务升级,新增模型蒸馏和自动推理检查等功能,提升大模型应用的准确性和效率。这些更新旨在降低生成式AI应用成本,推动技术普及。
ChatGPT面对某些难题选择“自闭”,OpenAI如何回应?
ChatGPT出现神秘Bug,多个特定名字(如David Mayer、Brian Hood等)会导致聊天中断,疑似因内部隐私工具标记所致。OpenAI表示,这可能是为了保护个人隐私,但未提供更多细节。这些问题提醒用户应谨慎依赖AI获取事实信息。
UCSD张怡颖团队开源AI优化器,质量超O1,成本仅4%
UCSD 张怡颖教授的 GenseeAI 团队推出了开源工具 Cognify,该工具能自动优化生成式 AI 工作流,提高生成质量最多48%,降低生成成本高达90%。Cognify 支持多种语言框架,并采用分层优化方法,旨在解决生成式 AI 应用开发中缺乏系统化调试和优化的问题。
阿里推出全新检索智能体,复杂问题逐步拆解动态调整策略
阿里通义实验室研发的OmniSearch智能体,采用动态检索规划框架,显著提升多模态检索效率和内容生成准确性。实验显示,OmniSearch在处理多步推理、多模态知识需求及快速变化答案的问题上,表现优于现有方法。特别是在新构建的Dyn-VQA数据集上,OmniSearch在答案更新频率、多模态知识需求及多跳推理问题上分别提升了88%、35%和35%的准确率。
亚马逊全家桶战斗力爆表,多模态Nova竟不敌Claude 3.5!
亚马逊发布了名为Nova的多模态模型系列,包括Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas和Nova Reel。Nova Pro在多项基准测试中表现出色,价格低廉,每百万token输入价格为0.0175美元,输出价格为0.07美元。Nova系列不仅能处理复杂推理任务,还能生成高质量的视频和图像内容。此外,亚马逊还推出了Trainium2芯片,配备于EC2 Trn2 UltraServers,计算能力大幅提升,旨在挑战英伟达在AI芯片领域的主导地位。据预测,2024年全球人工智能半导体市场规模将达到1175亿美元,英伟达目前占据约95%的市场份额。
28岁IOI金牌得主领军打造AI程序员军团,6个月内创造20亿估值独角兽,编程效率飙升8倍!
全球首个AI程序员Devin由25人团队打造,成立6个月估值达20亿美元。Devin可使编码效率提升8倍,帮助企业节省数百亿美金。尽管Devin面临质疑,但其显著提升了编程效率,并被多家公司采用。AI编码工具的兴起预示着行业的重大变革,但也引发对500万美国及1300万中印程序员就业前景的担忧。
前华为天才少年放弃百万年薪,扎堆涌入AI创业潮
华为系创业者在人工智能领域的存在感不强,但在硬件领域较为突出。据IT桔子统计,华为前员工创办或联合创办的52家人工智能创业公司中,有3家为AI相关上市公司。其中,多家独角兽公司的创始人与华为有渊源,如智元机器人、壁仞科技、滴普科技、GEO集奥聚合和安翰科技等。此外,华为的“天才少年”计划也孕育了一些创业者,他们在AI计算、芯片等领域有所建树。总体而言,华为系创业者偏向于智能计算和芯片研发,风格务实。
今年最强AI妖股狂涨790%,创始人一夜成百亿富豪,超越英伟达热潮来袭!
AppLovin凭借其AI广告引擎AXON 2.0,实现了股价从年初的38.78美元飙升至340.59美元,涨幅超790%,季度营收达12亿美元,同比增长39%,净利润4.34亿美元,同比增长300%。其日活跃用户数高达14亿,广告技术平台调整后的利润率达78%。AppLovin的成功展示了AI在广告营销中的巨大潜力,推动了公司在2023年的强势增长。
25位顶尖专家联手打造,Devin让编程效率提升8倍,6个月估值飙升至20亿!
Devin是一款由Cognition AI开发的AI编码助手,能够自主解决复杂的数据服务器问题,并在日常工作中帮助程序员发现和修复bug、更新代码等。尽管Devin仍存在局限性,但它的发展潜力巨大,已获得巨额投资并被多家知名公司采用。AI编码的兴起预计将在2029年带来超过40亿美元的收入,但其对程序员职业的影响仍在讨论中。
扎克伯格力捧Llama AI后,却用GPT-4升级自家编码工具Metamate
Meta CEO扎克伯格高度评价自研AI模型Llama,称其将引领行业,但Meta仍通过内部工具Metamate结合Llama和GPT-4,以增强功能。Metamate能有效支持基本编码任务,但面对复杂需求时仍有局限。此外,Meta因AI工具高效性在过去一年裁减超20,000名员工。
AI聊天机器人在社交判断测试中击败人类,有望成为未来社交互动顾问
一项发表在《Scientific Reports》上的研究显示,AI聊天机器人在评估复杂社交情境方面表现优于人类。研究测试了五个聊天机器人,发现Claude、Microsoft Co-pilot和you.com的智能助手表现尤为出色,其中Claude的一致性最高。尽管AI系统在模拟情境中表现良好,但其在真实社交互动中的应用仍需进一步验证。研究共测试了276名人参与者。
前微软员工打造AI工具Lica,零基础也能做出优质产品演示视频!
Lica是一款由前微软员工Priyaa Kalyanaramaran和Purvanshi Mehta创立的AI工具,旨在将截图和录屏转化为教程和产品视频。该工具已完成400万美元的种子轮融资,支持用户轻松生成和编辑视频。目前提供免费版和付费版(每月49美元),未来将扩展至更多视频格式。Lica通过AI助手帮助用户节省时间和精力,同时保持创意控制。
AI生成论文泛滥,94%未被教师识破,学术诚信何去何从?
自ChatGPT公开发布以来,生成式人工智能在教育领域的应用导致学术欺诈现象日益严重。研究显示,高达94%的AI生成作业未被教师识别,且AI作业得分通常高于人类学生作业。然而,多数学校对此问题重视不足,甚至放宽了AI使用限制,削弱了教师的监督能力,使学术诚信面临巨大挑战。
只需10秒,AI一键生成中文海报,颠覆传统设计!
字节跳动旗下即梦AI发布的全新绘图模型v2.1支持直接在图片上添加中英文字体,具有出色的审美和泛化能力。该模型能在约10秒内生成高质量的海报,甚至可通过语言模型自动生成描述来复刻现有海报。尽管目前仍存在小字乱码的问题,但其强大的功能引发了设计师群体的关注和讨论,提示未来技术进步可能带来的机遇与挑战。
亚马逊联手Anthropic打造全球最强AI超算
亚马逊在Re:Invent大会上宣布与AI公司Anthropic合作,建设全球最大的人工智能超级计算机,规模为Anthropic现有最强模型的五倍。该超级计算机项目名为“Rainer”,将配备数十万颗最新的AI训练芯片Trainium2,成本比使用Nvidia显卡的集群降低30%至40%。此外,亚马逊还计划推出性能更强的Trainium3芯片,并提供多种工具帮助企业处理生成性AI模型。
谷歌推出最新生成式AI工具:Imagen 3和Veo登陆Vertex AI平台
谷歌云推出新一代生成式AI工具Imagen3和Veo,前者能根据文字提示生成高质量图像,后者可将静态图像转换为视频。从下周起,所有Google Cloud客户均可使用Imagen3,而Veo已进入私密预览阶段。此举使谷歌成为首家提供此类大规模云服务的公司,标志着AI在商业应用中的成熟。
日本将利用AI技术打击网络漫画和动画盗版问题
日本政府宣布将启动一项耗资300百万日元(约200万美元)的人工智能试点计划,旨在打击非法提供日本漫画和动画下载的1000个网站,每年因盗版导致的损失达数十亿美元。该项目借鉴了韩国经验,目标是提高检测效率并保护文化资产,推动创意产业发展,预计到2033年将文化资产出口额提升至20万亿日元(约1300亿美元)。
全新AI浏览器Dia登场,颠覆传统浏览体验!
Browser Company宣布将于2025年初推出AI浏览器Dia,主打智能写作助手、自然语言命令和自主行动能力。智能写作助手可实时完成句子并检索信息;自然语言命令能执行复杂操作;自主行动能力则可自动完成购物、提取信息及发送邮件等任务。Dia预示着AI在日常数字生活的深度融合,有望提供更智能、高效的网络体验。
OpenAI挖走DeepMind三位顶尖工程师,聚焦多模态AI项目加速发展
OpenAI宣布引入三位资深计算机视觉和机器学习工程师Lucas Beyer、Alexander Kolesnikov和Xiaohua Zhai,以加强其在多模态AI项目上的研发能力。这些专家将在苏黎世办公室工作,助力不同媒介数据的有效融合研究。此举体现了AI行业顶尖人才流动的高频率,并有望加速OpenAI在AI领域的创新步伐。
HCG与埃森哲合作,利用AI技术引领癌症研究新突破
印度最大的癌症护理网络HCG与埃森哲合作,利用生成性人工智能和深度学习技术,分析多维度患者数据,加速精确医学发展,以实现早期癌症检测和更有效治疗。此次合作结合了HCG的临床肿瘤学专长与埃森哲的技术能力,专注于药物发现、标志物识别和治疗路径开发,初期重点研究肺腺癌和头颈癌的分子特征。
字节跳动AI助手豆包新增图片理解功能,让视觉交流更智能!
字节跳动推出的豆包应用新增图片理解功能,支持照片上传与图像内容解析,甚至能理解笑话。作为大模型AI助手,豆包还提供文本生成、图片生成等功能,并已内测视频生成功能,可将图片和文字转化为多样化的视频内容。
“百度搜索”会输给“Kimi”吗?数据分析告诉你结果
百度面临来自其他大厂和创业公司的激烈竞争,其搜索市场份额从2021年的86.82%降至2024年5月的55.85%。尽管百度积极研发AI搜索,如“文心一言”和“文小言”,但AI搜索的商业化仍处于初期阶段,百度在电话会议上表示短期将优先提升用户体验。竞争对手如抖音、快手、腾讯、阿里和月之暗面等也纷纷推出各自的AI搜索产品。
斯坦福报告揭示:美国领跑全球AI实力,中国紧随其后
斯坦福HAI研究所的报告显示,美国、中国和英国在全球人工智能发展潜力排名中位居前三。报告基于36个国家的42个指标,全面评估了各国在人工智能领域的表现。美国以70分领先,其私营部门投资额达672亿美元;中国以40分紧随其后,在专利和研发投入方面表现突出;英国则举办首届人工智能安全峰会,位列第三。报告还强调了适度投资可显著提升排名,并鼓励改进数据收集以促进全球人工智能发展。
AI眼镜火爆热潮,能持续多久?
AI眼镜市场火爆,多家大厂和科技公司纷纷入局,预计2029年AI智能眼镜年销量可达5500万副。尽管销量潜力巨大,但AI眼镜仍面临技术挑战,如实时翻译、音视频功能和增强现实等,同时用户隐私和市场竞争也是一大难题。截至2024年5月,Meta眼镜销量已突破100万副,成为市场标杆。然而,AI眼镜仍需解决重量、续航和智能化不足等问题,才能真正实现普及。
AWS发布Nova系列AI模型,全能生成文本、图像及视频
在周二的re:Invent大会上,亚马逊AWS发布了Nova系列多模式生成AI模型,包括文本生成模型(Micro、Lite、Pro、Premier)和图像/视频生成工具(Nova Canvas、Nova Reel)。Micro、Lite和Pro模型已开始向客户推出,Premier预计2025年初发布。Nova模型支持多种输入形式,优化15种语言,其中Pro模型上下文窗口最大可达225,000单词或30分钟音频,未来将扩展至200万个标记。AWS还计划推出语音到语音模型和“任意到任意”多模态转换模型,均在2025年发布。
腾讯红杉联手打造的AI独角兽即将IPO,引领科技新潮流
北大才子吴明辉创立的明略科技,作为中国最大智能数据应用软件供货商,正式向港交所递交上市申请。公司历经多次融资,最高估值达210亿元,目前估值为15亿美元。2021年至2024年上半年,公司营收从10.43亿元增至14.62亿元,但净利润波动较大。明略科技的主要业务包括营销智能、营运智能及行业AI解决方案,其中营运智能业务占比显著增加。
亚马逊发布全新Nova AI模型,涵盖文本、图片及视频生成技术
亚马逊在AWS re:Invent大会上推出了全新的AI基础模型系列“Nova”,分为Nova Micro、Nova Lite和Nova Pro三款理解模型,以及图像生成模型Nova Canvas和视频生成模型Nova Reel。此外,亚马逊计划于2025年初发布最强多模态模型Nova Premier,并在同年晚些时候推出语音转语音模型。亚马逊还与Anthropic合作,建设全球最大的AI计算集群,以支持未来AI模型的开发和部署。
到2026年,全球AI数据中心用电量将等同于八个纽约市的惊人消耗
预计到2026年,全球人工智能数据中心的电力需求将达到40吉瓦,相当于八个纽约市的用电量。光计算初创公司Lightmatter正开发新型光学芯片,以提高计算效率和减少能耗。目前,已有多个大型人工智能数据中心在建设中,显示出对AI计算基础设施的迫切需求。
亚马逊发布6款大模型,推出3nm AI芯片,建成全球最大AI计算集群,苹果罕见力挺!
亚马逊在AWS re:Invent大会上宣布了一系列AI产品的更新,包括发布6款大模型和预告2款大模型,推出第三代AI训练芯片Trainium3及最强AI服务器Trn2 UltraServer。亚马逊还推出了自研大模型Amazon Nova系列,包括Micro、Lite、Pro、Premier四个版本的语言模型及图像生成模型Canvas和视频生成模型Reel。此外,亚马逊与Anthropic合作,投资80亿美元共建全球最大的AI计算集群,用于训练下一代大模型。新推出的Amazon EC2 Trn2实例相比现有GPU实例,性价比提高30%-40%。
AWS推出全新Trainium2芯片,将AI计算成本削减40%
在2024年AWS re:Invent大会上,亚马逊宣布推出基于Trainium2芯片的EC2实例,性能较上一代GPU实例提升30-40%。Trn2实例配备16个Trainium2芯片,提供高达20.8petaflops的计算性能;Trn2UltraServers则通过四个Trn2服务器组合提供高达83.2petaflops的计算能力。此外,AWS预告将于2025年底推出基于Trainium3的UltraServers,性能将是Trn2UltraServers的四倍。目前,Trn2实例已在美东(俄亥俄州)地区上线,并与多家公司合作推动AI技术应用。
谷歌NotebookLM核心团队集体离职,创立新公司追逐梦想热潮
谷歌的AI产品NotebookLM因其音频概述功能而爆红,9月流量增长300%,10月增长超200%。该产品由小团队开发,现团队负责人Raiza Martin及核心成员Jason Spielman和Stephen Hughes离职创业。NotebookLM由谷歌Gemini 1.5 Pro支持,能够自动提炼文件要点并生成对话播客,旨在简化用户与AI的互动体验。
OpenAI回应ChatGPT屏蔽“David Mayer”事件,真相原来是系统故障!
上周末,社交媒体热议因ChatGPT系统故障屏蔽“David Mayer”名字的问题,OpenAI确认这是技术故障并已修复。尽管如此,该事件引发了关于隐私保护和“被遗忘权”在AI工具中应用的讨论。
Meta:AI生成内容在选举虚假信息中占比不到1%
Meta发布的报告显示,生成式人工智能在Facebook、Instagram和Threads等平台上对选举相关信息的影响非常有限,AI内容在选举相关虚假信息中占比不足1%。Imagine AI图像生成器在选举日前一个月拒绝了近590,000个深度伪造图像请求。Meta在全球范围内删除了约20个隐秘影响网络,以防止外国干涉。
3个月内估值暴增10亿!李飞飞新模型助力一张图秒变3D世界,或将颠覆视频游戏行业
World Labs,由AI先驱李飞飞创立,宣布了其首个“空间智能”模型,该模型能通过一张图片生成3D世界。此技术不仅能实现实时渲染,还支持可控相机效果和景深调节。此模型已在2.3亿美元的融资支持下亮相,并获得了多位科技领袖的支持。这项技术有望革新视频游戏和电影行业,提供更高质量的3D体验。
AI助力!金融科技新贵9fin获5000万美元融资,加速债券市场智能化分析
伦敦金融科技公司9fin完成5000万美元B轮融资,将利用此资金推动其AI驱动的债务资本市场分析平台的发展。自2022年A+轮融资以来,公司年度经常性收入增长400%,客户基础翻倍至近200家机构。数据显示,72%的金融领导者已积极使用AI,其中64%用于欺诈检测,42%用于客户入职自动化。9fin通过AI技术提升市场洞察力,推动金融行业的数字化转型。
韩国首创:三星推出AI订阅俱乐部,租用智能家用电器新模式!
三星在韩国推出AI订阅俱乐部计划,用户可通过每月支付少量费用租用智能家电,如2,176美元的泡菜冰箱仅需每月7美元。订阅计划灵活,可选期限36至60个月,并提供免费维修及全面增值服务。三星计划未来扩展远程诊断和维修服务,并与多家品牌合作提供额外折扣,旨在降低智能家电使用门槛,让更多消费者体验“AI生活”。
WPS Office新添WPS AI语音速记,办公效率提升神器!
WPS Office新推出的AI语音速记功能,支持实时录音、多种语言互译及自动总结,提升了语音转文字的准确率和速度。该功能可在最新版本的WPS Office中使用,手机和电脑用户均可便捷访问。
陶哲轩预言成真:AI在数学领域遭遇重大挫折
数学AI在新测试中表现不佳,正确率仅2%,远低于其在常规数学测试中的高分表现。菲尔茨奖得主陶哲轩认为,这表明人类在某些数学领域仍能胜过AI。陶哲轩将AI的发展比作从汽车到飞机的转变,指出AI虽具有创造力,但在数学问题上仍主要依赖猜测。尽管如此,AI在科学研究和数学领域的应用潜力巨大,尤其在模型构建和数据处理方面,有望推动全球化合作和实验数学的发展。
AI配音阿根廷恐怖片《女巫游戏》即将登陆北美和英国
《女巫游戏》是一部将于2025年第一季度在北美和英国上映的阿根廷新片,灵感源自《哈利·波特》系列并融入恐怖元素。影片讲述一名少女通过VR头盔进入魔法学校拯救家人的故事,由著名导演法比安·福尔特执导,并有多位知名演员参演。该片因使用AI技术进行英语配音而引发争议,配音演员担忧此举将减少工作机会并影响艺术创作环境。
AI转账秘籍:只需一句话,轻松转走30万
近日,一个名为Freysa的资金管理AI在区块链圈引发关注。参与者需付费发送消息尝试骗过AI以获取奖金,已有两人成功获取4.7万美元和1.2万美元。AI最初设置的奖金池为3700美元,但因机制设计,获奖者实际只能获得部分奖金。尽管AI已多次被攻破,显示其漏洞仍然存在,但该项目背后的风险也不容忽视,涉及虚拟货币的投资风险及潜在诈骗行为。
英伟达参与投资!欧洲AI巨头获7亿融资,前身竟然是“俄版谷歌”
荷兰人工智能基础设施公司Nebius Group NV宣布获得7亿美元融资,投资者包括Accel和英伟达等。公司将发行33,333,334股A类股,每股21美元。资金将用于构建全栈人工智能基础设施,包括GPU集群、云平台及开发工具。受此消息影响,Nebius股价一度上涨27%,达到27.9美元。Nebius原为俄罗斯科技巨头Yandex的国际业务部分,现已独立运营并保留纳斯达克上市资格。CEO沃洛日期望通过此次融资加速AI基础设施建设,并计划未来进一步扩大融资规模。
QuestMobile:2024年AI智能体“三端”爆发,商业化起飞引领场景应用新模式
截至2024年10月,移动端AI原生应用月活用户达到8976万,同比增长373%。其中,豆包、Kimi智能助手和文小言月活跃用户分别为4839万、1650万和1179万。手机作为最成熟的AI载体,AI功能已成为标配,智能穿戴设备和智能家居在AI用户中的渗透率分别为33.4%和41.8%。AI智能体在教育学习、图像生成等领域快速发展,但数理化逻辑推理能力仍需增强。智能体生态建设初具规模,品牌主也开始关注其商业价值。
ChatGPT引用准确率仅三成,出版界担忧加剧
哥伦比亚大学Tow数字新闻中心的研究显示,ChatGPT在引用新闻来源时存在严重准确性问题,200条测试引文中高达153条出现错误或部分不正确。即使与OpenAI有合作关系的出版商如《纽约邮报》和《大西洋月刊》也无法幸免。ChatGPT极少承认信息缺失,且常表现出过度自信。OpenAI正与合作伙伴努力提高引用准确性,但目前出版商仍无法确保ChatGPT能准确展示其内容。
开发Arc浏览器的公司将于2025年推出全新AI浏览器Dia
The Browser Company推出了全新网页浏览器Dia,预计于2025年初发布。Dia浏览器以人工智能为核心,具备智能筛选信息、自动化任务执行和深度整合办公软件等功能。尽管部分功能已有相似应用,Dia仍致力于提供更便捷的信息交互体验,同时保留Arc浏览器的现有用户基础。
揭秘AI陪伴产品:解读赛道玩法与前景
AI陪伴产品通过情感交互、创意幻想、咨询疗愈及功能工具等多种形式,满足用户多样化需求,但商业化困难、伦理争议和隐私风险仍是行业难题。Character.AI在移动端下载量超3432万,网页端月访问量达3.1亿;Replika年收入超900万美元。预计全球AI陪伴市场规模将以26.6%的年复合增长率增长,到2030年达62亿美元。然而,商业化路径不畅、伦理问题及隐私担忧依然制约行业发展。
德国Helsing发布全新HX-2 AI“自杀式”无人机
德国防务公司Helsing发布首款AI驱动的自杀式打击无人机HX-2,最高时速220公里,作战范围100公里。HX-2配备先进AI,能在无持续数据连接下自主作战,已量产4000台并运往乌克兰进行实战测试,成本低于传统炮兵系统。
Hume AI用滑动条重新定义AI语音技术边界
Hume AI推出的Voice Control功能通过十个维度的语音精细调控,实现了前所未有的个性化声音表达。用户无需专业技能即可轻松调整,为数字助手、客服机器人等应用提供了更智能、自然的交互体验。相比其他AI语音技术,Hume的方案更为灵活和人性化,已展示出响应时间缩短40%、成本降低30%的优势。未来,Hume将继续扩展语音维度,提升语音质量和表现力。
ComfyUI桌面版全面支持Win和Mac,轻松告别繁琐安装配置
ComfyUI 推出了新的跨平台安装包,简化了安装过程,使得新手用户也能一键安装。这个桌面版更新不仅集成了推荐的 Python 环境,还内置了管理器和日志查看器,支持自动下载模型和模板工作流程,大大提升了易用性。未来,Web版仍将继续开发,但旧版UI将不再添加新功能。
MagicBot工厂实拍展示多台机器人协作魔法奇迹
魔法原子(MagicLab),一家由追觅科技生态孵化的机器人创业公司,于12月2日发布了其人形机器人MagicBot的产品进展。MagicBot已在工厂进行多项作业训练,包括产品检测、物料搬运等,并展现出多机协作能力。MagicBot拥有42个自由度,双臂最高负重20公斤,全身负重40公斤,续航达5小时。该公司自研了关节模组执行器和算法,使其能适应复杂环境并实现精准操作。魔法原子计划于2025年第一季度发布新一代MagicBot并实现小规模量产,应用于工业和商业服务场景。
ChatGPT遇到“David Mayer”就崩溃,揭秘背后神秘原因
ChatGPT 在提及 "David Mayer" 时无法正常回应并中断对话,引发网友猜测。该现象可能与法律问题或敏感人物有关,凸显了AI模型的复杂性和不确定性。OpenAI尚未对此做出官方回应。
浏览器新秀AI Dia计划2025年初发布,或将颠覆上网体验
浏览器公司宣布将于2025年初发布集成人工智能功能的新浏览器Dia,该浏览器将智能辅助文章撰写、信息检索及日常任务管理。Dia支持自然语言命令,并可自动处理网购和团队协作任务,但其精准度和商业化路径仍待完善。Dia体现了AI与浏览器融合的趋势,有望革新网络体验。
Cohere推出Rerank 3.5搜索模型,支持100多种语言精准查询
Cohere 发布了全新的搜索模型 Rerank3.5,支持超过100种语言查询,尤其在阿拉伯语、日语和韩语等语言中表现突出。内部测试显示,Rerank3.5在金融服务数据集上的表现比混合搜索系统提高了23.4%,比BM25算法提高了30.8%。该模型具备更强的推理能力和上下文理解,有助于企业提高搜索效率并降低成本。Cohere 通过主流云平台部署Rerank3.5,目标成为企业搜索的标准,但要求企业在2025年3月前完成升级。
黑芝麻智能发布全新算法模型,一文看懂技术亮点!
黑芝麻智能推出的端到端参考方案,采用创新的One Model架构和多模块协同设计,解决了传统分段式系统的信息损耗和训练分离问题。该方案包括标准版和高阶版,分别可在武当C1200和华山A2000芯片上部署。高阶版引入VLM视觉语言大模型和PRR行车规则概率化表征,提升了决策规划能力。标准版方案支持现有芯片,高阶版则为L3和L4级自动驾驶做好准备。
商汤发布办公小浣熊2.0:集成多种AI工具,全面提升办公效率
商汤科技推出办公工具小浣熊2.0版,升级为“AI原生一站式创作空间”。该版本通过“规划-分析-写作”三步法,增强了数据分析与文档解析能力,支持个人知识库构建及快速信息检索。无需编程技能即可实现数据洞察,自动完成留存率计算和趋势分析等任务。新增的数据可视化功能满足复杂需求,同时提供多种AI文本处理能力,如翻译、扩写、纠错等。用户可访问官网体验新功能。
亚马逊推出AI提示词优化工具,革新开发者工作效率
亚马逊推出了自动提示词优化功能,作为Bedrock AI服务的一部分,可显著提升包括Claude3、Llama3等在内的多种AI模型性能。具体提升包括:文本摘要性能提升18%,基于检索增强生成的对话连续性提升8%,函数调用能力提升22%。该功能简化了提示词优化流程,但仍存在局限,需结合人工判断。这标志着AI开发领域的重要进展,降低了技术门槛。
揭秘“开放”AI背后的秘密:科技巨头如何操控公众认知?
研究显示,关于“开放”人工智能的宣传可能误导公众和政策制定者,忽视了行业集中化的影响。尽管“开放”AI系统能提供透明性和可扩展性,但许多大型技术公司利用这一概念维护自身利益。研究强调,实现AI行业的多样性和公平竞争还需反垄断执法和数据隐私保护等措施。
2025年全球五大巨头GPU总量或将超1240万块,相当于H100的数量!
AI领域的竞争愈发激烈,谷歌和微软目前占据领先地位,而xAI迅速崛起。据统计,2024年底微软、谷歌、Meta、亚马逊和xAI将分别拥有75万-90万、100万-150万、55万-65万、25万-40万和10万块等效H100芯片。预计到2025年,这些公司将扩展到250万-310万、350万-420万、190万-250万、130万-160万和55万-100万块。英伟达预计2024年将生产约500万块H100芯片,总收入有望达到1100亿美元,2025年有望突破1730亿美元。
Hebbia获1.3亿融资,Wiseflow免费开源!这款信息挖掘神器你值得拥有!
Hebbia完成1.3亿美元融资,展示了其在信息挖掘和处理领域的实力。与此同时,Wiseflow开源其代码,降低了使用门槛,并支持本地化部署,提供高效的信息整理和语义化交互功能。这两款AI工具正革新我们获取和处理信息的方式。
AI技术让经典国产老剧焕然一新
AI技术将经典影视剧改编成离奇搞笑的视频,如甄嬛骑摩托、黛玉打拳击等场景,引发网友热议。尽管这些视频效果粗糙且引流能力有限,但展示了AI视频行业的创新潜力,尤其受到创作型博主的青睐。
智能客服进化记:从智障到真智能?
智能客服行业因大模型技术的应用而迅速升温,市场需求明显增加。2023年智能客服解决方案市场规模达30.8亿元,同比增长约36.9%。大模型技术不仅提高了客服效率和质量,还降低了成本,尤其在语音机器人和文本机器人等领域。然而,大模型客服仍面临技术挑战,如拟人度不足和幻觉问题。尽管如此,随着推理成本的急剧下降,智能客服的应用正逐渐增多,特别是在一些容错率较高的场景。大模型技术的持续进步有望在未来推动智能客服市场进一步扩大。
OpenAI联手苹果力争年底前实现用户破10亿目标
OpenAI计划到2025年实现10亿用户目标,通过与苹果合作及推出新产品加速增长。公司已完成60亿美元融资,并计划进一步扩展资金。此外,生成性人工智能在生产和安全管理中的应用显著增加,COO们利用GenAI进行生产监控的比例从32%上升至57%,自动化网络安全系统使用率也从38%提升至55%,表明企业对人工智能技术信心增强。
AI厨师机器人入驻泰国超市,或将彻底改变你的购物方式!
泰国中央食品零售集团与谷歌云合作推出首个生成式AI驱动的购物助手“Tops Chef Bot”,该助手将在中央池塘分店的Tops Food Hall试点。它能根据客户偏好提供个性化购物和餐食建议,并利用先进库存管理系统进行智能交叉销售。这一举措被视为泰国零售业数字化转型的重要里程碑,展示了AI技术在零售行业的变革潜力。
萝卜快跑获香港自动驾驶牌照,开启全球业务扩展新模式
萝卜快跑获得了香港运输署颁发的首个自动驾驶车辆测试牌照,计划于今年底前在香港开始测试。此举标志着萝卜快跑在全球业务拓展中的重要进展,并体现了其将先进AI和自动驾驶技术应用于绿色低碳出行的愿景。该牌照是根据《道路交通(自动驾驶车辆)规例》颁发的首个自动驾驶车辆先导牌照。
本文部分素材来自网络,不代表【AI 应用与实战】官方立场。
扫码关注本站公众号/加入知识星球,订阅更多精彩内容