数据中心芯片需求放缓怎么办?英伟达供应商:AI手机将接力 830.26M2024-01-23
穿越三国 我去玩《大国战》经典还原之通天霸府 753.89M2024-01-24
穿越三国 我去玩《大国战》经典还原之通天霸府 198.59M2024-01-25
李想谈人工智能:我绝对不止做一棵树了,永远保持创新活力 623.83M2024-02-01
律师:上诉不会加重李铁刑罚 76M2024-02-21
鼎盛注册平台——开启您的财富之门,迈向成功的第一步 193.54M2024-04-07
☘️人心挺好☘️星空体育app下载入口APP下载【首存送彩金☘️💰】🔥支持:64/128bit🔥系统类型:星空体育app下载入口官方网站-App下载(2024全站)最新版本IOS/安卓通用版V.1.8.7.3支持winall/win7/win10/win11🎁☘️安全平台☘️【下载次数374869】APP,现在下载,新用户还送新人礼包是一款计步器软件,可以每天记录你的运动步数以及运动时间,并记录运动情况得出卡路里消耗情况
⚡️☘️⚡️①通过浏览器下载
打开“星空体育app下载入口”手机浏览器(例如百度浏览器)。在搜索框中输入您想要下载的应用的全名,点击下载链接【mobile.jnyfsp.com】网址,下载完成后点击“允许安装”。
⚡️☘️⚡️②使用自带的软件商店
打开“星空体育app下载入口”的手机自带的“软件商店”(也叫应用商店)。在推荐中选择您想要下载的软件,或者使用搜索功能找到您需要的应用。点击“安装”即可开始下载和安装。
⚡️☘️⚡️③使用下载资源
有时您可以从“星空体育app下载入口”其他人那里获取已经下载好的应用资源。使用类似百度网盘的工具下载资源。下载完成后,进行安全扫描以确保没有携带不安全病毒,然后点击安装。
☎️「科普」☎️【星空体育app下载入口】⚡️☁️️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款非常实用的学习教育类软件,APP当中收录了很多诗人的诗集以及电子书等资料,有专门的文库,可以让用户根据自己的个人兴趣爱好去进行查找,并且有多种非常独特的学习方式,让户可以通过引导的方式掌握所有的知识点。
🎠百度百科🎠【星空体育app下载入口】⚡️🚡⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款十分风趣好玩的模仿运营游戏,现在有着超多抢手的综艺节目在电视上播出,观众爱看什么类型的综艺,喜爱哪位明星,怎样才能够制作出一档人气火爆的综艺节目,在这里你能够经过自己的学习和尽力打造出归于你自己的综艺节目,感兴趣的玩家能够等待一下。
🚖「分享下」🚖【星空体育app下载入口】⚡️☀️️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款针对B端用户提供的行业应用解决方案的软件,一站式ESG信息查询、企业绩效和风险评估、风险监控的SaaS平台。
🚂首充即送!返利不限🚂【星空体育app下载入口】⚡️🗺️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款全新实用的影视聚合视频播放应用,七七影视大全下载安装后该软件拥有聚合爱奇艺的功能、腾讯视频、土豆、优酷、乐视等多个视频平台整合了大量优质影视资源库。有了它,用户只需要一个软件就可以看到全网各大热门电影和好剧、爆笑综艺、流行动漫等视频内容丰富,类型丰富、界面简洁画质高清播放流畅不卡顿、而且没有广告插件的干扰,支持一键在线播放和离线缓存功能,让你想随时随地看到。此外,它还提供了一键智能搜索功能,只需输入你想看的电影和电视标题即可查找点播,并且有各种观看模式、清晰度调整允许您切换,每天更新超多视频资源随意选择。
🍘【恭喜发财大哥们】🥇🍘【星空体育app下载入口】⚡️♌️️️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款帮助教师教学的应用。教师可以获得权威的专业知识和教学资源,将这些资源运用到自己的课堂教学中,使教学质量更高效、更生动、更富有趣味性。
⏱[科普盘点]⏱【星空体育app下载入口】⚡️🎋️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款手机看3D图、分享图纸、批注图纸、快速看图、DWG画图、CAD测量、CAD看图、沟通图纸于一体的技术沟通和共享的云端看图软件,支持手机APP、微信、手机浏览器、PC电脑等多种应用终端。利用图纸通app可以方便快捷地与您的设计组成员、生产人员、售后技术人员、客户、合作伙伴等分享产品设计的3D模型、2D图纸、技术资料,无需安装任何CAD软件,即可在手机上批注、讨论图纸,基于图纸进行技术交流与交流。
🏎欢迎使用🏎【星空体育app下载入口】⚡️🍶⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款非常好用的手机追漫软件,在这里为大家准备的漫画资源超级丰富,真的很好用哦。
🕌🔥欢迎使用🕌【星空体育app下载入口】⚡️🥎⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款非常推荐的Android手机优化清洗软件,具有非常强大的软件功能,不仅可以帮助手机缓存垃圾,还可以帮助你加速手机,玩游戏,看视频。
🏫欢迎使用🏫【星空体育app下载入口】⚡️🛴️⚡️支持:32/64bit⚡️系统类型:星空体育app下载入口(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)《星空体育app下载入口》是一款拥有大量学习资源的手机学习软件。
1.🍮了解游戏规则:在登录星空体育app下载入口应用程序之前,务必熟稔各类棋牌游戏之规则,例如斗地主、麻将以及德州扑克等。各款游戏皆具备其特定的玩法及策略,仅用深度理解规则方可在游戏中展现出色表现。可通过查阅专业文献、观看教学视频或与高手展开互动以提升自身的游戏素养。掌控规则乃迈向棋牌大师之路的关键步骤。
2.🔋选择适合自己的游戏:星空体育app下载入口囊括众多棋牌种类,诸如斗地主、德州扑克以及象棋等等,每款游戏独具特色且具备挑战性。在选择游戏中,需根据个人喜好与实际水平做出决策,避免盲目追随热门项目。新手上路不妨先从简易游戏着手锻炼,待技术日臻完善后,逐步挑战更高级别游戏,以适应各类复杂挑战。
3.🔓合理利用道具:在星空体育app下载入口应用平台上,各类道具频繁现身,例如,记牌仪、加倍卡及换牌符号等。这些装备能助玩家于游戏中获胜,然而,若使用失当,反而可能引发不利因素。故而,对待道具的使用须审慎思考,根据实际情况选择合适的使用时机与情境。适时运用恰当的道具,有助于提高效率,使玩家赢得更迅速。
4.🍾与他人交流互动:除自行训练外,在星空体育app下载入口上,用户有机会参与互动交流,进社区、邀好友,甚至参与线上赛,认识更多棋艺爱好者分享经验,从中汲取新知识补足自身不足。因此,与他人的沟通互动在提高棋艺方面发挥着不可忽视的作用。
【鼎盛注册平台:为您的事业开启成功之门******
在当今竞争激烈的商业环境中,越来越多的创业者选择通过注册公司来实现自己的梦想。但注册公司的过程繁琐且复杂,涉及到的法律、财税、经营等方面的问题,也常常让许多创业者感到困惑和不知所措。为了帮助创业者克服这些难题,鼎盛注册平台应运而生,为企业提供一站式注册和全方位的后续服务。
鼎盛注册平台深知创业初期的困难和挑战,因此致力于提供一站式企业注册解决方案。从公司名称查询、工商注册、税务登记、银行开户到公司章程、股东协议等相关文件的制定,鼎盛平台都能够为您提供专业的服务。无论您是初次创业的新人,还是有一定经验的商界精英,鼎盛平台都能为您提供高效、便捷的注册流程,让您轻松迈出创业的第一步。
通过鼎盛平台,您只需提供一些基本的资料,平台将为您处理所有繁琐的注册事宜。专业团队将根据您的需求,为您量身定制注册方案,确保在合法合规的前提下,最大限度地节省时间与精力。让创业者能够专注于业务发展,而无需过多担心注册中的繁琐细节。
除了注册服务,鼎盛注册平台还为创业者提供全方位的法律和财税支持。在创业初期,很多创业者往往缺乏经验,面对复杂的法律法规和财税问题时,容易犯错误,甚至可能面临法律风险。而鼎盛平台则为您提供专业的法律顾问和财税顾问,帮助您规避潜在的风险。
鼎盛平台的法律服务包括合同审核、知识产权保护、公司治理结构建议等,确保您的企业从一开始就遵循法律规定,避免后续的纠纷和麻烦。平台还提供税务筹划、税务申报等一系列财税服务,帮助您优化税务结构,合理规划企业的财务,实现税负最小化,提升企业的整体竞争力。
鼎盛平台的团队还会帮助企业制定合理的股东协议和公司章程,确保各方权益得到保障,避免由于管理层不清晰或股东分歧导致的内部分裂。通过专业的服务,鼎盛平台为企业提供了强有力的法律和财税保障,让创业者可以轻松应对各类挑战。
鼎盛注册平台的服务不仅限于传统的公司注册。平台根据不同创业者的需求,提供多种灵活的选择。无论是个人独资企业、合伙企业还是有限责任公司、股份有限公司,鼎盛平台都能根据不同的情况提供合适的注册方案。
鼎盛注册平台还为有国际化需求的企业提供海外注册服务,帮助企业顺利进入国际市场。无论您是在中国境内创业,还是有意向将业务拓展到海外,鼎盛平台都能为您提供专业的咨询与支持,助您轻松跨越地域的限制,开创全球化事业。
鼎盛注册平台不仅满足创业者在公司注册时的基本需求,还能根据企业的发展阶段,提供增值服务。无论是企业的股权融资,还是公司并购重组,鼎盛平台都能够提供全方位的支持和资源,让企业始终走在行业的前沿。
鼎盛注册平台不仅为创业者提供基础的公司注册服务,还在各行各业中积累了大量的合作伙伴和行业资源。这些资源不仅帮助创业者解决注册初期的难题,更能为企业提供发展过程中的各种支持。
在鼎盛注册平台,您可以接触到一流的金融机构、投资人、供应商等资源,帮助您快速找到资金支持和商业合作伙伴。平台定期举办创业者交流活动,汇聚各行业的精英,拓展您的商业圈子,提升品牌影响力。通过鼎盛平台,您不仅能够得到注册支持,还能迅速融入行业生态,获取到更多发展机遇。
平台与多家知名金融机构合作,能够为企业提供融资咨询、股权投资等一系列资本支持。无论是需要天使投资,还是寻求后期融资,鼎盛平台都能为您提供强大的资金支持,为企业的快速成长铺平道路。
鼎盛注册平台自成立以来,已帮助成千上万的创业者顺利完成公司注册,并在各自的行业中取得了显著的成就。无论是初创型企业,还是已经具有一定规模的公司,都在鼎盛平台的帮助下实现了更高效、更便捷的注册流程。
平台的成功案例遍布各行各业,涵盖了科技、制造、服务、互联网等多个领域。每一个成功案例的背后,都凝聚着鼎盛注册平台专业团队的辛勤付出和智慧。无论企业规模如何,鼎盛平台都能根据不同的需求提供定制化的服务,帮助创业者在创业路上快速起步,迈向成功。
通过真实的成功案例,您可以更加直观地了解鼎盛注册平台的服务质量和效率。无论您是准备创业的新人,还是想要提升现有企业竞争力的商界精英,鼎盛注册平台都能为您提供不可或缺的支持与帮助。
对于很多创业者来说,注册公司只是第一步,接下来的经营和管理才是更具挑战的部分。鼎盛注册平台非常注重创业者的后续支持,提供完善的售后服务,确保企业在运营过程中能够顺利进行。
平台提供的售后服务包括税务申报、年度报告、财务审计等,帮助企业按照法律要求完成各项报税、报表等工作。鼎盛平台还定期为客户提供市场趋势、行业动态等信息,帮助企业调整战略、优化经营模式,提升企业的竞争力。
无论企业遇到任何问题,鼎盛注册平台的客服团队都会在第一时间提供解决方案,让您在创业过程中没有后顾之忧。
鼎盛注册平台凭借其专业的服务、高效的流程和强大的资源,已经成为广大创业者信赖的合作伙伴。无论是公司注册、法律财税支持,还是融资与商业合作,鼎盛平台都能提供全面的帮助,为企业的成功奠定坚实的基础。如果您正在寻求创业机会,或者已经在创业的道路上,鼎盛注册平台无疑是您最值得依赖的助手。选择鼎盛,开启您的成功之门,让创业变得更加简单与轻松!
】【OpenAI ChatGPT AI 服务再次“跳闸”******
IT之家 12 月 27 日消息,OpenAI 的 AI 服务器再次“跳闸”,本次系统服务中断于北京时间 12 月 27 日凌晨 2 点 30 分左右开始,影响 ChatGPT 聊天机器人、Sora 视频生成模型以及部分 API 调用。
IT之家查询 OpenAI 公司状态页面,显示北京时间今天凌晨 3 点发布动态,称 ChatGPT、API 及其文本到视频生成器 Sora“目前错误率很高”。
OpenAI 公司随后于北京时间今天早上 6 点 05 分更新状态,OpenAI 宣布“ChatGPT 已部分恢复”,但聊天历史记录仍然无法加载,修复工作仍在进行中,何时完全恢复尚无明确时间表。
至于本次服务中断原因,OpenAI 公司并未具体说明,只是称“此问题是由上游提供商引起”。而作为 OpenAI 的独家云服务提供商,微软 Azure 今天也报告数据中心出现“电源”问题,因此可以初步判断,微软数据中心电力故障或是罪魁祸首。
本次 ChatGPT 服务中断并非个例,过去几个月已发生多次类似事件。本月早些时候,OpenAI 向 ChatGPT 订阅用户发布 Sora 视频生成工具后不久,ChatGPT 和 Sora 就曾中断服务数小时。
】【快速提升战力《魔域手游2》新手必看攻略******
《魔域手游2》巅峰测试现已正式开服,第一天服务器也经历了数次爆满,玩家热情相当高涨!
开服第一天也涌进了很多新玩家,这些初入雷鸣大陆的神选者也在公屏中纷纷询问到底应该怎么提升战力,那么今天就为大家介绍一下新手如何在《魔域手游2》中快速提升战力吧!
参加开服活动 赢取大量好礼
目前《魔域手游2》刚刚开服,带来「魔域新程」超值活动!只要按照要求完成相应任务,即可获得大量奖励,帮助各位玩家顺利度过中前期。
在这个过程中,大家不用把太多精力放在提升战力和养成幻兽上,可以多看看攻略并认识大佬,慢慢了解游戏后期相关玩法。
了解游戏系统 获取更多战力
根据《魔域手游2》右边按钮,可以了解功力提升方法和资源获取途径。
修炼:
装修炼等级分为斗者,斗士,斗宗,斗君,斗王,斗帝,新神,真神八个阶段。每个阶段都有10个小阶段。每当个阶段修炼搭够时会出现突破任务,完成后就可以突破到下一阶段。
突破修炼等级可以大幅提升战力,也可以发现该阶段应该完成的任务,各位神选者一定要试试。
军团:
通过加入军团获取军团战力。等级活跃越高的军团增加的战力越多。军团职位可以获得额外的战力加成。
在「图腾登记」系统中,每个图腾可以登记三个相同的幻兽。登记的幻兽星级越高,则图腾战斗力越高。每个图腾的战斗力上限为10点。
神火:
神火是魔域二中最角色伤害占比较高的一部分,可以为角色提供额外的属性。通过攻坚神火副本获取。当神火源力达到一定评分时。可以通过使用古朴神纹来进行觉醒增加战力。
幻兽:
每个角色可以携带三种幻兽,每个幻兽提升一星增加一点战力,登上排行榜有额外的战力加成。幻兽需要通过幻化提升星级。每次幻兽都会消耗一只同类型的幻兽或一只奇异兽。
以上就是《魔域手游2》新手战力提升方法,各位还有什么更好的方法,可以在评论区留言哦~
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】v8.6.4版本
游戏流畅度优化:
为了让玩家们有更好的游戏体验,我们优化了游戏的运行流畅度,减少部分卡顿的现象
宠物世界 v36.7.943安卓版175.31M
星空体育app下载入口vivo版 v8.6.4安卓版913.53M
新世纪福音战士:破晓最新版 v3.2.47安卓版666.59M
魔王契约 v4.8.2安卓版325.73M
云见镇物语 oppo版本 v2.2.7安卓版717.67M
天行道三七互娱版 v5.4.1安卓版695.92M
用户评论
0条评论