为什么我在十大体育外围平台app输了很多欢乐豆?
首先,检查一下你的游戏记录,看看是否存在连续输牌的情况。如果确实总是输牌,可能是你的策略需要调整。其次,多去十大体育外围平台app的攻略区学习一些必胜技巧,比如记牌、算牌以及抢地主时机的选择,这些都能提升你的胜率。然后,控制好情绪,几局输了也不要急躁,调整心态再来一局。最后,如果运气真的不佳,输得太多,不妨暂停一下,过一段时间再玩,说不定你的运气值会提升呢
十大体育外围平台app的欢乐豆有什么用?
欢乐豆是十大体育外围平台app的通用货币,功能多样!首先,你可以用欢乐豆在商城兑换各种炫酷的游戏道具,让你的斗地主之旅更加精彩。其次,攒够一定的欢乐豆,还能兑换超值实物奖励,如手机、电脑、家电等,让你在游戏中赢得丰厚大奖。最后,欢乐豆还可用于参与十大体育外围平台app的各种赛事,赢取更多荣誉和奖励。所以,千万要珍惜每一颗欢乐豆哦!
十大体育外围平台app老是匹配不到其他玩家怎么办?
如果遇到匹配不到其他玩家的情况,首先检查你的网络连接是否稳定,信号差可能会影响匹配速度。其次,尝试退出游戏后重新登录,有时候可能是游戏出现了小问题。然后,换个时间段再进行匹配,因为不同时间段在线玩家的数量不同,避开低峰期可能更容易找到对手。最后,如果还是无法匹配,不妨试试十大体育外围平台app的其他玩法模式,也许能遇到更多志同道合的牌友!
我是新手,怎么在十大体育外围平台app里快速提高?
欢迎来到十大体育外围平台app的世界!作为新手,要快速提升,首先要多加练习,熟悉游戏的规则和玩法。其次,观察高手的出牌技巧,学习他们的策略,如记牌、算牌以及抢地主的时机选择等。然后,避免贪图一时之功,从简单模式开始,一步一步提升难度。最后,多与其他玩家交流,向他们请教心得体会,这样能帮助你少走弯路。记住,只要坚持练习,你一定能够在十大体育外围平台app的牌桌上大展身手!
十大体育外围平台app有时候会卡顿怎么办?
游戏卡顿确实会影响体验,不过别担心,这里有几个解决步骤。首先,检查你的网络连接,看看是否有延迟或信号不稳定的情况,必要时可以重启路由器。其次,查看内存是否不足,尝试关闭一些后台运行的程序。然后,清理一下十大体育外围平台app的游戏缓存,这个操作可以在设置中找到。最后,如果问题仍然存在,考虑是否需要升级设备,有时换一个更高性能的设备也能解决卡顿问题哦。
我在十大体育外围平台app里遇到了一些不友善的玩家怎么办?
在玩游戏时难免会遇到一些不友好的玩家,但不要让他们破坏你的好心情。首先,如果对方出现语言攻击或不文明行为,可以先礼貌地提醒他注意影响。其次,如果对方依然没有改正,可以直接使用十大体育外围平台app的举报功能,让系统处理。然后,你也可以选择屏蔽该玩家,这样以后就不会再匹配到他了。最后,调整心态,不要让少数不友善的人影响你的游戏体验,专注于游戏本身和其他有趣的牌友吧!
十大体育外围平台app怎样联机?
1、进入十大体育外围平台app的游戏大厅点击【好友组队】选项。
2、玩家可以选择组队2V2的房间,也可以选择组队3V3的房间。
3、选择组队2V2的房间就创建好两人房房间了,点击【邀请好友】即可,可以邀请一位好友。
4、选择组队3V3的房间就创建好三人房房间了,点击【邀请好友】即可,可以邀请两位好友。
十大体育外围平台app飞机怎么组合?
斗地主飞机组合打法共有3种介绍如下:
1、第一种打法六不带打法,例如:333444。
2、第二种六带两队打法,例如:3334448855。
3、第三种六带两张打法,例如:88877754。
十大体育外围平台app不洗牌是什么意思?
不洗牌是十大体育外围平台app的一种玩法,其规则如下:牌型规则与经典玩法相同,但发牌方式有所不同。在不洗牌模式下,玩家完成一局后,所有牌不会重新洗牌,而是按照一定顺序切牌后,依次发给下一桌玩家。该玩法的特点包括:① 手牌牌型更整齐;② 拿到炸弹的几率更高;③ 单局耗时更短,更刺激,体验更流畅!/p>
十大体育外围平台app的欢乐豆怎样送给好友?
1、点击游戏界面底部左下角的【好友】图标。
2、接着,在好友列表中找到想要赠送欢乐豆的好友,点击好友右侧的【欢乐豆】图标。
3、最后,点击弹出中的【确定】或【取消】按钮即可。
【联发科李彦辑:天玑8400搭载AI智能体化引擎,赋能应用开发******
新京报贝壳财经讯(记者韦博雅)12月23日,联发科发布天玑8400 5G全大核智能体AI芯片。联发科无线通信事业部总经理李彦辑在发布会上表示,该芯片集成联发科AI处理器NPU 880,提供高速生成式AI任务处理能力,同时,该芯片还搭载天玑AI智能体化引擎,赋能开发者打造智能体化AI应用。
联发科发布天玑8400移动芯片 图/韦博雅摄
据介绍,基于NPU 880的天玑8400支持全球主流大语言模型(LLM)、小语言模型(SLM)和多模态大模型(LMMs),可为用户提供AI翻译、改写、上下文智能回复、通话摘要、多媒体内容生成等终端侧生成式AI体验。同时,基于天玑AI智能体化引擎打造的AI应用可预测用户需求并提供个性化的智能服务。
性能方面,天玑8400采用全大核架构设计,CPU包含8个主频至高可达3.25GHz的Arm Cortex-A725大核,CPU多核性能相较上一代芯片提升41%,多核功耗相较上一代降低44%。同时,该芯片还搭载Arm Mali-G720 GPU,GPU峰值性能相较上一代芯片提升24%,功耗降低42%。
发布会上,小米REDMI品牌总经理王腾还宣布,REDMI Turbo 4手机将首发天玑8400-Ultra处理器。
校对 穆祥桐
】
【金秋小长假福利来袭!CF手游排位英雄版本发布******
9月27日,《穿越火线》手游(简称:CF手游)正式发布“排位英雄”版本。该版本为“双版本计划”的福利阶段,后续还将推出主打全新玩法的神秘版本,敬请期待。
在“排位英雄”版本中,2019-S6水星季将携全新段位、全新行星武器重磅开启;武器“主动观枪”功能、“印花”功能同步上线;跳跳乐大冒险玩法惊喜上线,随机地图搭配随机任务让新鲜感永不消退;新地图、新武器也将集体亮相。不仅如此,“瓜分1亿钻”、“7天乐”、“体验变色龙”等福利活动现已上线,玩家们快来瓜分属于你的1亿钻石和神秘武器吧。
双版本计划首次上线 “排位英雄”打响头炮
CF手游首次推出的“双版本计划”,是将两大全新版本联动发布的全新计划,旨在带给玩家源源不断的惊喜。目前发布的“排位英雄”版本是福利阶段,以丰厚的福利作为主打模式;10月18日起将推出全新神秘版本,则是主打全新玩法的惊喜阶段。届时,各种全新的玩法和模式将接连上线。
主打福利的“排位英雄”版本,从今日起就开始派奖!即日起,玩家就能参与“瓜分1亿钻石”福利活动;本服参与活动的玩家达到指定目标,还能解锁全服钻石奖励以及竞技礼包、M4牡丹等惊喜。9月30日起,玩家可以参与“赤子心计划”、“金秋妙趣翻牌”和“体验变色龙”三重活动,赢取永久81改-赤子心、M4A1-黑龙、巴雷特-极光、印花宝箱等奖励,更有机会体验首款变色英雄级武器M4A1-变色龙!
惊喜不止如此!10月1日至10月7日,玩家每天登录游戏即可100%领取2件英雄武器体验版或实用道具,包括斯泰尔-恶魔、碎屏高爆等首次放送的道具。
排位S6水星季今日开赛!专属武器+全新段位亮相
伴随着CF手游“排位英雄”版本的发布,2019-S6水星季将正式开赛!本赛季的奖励为狙击枪MR1-水星,玩家达到枪王段位即可解锁该武器。根据赛季总规则,玩家在任意五个赛季都达到“枪王”段位且领取对应行星武器后,即可解锁年度角色“太阳神-曦”。 相信本赛季之后,会有更多玩家能解锁这个重磅福利。
不仅如此,本赛季还将解锁一个介于枪王和枪神之间的圈新段位。2600分-2800分为全新段位,2800分-3000分是全新段位S,枪王晋级到全新段位是5局4胜,全新段位晋级到枪神是5局全胜。成功抵达该段位的玩家,将能获得专属挂饰、消灭图标、边框、头像框等全新福利。
跳跳乐大冒险惊喜上线!随机地图+随机任务乐趣无穷
CF手游全新推出的“跳跳乐大冒险挑战”新模式,是基于人气休闲玩法“跳跳乐”衍生而成。玩家从起点开始一直沿着箭头路标的指示奔向终点就能完成挑战。期间,玩家会经历喷泉、滚石、喷火柱、摆锤等一系列机关;完成通关的玩家将依据通关所需时间进行排名,耗时越短排名越前奖励越丰厚。值得注意的是,该模式每周将随机选择4张跳跳乐地图搭配4个挑战任务所组成。其中,任务方面包括“找到隐藏香蕉”、“规定生命数内到达终点”等四个主题,旨在每周给玩家全新的挑战乐趣。
玩家完成挑战就能获得翻牌奖励,有机会赢得会嘲讽对手的香蕉匕首、蠢萌的小金刚挂饰等各种奖励。不仅如此,玩家完成每个挑战任务所积攒“星星”将直接显示在玩家头顶上,以此向其他玩家展示自己作为跳跳乐专家的荣耀。
武器系统功能新增!主动观枪+武器印花组团亮相
CF手游“排位英雄”版本针对武器系统,推出“主动观枪”和“武器印花”两大全新功能。其中,武器主动观枪功能的“观枪”按钮支持自定义;玩家可以通过调整自定义界面中表情按钮的位置,调整观枪按钮位置(当前版本仅支持部分英雄级武器)。
至于武器印花功能,让玩家能在武器上特定的位置应用印花贴纸,将印花贴纸上的图案保留在武器上。当前开放印花功能的武器有:王者之心、AK47-无影、M4A1-雷神等13款武器,后续会陆续开放其他武器的印花功能。目前,玩家可以使用印花丨AG战队2019、印花丨3Y签名等8款全新印花。
在CF手游“排位英雄”版本中,玩家还将体验到巨人厨房(终极生化)、新潜艇(爆破模式)、不忘初心(跳跳乐)等多张新地图;以及首款变色武器MA4A-变色龙,游骑兵系列新武器AWM-游骑兵,新手感武器81式步枪、Kel-Tec KSG等众多新武器。
“排位英雄”版本已正式发布,玩家们赶紧来瓜分1亿钻石以及众多惊喜吧!
】
【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】
【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】
【青岛、安徽国资联合出手! 自动驾驶产业链公司深信科创融了A轮******
《科创板日报》12月27日讯(记者 杨小小)青岛和安徽国资联手投了一家自动驾驶产业链公司。
工商变更信息显示,安徽深信科创信息技术有限公司(以下简称“深信科创”)近日完成A轮融资,投资方为青岛西海岸人才生态产业集团有限公司,以及安徽三家国资投资平台:合肥创投、安徽创投以及合肥高投。
深信科创成立于2019年,是一家聚焦于自动驾驶仿真与合成数据的平台公司,目前产品主要包括AI驱动的仿真平台、数据平台以及低速自动驾驶平台等。截至目前,公司共计完成5轮融资,此前轮次的投资方包括朗玛峰创投、将门创投以及国汽智联等。
据深信科创官网信息,公司由图灵奖得主姚期智院士担任院长的清华交叉信息核心技术研究院孵化,由知名学者杨子江教授创办并出任CEO,原Uber高级科学家潘余曦博士出任 CTO。工商信息显示,杨子江为深信科创实控人,持有公司超过35%的股份。
在业务方面,据公司官网信息,目前,深信科创已与长安汽车、吉利汽车、陕汽集团、潍柴智能、国汽智联、同济大学、山东大学等知名企业和高校开展合作。
有关注智驾领域的一级市场投资人士对《科创板日报》记者表示,虚拟仿真测试以及相关数据对于自动驾驶实现而言相当重要,甚至可以说直接影响到高阶自动驾驶的商业化落地。作为自动驾驶实现不可或缺的重要环节,在2017年前后,这一细分领域迎来了一小波创业和融资热潮。“今年随着robotaxi等概念逐渐进入到真实交通场景,自动驾驶发展进入到一个全新的阶段,自动驾驶产业链又重新进入了资本的视野。”
《科创板日报》记者注意到,在自动驾驶仿真测试领域,国内外目前已有不少入局者。国外相关企业包括Cognata、Applied intuition等,国内方面则有51Sim、沛岱(宁波)汽车技术有限公司以及昇启水木科技(深圳)有限公司等。
值得一提的是,上述51Sim由北京五一视界数字孪生科技股份有限公司孵化,后者即是更为人熟知的51WORLD的工商主体,该公司于近日向港交所递交了招股书,拟在港股主板上市。
可以看到,上述国内主要的仿真测试企业都收获了资本的青睐。今年2月,51Sim官宣完成5000万元规模的A轮融资,投资方包括北汽产投、普耀九州、益富海股权及巨田资产等。
成立于2017年的沛岱汽车,则曾在2022年获得了来自高瓴创投以及宁波天使投资引导基金等的出手,完成了数千万元Pre-A轮融资。不过此后公司再无公开的融资动态。
昇启水木则成立于2021年,该公司今年完成了天使+轮融资,常见投资、南山创投、华山资本等出手。此前,公司还获得了来自奇绩创坛以及启迪之星等的出资。
上述投资人士表示,除了自动驾驶成熟带来的又一波产业链投资机遇外,人工智能新阶段的发展,也给这类仿真测试企业带来了更大的想象空间,这也是这类企业再度引发资本市场关注的一大原因。“并且,仿真测试还可以落地应用在其他场景,包括工业控制等。”此次两地国资对深信科创的加注亦引发了市场关注。
作为资方之一的青岛西海岸人才生态产业集团有限公司,向上股权穿透,由青岛西海岸新区国有资产管理局实际控制。据介绍,该公司是山东省院士之家试点单位和西海岸新区高校校友联盟秘书机构,由区招才中心负责业务指导。
另外三个出资方则都是来自于安徽的国资,包括合肥市天使投资基金有限公司、安徽创投以及合肥高投。
《科创板日报》记者注意到,合肥乃至整个安徽对智驾领域都倾注了很大的关注。可以看到,以擅长风投著称的合肥乃至整个安徽,在新能源汽车阶段成功押注了蔚来汽车之后,又开始向汽车的智能网联方向发力
就在近日,智能新能源重卡厂商Deepway官宣完成新一轮融资。这是合肥押宝的又一造车新势力,早在去年11月,DeepWay对外宣布与合肥达成合作,将在肥西县落地三大项目:DeepWay总部、销售结算中心、新能源重卡智能化制造基地。而在Deepway的最新一轮融资中,也有来自肥西产投、合肥产投等合肥当地国资的参与。
财联社创投通显示,以合肥产投为代表的合肥国资,今年在自动驾驶领域还投资了宏景智驾、中科星驰等多个项目。
】