香港新闻网1月27日电 截至今天(27日)早上,国产AI Deepseek在中国和美国区苹果App Store免费榜上一路从第六位飙升至第一位。超越ChatGPT及Meta公司旗下的社交媒体平台Threads,Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。DeepSeek现象引发美国各大媒体争相报道。
DeepSeek引人关注的另一个原因是, DeepSeek是 “仅用不到600万美元训练预算”出的大模型,成本之低仅是Meta部门里一个高管的薪资。
这款发布不到一个月的大模型到底是什么?
据网站公开资料显示,中国 AI 大模型创业公司DeepSeek(深度求索)发布的 DeepSeek-R1大模型,称在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
事件的起因是美股投资网出现的一则消息,一位Meta的工程师在美国科技公司员工社区Blind中这样写道,“Meta的生成式AI部门正处于恐慌中。
“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”‘
纽约时报中文网报道,据美国人工智能公司一直使用的行业基准测试,DeepSeek聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约600万美元的原始计算能力就训练了新模型,不到科技巨头Meta训练其最新人工智能模型所耗资金的十分之一。
一直以来都被认为要高投入才能完成的高端技术目前却被这家企业突破,这消息比产品本身更引发震撼。
“有600万美元资金的公司在数量上远远多于有1亿美元或10亿美元资金的公司,”风险投资公司Page One Ventures的投资人克里斯·尼科尔森说道,他主要投资人工智能技术。
DeepSeek引发美国各大媒体争相报道。
自从OpenAI 2022年,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入的话,没有公司能与行业领军者竞争。
世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达1.6万个芯片,甚至更多。但DeepSeek的工程师却说,他们只用了约2000个英伟达生产的专用芯片。
德国世界报知名市场评论员Holger Zschaepitz表示:“中国的DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的模型,并且无需使用尖端芯片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。”
对中国AI产业来说,DeepSeek的出圈有更强的标杆意义。美国为了围堵中国AI产业发展,对先进算力芯片出口进行了严格限制。面临如此不利的环境,中国的创业者和创新者仍通过各种可能的方式,不断提升自身能力,缩小了中国AI产业与美国之间的差距,DeepSeek是最新的一例。(完)