阿里大模型元老杨红霞:以为可低成本发展AI是错误想法
创始人
2025-02-06 16:03:47
0

香港中通社2月6日电  题:阿里大模型元老杨红霞:以为可低成本发展AI是错误想法

香港中通社记者 梁嘉轩

近日,来自浙江的DeepSeek R1模型横空出世,R1模型无疑为行业的下一前沿带来引导和启发。香港社会各界都在讨论AI。为何香港坐拥5间全球百强大学,却未有如ChatGPT、DeepSeek般“家喻户晓”的AI产品?

现任职于香港理工大学电子计算学系的杨红霞教授,曾组建阿里巴巴、字节大模型团队。她接受中通社记者专访认为,香港若要做出DeepSeek、OpenAI般的AI产品,需要特区政府、研究拨款机构及业界投入更多资源,并加强合作推动基础建设级的平台,以多个小模型搭建大模型。

为追上世界AI的步伐,不重蹈芯片行业的覆辙,香港特区政府及科创业界近年大力发展AI,并在数码港建立“超算中心”等AI基建项目,特区政府更拨款30亿港元,推行为期三年的人工智能资助计划。杨红霞告诉记者,这远远不够,光“超算中心”的算力就已经难以应付开发大模型的需求。

DeepSeek被广泛讨论的其中一大原因,是它的训练成本只有550万美金,但杨红霞告诉记者,大模型的训练包括数据的预处理和对齐阶段,其中预处理的成本远高于对齐阶段,她认为该550万美金主要指对齐阶段的训练成本,R1的基础模型是基于DeepSeek-V3 6710亿项参数的混合专家模型(MoE),整体训练至少需要数千张显卡。

杨红霞指出,DeepSeek创始人梁文峰以量化金融交易出身,其团队本身已有较成熟的资金和基础建设,更是中国第一家拥有万卡集群算力的企业。“因此,看见DeepSeek的成功而认为AI的发展可以通过低成本实现,是错误的想法。”预处理阶段需要给模型灌入大量数据,此阶段已经耗用大量算力,这部分的成本难以节约。

杨红霞承认,在寸土寸金的香港,要建立具万卡集群算力的超算中心有一定难度,但她认为香港有潜力以“模型之上的模型”框架(MoM)发展AI,即科创企业专注其熟悉的领域发展小模型,并通过基建级别的模型串连在一起,这样能更大程度地发挥出数码港、科技园及香港各院校内的算力资源,做出来自香港的大模型。 

杨红霞指出,这样的好处是成本远低于传统大模型的建立。对比大模型对显卡的需求动辄上万张,通过MoM框架创建一个1000亿项参数的基础模型仅需512至1024张显卡。建立小模型所涉及的数据预处理也远少于大模型,更适合香港分布较散和不同型号的算力资源。

此外,更多的企业可参与到AI的发展中,她举例从事医疗的科研人员处理数据的方式会与计算机专业的有所区别,而目前的大模型非常依赖互联网上的数据,因此正如医疗般需要专业处理方式、依赖互联网上所缺乏之数据,若从事这些专业的人员可以参与到AI的小模型建设中,再通过香港基建级的AI平台将其打通,香港有能力打造出具有影响力的大模型。

目前,香港并不缺乏人工智能相关的人才,缺乏的是资金及与资金高度相关的算力。因此,杨红霞建议特区政府应加强对高等院校在AI上的投资,“你不去投这个东西,它就转不起来”。(完)

相关内容

热门资讯

IDA携东亚银行探索香港稳定币... 香港新闻网12月11日电 香港金融科技公司 IDA 宣布与东亚银行有限公司展开合作,以支持香港的数字...
香港雇员2024年工资中位数达... 香港中通社3月24日电(记者 谭畅)香港特区政府统计处24日公布数字,去年5月至6月香港雇员的每月工...
【来论】刘喆:希望之路,还是漫... 中缅铁路,这条计划连接昆明与缅甸皎漂深水港的交通走廊,是未来中国通向印度洋的关键战略通道,也是中缅经...
施政报告2024 | 香港劏房... 香港新闻网10月16日电 行政长官李家超今日(16日)表示,特区政府决定以立法方式制订住宅楼宇分间单...
华为ICT大赛2024-202... 香港新闻网12月9日电 “华为ICT大赛 2024-2025 香港站颁奖典礼”(以下简称“华为ICT...
教大学者喜讯频传 多领域研究获... 香港新闻网12月3日电 香港教育大学(教大)最近喜讯频传,多位研究学者在心理学、理财教育、英语学...
最高271.28%!美国拟对东... 香港新闻网12月1日电 美国商务部当地时间11月29日公布其对东南亚四国柬埔寨、马来西亚、泰国和越南...
香港丁屋申请人遭廉署起诉承认串... 香港新闻网11月8日电 香港廉政公署早前落案起诉小型屋宇(丁屋)发展商负责人、村代表及丁屋申请人共1...
叶刘淑仪出席政青培训课 分享香... 香港新闻网6月5日电 香港政协青年联会(下称“政青”)于6月3日举行六月核心成员培训课程,本次培训特...
香港研发总开支持续上升 去年... 香港中通社12月23日电 香港特区政府统计处23日发表《2023年香港创新活动统计》报告,香港本地研...