重庆人工智能领域,出现了新的世界纪录。近日,我市人工智能领域的头部企业——重庆中科云从科技有限公司(云从科技)的视觉大模型取得重要进展,其行人基础大模型在PA-100K、RAP V2、PETA、HICO-DET四个数据集上刷新世界纪录。
(资料图片)
8月16日,记者从云从科技了解到,一口气刷新四项世界纪录的背后,有位“秘密功臣”——云从科技开发的从容大模型。
计算机视觉和人工智能相关领域“领跑”
曾连续三年三次打破世界纪录
新纪录是如何诞生的?
云从科技研究院算法工程师焦宾介绍,这是行人基础大模型在公开测试集上“跑”出成绩后,和全球范围内已知最佳成绩对比的结果。今后,这一成绩还可能继续被刷新。
▲云从科技在PA-100K、RAP V2、PETA行人属性数据集上的表现。受访者供图
这不是云从科技第一次打破世界纪录。自2015年成立以来,其一直在计算机视觉和人工智能相关领域“领跑”。2018年至2020年,云从科技跨镜追踪技术就曾连续三年三次打破世界纪录。
而行人基础大模型的“特长”更为丰富,它可以精确高效地识别与人相关的特征,如面部特征、衣服颜色、眼镜和手表等配饰;同时还能精准识别人与物体的交互,如抽烟、使用智能手机等行为。
这就意味着,行人基础大模型既可以辨认“人”,也可以辨认“人在干什么”,从而具备了大规模商用的可能性。
大模型的“聪明”程度比起以往模型
就像大学生“PK”小学生
为啥大模型的识别能够精准高效?
焦宾解释,这得益于云从科技研发的云从从容大模型的支撑。
“大模型的‘大’,体现在参数量大、数据量大、算力资源量大三个方面。”焦宾说,通俗地说,这使得大模型的“聪明”程度比起以往的模型,就像大学生“PK”小学生。
首先,十亿级的参数量,意味着大模型能够容纳的场景极为丰富。它像一个巨大的“底座”,可以容纳和匹配各类生产生活场景,根据用户需求“微调”小部分参数即可。
例如,在安全领域中,大模型既能识别在禁烟区抽烟的行为,也能“抓住”驾驶时接打手机的不规范操作。
而过去,不同的场景需要单独开发不同的模型,不仅造成了数据壁垒,也使得研发和使用成本更高。
其次,百亿级的数据量,意味着大模型的“知识”更“丰富”。在海量数据的训练下,大模型拥有出色的视觉识别能力。记者在云从科技看到,只需给出一张图片,大模型便能在秒级范围内识别出图中的人、物体和行为,并给出文字反馈。
再次,算力资源大,意味着大模型的“反应”更快。今年5月落地两江新区的云从科技西部智算中心拥有最高可达5000P的算力,能支撑复杂、大规模的计算。这也标志着云从从容大模型生产线正式投产。
多项技术进入“实战”
已用于矿山、建筑工地以及特殊场所的安全布控
焦宾表示,行人基础大模型的优秀表现,意味着该技术已经进入大规模商用阶段。
记者了解到,基于云从从容大模型平台的多项技术已经进入了“实战”。目前广泛应用于矿山、建筑工地以及特殊场所的安全布控。
云从科技也在涉猎更多领域。今年7月,云从科技、佳都科技、重庆交通开投集团就深入开展城市交通技术研发及应用落地达成战略合作,并正式发布知行城市交通行业大模型。
接下来,三方将共同围绕重庆轨道交通在建和拟建项目需求以及相关城市交通痛点,开展城市交通行业大模型Trans-GPT研究、综合监控智慧节能等方面的创新研究和应用落地,提升重庆智慧交通水平,打造全球智慧交通高地。
8月4日,云从科技还参加了第十四届海峡两岸(厦门)文化产业博览交易会,基于云从从容大模型带来多项核心AIGC产品及行业案例亮相,积极赋能文化产业发展。
标签: