金融界2025年4月29日消息,国家知识产权局信息显示,广州汇通国信科技有限公司申请一项名为“一种基于云原生的AI模型服务弹性伸缩系统及方法”的专利,公开号CN119883510A,申请日期为2024年12月。
专利摘要显示,本发明公开了一种基于云原生的AI模型服务弹性伸缩系统及方法,包括模型特征分析模块和弹性策略执行模块。其中,模型特征分析模块通过计算资源监控器采集GPU运行数据,利用批处理效率分析器构建双阈值约束机制,并由效率曲线分析系统生成GPU稳定性曲线和内存效率曲线;弹性策略执行模块将目标批处理参数转化为执行计划并通过Kubernetes扩展机制实现原子性调整。本发明创新性地提出双层分析机制,将GPU稳定性和内存效率作为独立维度进行分析,有效解决了传统方案中仅关注单一指标导致的服务震荡问题。通过渐进式调整策略和完善的状态跟踪机制,实现了AI模型服务的精准扩缩容,显著提高了资源利用效率,同时保障了服务质量的稳定性。
天眼查资料显示,广州汇通国信科技有限公司,成立于2011年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,广州汇通国信科技有限公司共对外投资了5家企业,参与招投标项目513次,财产线索方面有商标信息8条,专利信息88条,此外企业还拥有行政许可27个。


