阿里云 Serverless 助力海牙湾构建弹性、高效、智能的 AI 数字化平台

本文涉及的产品
函数计算FC,每月15万CU 3个月
可观测可视化 Grafana 版,10个用户账号 1个月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 海牙湾(G-Town)是一家以“供应链+场景+技术+AI”为核心驱动力的科技公司,致力于为各行业提供数字化转型解决方案。通过采用阿里云Serverless架构,解决了弹性能力不足、资源浪费与运维低效的问题。SAE全托管特性降低了技术复杂度,并计划进一步探索Serverless与AI结合,推动智能数字化发展。海牙湾业务覆盖金融、美妆、能源等领域,与多家知名企业建立战略合作,持续优化用户体验和供应链决策能力,保障信息安全并创造可量化的商业价值。未来,公司将深化云原生技术应用,助力更多行业实现高效数字化转型。

1.gif

作者:赵世振十眠、修省


“通过阿里云 Serverless 架构,我们成功解决了弹性能力不足、资源浪费与运维低效的痛点。SAE 的全托管特性大幅降低技术复杂度。未来,我们将进一步探索 Serverless 与 AI 的结合,为客户提供更智能的数字化解决方案。”

——海牙湾 CTO 夏磊


客户介绍


海牙湾(G-Town)是一家以"供应链+场景+技术+AI"为核心驱动力的科技公司,自 2006 年成立以来,始终致力于为各行业客户提供数字化转型升级解决方案。公司拥有近 300 人的专业团队,深度布局金融、美妆、能源等多个战略领域,与全国 16 家股份制银行、头部时尚美妆集团及能源企业建立了长期战略合作关系。


依托"数字化客户经营"与"数字化采购"两大核心业务体系,我们已成功服务超过 16 家全国股份制银行,主导实施 496 个营销平台运营项目,覆盖积分兑换、权益平台、智能电商、企业采购、礼品定制等多元化场景。目前,公司正加速构建新一代 AI 数字化平台,通过智能算法优化和机器学习技术,持续提升用户全生命周期体验与供应链智能决策能力,实现业务场景的精准匹配与效率跃升。


海牙湾坚守用户信息安全底线,构建三重权威保障体系:通过 ISO 27001 信息安全管理体系认证规范全流程数据治理,获得国家信息安全等级保护三级认证强化系统防护能力,并严格遵循 PCI-DSS(支付卡行业数据安全标准)完成支付系统安全建设。为金融、电商等高敏感场景提供符合国际安全标准的数字化解决方案,实现支付交易数据脱敏处理、用户隐私分级保护及核心业务系统的攻击自愈能力,护航客户信息资产安全。


凭借近二十年行业深耕,海牙湾持续为合作伙伴创造可量化的商业价值,在银行数字化营销领域保持市场占有率领先地位,并不断将成功经验拓展至快消品、能源等新经济领域,推动产业数字化生态的协同发展。


业务挑战


海牙湾的平台从一开始就构建在阿里云的服务器上。随着近几年业务规模的指数级增长,原有技术架构在可扩展性和弹性方面逐渐面临系统性挑战,特别是在应对重大活动期间的突增流量时,显得尤为突出。以下是其面临的核心技术挑战:



1. 资源浪费与弹性能力不足


  • 分散部署导致资源低效利用:业务系统分散部署在不同规格配置的 ECS 服务器上,由于负载差异显著,部分服务器 CPU 利用率长期低于 20%,甚至低至个位数,造成资源闲置与成本浪费。
  • 弹性扩容能力受限:传统云主机架构难以应对业务流量的波峰波谷(高峰期仅持续 1-2 小时),导致资源无法快速自适应动态调整,既无法满足突发流量需求,又无法在低谷期节省成本。


2. 系统可观测性不足


  • 依赖基础的系统性能指标和简单的日志关键字分析,业务异常排查效率低下,难以快速定位问题根源。


3. 运维效率低下与发布复杂度高


  • 手动部署易出错应用发版需根据 ECS 服务器应用负载情况逐一分发,且发布期间,运维人员需参与控制每个节点的流量控制,无法实现业务的无损变更。
  • 脚本化部署局限性:尽管尝试通过脚本化部署提升效率,但在服务器组规模扩大后,脚本维护成本剧增,问题定位困难。


阿里云解决方案


为解决上述痛点,海牙湾技术团队经过深入调研,最终选择阿里云 Serverless 应用引擎(SAE)作为核心架构升级方案,并结合云原生 API 网关(原 MSE 网关)、MSE 微服务治理、ARMS 等产品,构建了全新的技术平台。



1. Serverless 应用引擎(SAE)


1.1 弹性扩容与资源优化


  • 水平扩容能力SAE 支持根据业务负载自动调整实例数量,并结合定时策略应对周期性波峰波谷。例如,在业务高峰期自动扩容,应对突发流量,保障高并发场景下的稳定性,低谷期缩容至 1 实例,显著降低闲置资源成本。
  • CPU Burst 能力SAE 支持在应用启动过程中,将实例规格提升至两倍,解决应用启动过程中 CPU 利用率高,日常运行状态下的 CPU 利用率相对正常的问题。
  • 闲置能力SAE 支持应用缩容到最小实例数且实例闲置时,闲置时 vCPU 成本降低 80%vCPU,有效降低运行成本。
  • Java 应用冷启动优化:针对 Java 应用冷启动耗时较长的问题,采用阿里云定制的 Dragonwell JDK,优化 JVM 性能,缩短启动时间 30% 以上。


1.2 自动化 CICD 与部署优化


  • kubectl-sae 集成:通过 kubectl-sae 工具链与现有 CICD 系统无缝对接,将 JAR 包构建、部署流程自动化。  
  • 改造原有 CICD 流程:在 CICD 服务器上安装 kubectl-sae,通过 YAML 文件定义应用规格(如 CPU、内存、镜像路径),结合 Shell 脚本完成 JAR 包构建与上传,实现一键部署。  
  • 版本回滚机制:SAE 默认为每次发布打上时间戳版本标签,支持一键回滚至历史版本,即使 JAR 包名称与路径固定,也可通过覆盖式部署更新,确保发布过程零中断。
  • 分批、金丝雀、全链路灰度:SAE 通过分批发布(逐步升级实例)、金丝雀发布(小流量验证新版本)和全链路灰度发布(跨服务版本一致性),确保新版本稳定验证后平滑上线,异常时一键回滚,显著降低故障风险。


1.3 全链路治理与稳定性保障


  • MSE 微服务治理能力:集成全链路灰度发布、无损上下线、流量防护等功能,确保发布过程无损,流量切换平滑,避免因版本更新导致服务中断。
  • 高可用架构设计SAE 天然支持多可用区部署和同可用区亲和特性,实现流量的自动切换和故障的快速恢复,确保业务的连续性。


2. 云原生 API 网关(原 MSE 网关)


  • 高性能与低延迟:支持每秒数万次的 API 请求处理,满足海牙湾积分商城、分期商城等业务场景的高并发需求。
  • 安全防护:集成 DDoS 攻击防护、限流熔断、IP 黑白名单等机制,有效抵御恶意攻击,保障系统安全。
  • 灵活路由与策略管理:支持自定义路由规则、灰度发布策略及动态配置更新,适应不同业务场景的流量管理需求。
  • API 管理:通过可视化控制台统一管理所有 API 接口,支持 API 设计、开发、测试、发布、下线等生命周期管理。


业务价值


通过采用阿里云 Serverless 架构,海牙湾在短短两个月内实现了技术架构的全面升级,业务价值显著提升:

1. 成本效益显著提升


  • 资源利用率提升:SAE 的弹性策略使资源利用率从不足 20% 提升至 50% 以上,开发测试环境一键启停,按需分配资源,成本节约超 60%。  
  • 运维成本降低:自动化部署与监控流程减少人工干预,运维团队的工作压力减轻,整体工作效率提升 40%。


2. 系统稳定性与高可用性


  • 无损发布与灰度控制:通过 MSE 治理能力,实现全链路灰度发布与无损上下线,发布过程零中断,保障业务连续性。  
  • 高并发场景应对:SAE 的弹性扩缩容能力轻松应对业务高峰,系统稳定性从 99.5% 提升至 99.99%,有效解决原有架构的瓶颈。


3. 运维效率与开发敏捷性


  • 自动化部署流程CICD 集成后,SAE 业务项目的发布耗时,从小时级缩短至分钟级,研发团队可专注于核心业务开发,迭代速度提升 3 倍。
  • 快速故障定位SAE 内置的监控解决方案的无缝集成,为海牙湾提供了快速、精准的问题定位能力Bug 处理速度提升 30%,运维响应效率显著提高。


未来展望


海牙湾的实践证明,阿里云 Serverless 架构不仅是应对业务增长的技术选择,更是企业实现降本增效、提升竞争力的关键路径。通过 Serverless 与云原生技术的深度整合,海牙湾正在为更多行业的数字化转型提供标杆范例。

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
22天前
|
人工智能 自然语言处理 运维
Bolt.diy 一键部署,“一句话”实现全栈开发
Bolt.diy 是 Bolt.new 的开源版本,提供更高灵活性与可定制性。通过自然语言交互简化开发流程,支持全栈开发及二次开发,使零基础开发者也能实现从创意到云端部署的完整链路。本方案基于阿里云函数计算 FC 搭建,集成百炼模型服务,快速完成云端部署。用户可通过对话开启首个项目,两步完成部署并获300社区积分。方案优势包括多模型适配、高度定制化、全栈开发支持及智能化辅助工具,助力高效开发与创新。
486 102
|
22天前
|
Kubernetes 数据可视化 Java
SAE 实现应用发布全过程可观测
本文聚焦阿里云Serverless应用引擎(SAE)用户在发布过程中的痛点,如“发布效率低、实例启动过程不透明”等问题。通过分步骤可视化解决方案,帮助用户明确问题、理解原因并最终解决,提升SAE平台使用体验。文章详细剖析了发布过程慢、信息透出不足及实例启动黑盒等痛点,并提出通过可观测、可解释和可优化的策略解决问题,同时展示了具体实现效果与后续优化规划。
343 68
|
2天前
|
数据可视化 API Swift
全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
59 17
|
17天前
|
传感器 机器学习/深度学习 人工智能
AI Agent 十问十答,降低认知摩擦
本文探讨了AI Agent的相关概念和技术细节,包括其定义、与传统软件的区别、构成组件、工作原理及优化方法。AI Agent是一种基于大语言模型(LLM)的智能代理,能感知环境、推理决策并执行任务。相比传统自动化软件,AI Agent具备更强的理解力和自主性,可处理复杂任务。文章分析了Chatbot向AI Agent演进的趋势及其驱动因素,并详解了提升AI Agent效果的关键要素如模型质量、工具选择和指令设计。此外,还讨论了Workflow与LLM的结合方式以及单智能体与多智能体系统的优劣,为理解和应用AI Agent提供了全面视角。
788 171
|
10天前
|
供应链 JavaScript 前端开发
Java基于SaaS模式多租户ERP系统源码
ERP,全称 Enterprise Resource Planning 即企业资源计划。是一种集成化的管理软件系统,它通过信息技术手段,将企业的各个业务流程和资源管理进行整合,以提高企业的运营效率和管理水平,它是一种先进的企业管理理念和信息化管理系统。 适用于小微企业的 SaaS模式多租户ERP管理系统, 采用最新的技术栈开发, 让企业简单上云。专注于小微企业的应用需求,如企业基本的进销存、询价,报价, 采购、销售、MRP生产制造、品质管理、仓库库存管理、财务应收付款, OA办公单据、CRM等。
89 23
|
18天前
|
存储 Kubernetes 对象存储
StrmVol 存储卷:解锁 K8s 对象存储海量小文件访问性能新高度
本文介绍了阿里云容器服务(ACK)支持的StrmVol存储卷方案,旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统(如EROFS)结合,StrmVol显著降低了小文件访问延迟,适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销,以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务,模拟分布式图像数据集加载,测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况,详细使用方法可参考官方文档。
504 144
|
10天前
|
存储 人工智能 安全
MCP 规范新版本特性全景解析与落地实践
MCP Specification 在 2025-03-26 发布了最新的版本,本文对主要的改动进行详细介绍和解释
567 141
|
22天前
|
机器学习/深度学习 数据采集 存储
动态渲染页面智能嗅探:机器学习判定AJAX加载触发条件
本文介绍了一种基于机器学习的智能嗅探系统,用于自动判定动态渲染页面中AJAX加载的最佳触发时机。系统由请求分析、机器学习判定、数据采集和文件存储四大模块构成,采用爬虫代理技术实现高效IP切换,并通过模拟真实浏览器访问抓取微博热搜及评论数据。核心代码示例展示了如何调用微博接口获取榜单与评论,并利用预训练模型预测AJAX触发条件,最终将结果以JSON或CSV格式存储。该方案提升了动态页面加载效率,为信息采集与热点传播提供了技术支持。
52 15
动态渲染页面智能嗅探:机器学习判定AJAX加载触发条件
|
8天前
|
监控 数据可视化 API
掌握Multi-Agent实践(一):使用AgentScope实践入门和Workstation上手指南
掌握Multi-Agent实践(一):使用AgentScope实践入门和Workstation上手指南
|
11天前
|
监控 容灾 大数据
智慧家庭的解决方案
本系统由后台与前台两部分组成。后台包括服务器、大数据中心、智能设备控制云等,支撑智慧家庭运作;前台涵盖用户手机、家庭局域网及各类智能嵌入式设备(如马桶、空调、音响等)。系统部署上,后台在多地设数据中心以保障数据合规与容灾备份,前台则通过阿里云智能家居系统实现联网与智能化。具体设置覆盖家门口、客厅、厨房、房间、厕所、储物室等区域,配备面部识别门锁、健康监测设备、智能家电等,支持用户按需扩展学习、娱乐、办公等多功能智能设备。
OSZAR »