一、亚马逊云服务 AI 算力升级背景
亚马逊云服务在全球云计算领域占据重要地位,连续 11 年被评为 “全球云计算领导者”,提供全球覆盖广泛、服务深入的云平台,从全球数据中心提供超过 200 项功能齐全的云服务。
随着生成式 AI 的崛起,对算力的需求呈爆发式增长。2023 亚马逊云科技中国峰会第二天精彩继续,亚马逊云科技大中华区产品总经理陈晓建在主题演讲中提出,AI 技术的爆发直接推动了对算力资源的需求。全球算力指数评估显示,随着生成式 AI 的发展,对算力的需求也持续增长。
为满足市场需求,亚马逊云服务推出了 AI 算力升级套餐。界面新闻记者报道,4 月 13 日晚,亚马逊云科技发布多款 AIGC 产品,涉及 AI 大模型服务 Amazon Bedrock、人工智能计算实例 Amazon EC2 Trn1n 和 Amazon EC2 Inf2、自研 “泰坦”(Titan) AI 大模型、软件开发工具 Amazon CodeWhisperer 等。
生成式人工智能催生算力需求,数据存储产业迎来新机遇。业内分析认为,算力已成为关键生产力,算力集运行计算力、数据存储力、网络运载力一体,成为支撑数字经济高质量发展的新动能。随着人工智能、大数据、元宇宙等技术飞速发展,算力需求不断攀升,海量数据的存储和处理需求不断增长。
生成式 AI 催化算力需求高增,重视云计算配置价值。近期,算力板块动态频出,受市场关注较高。英特尔发布酷睿 Ultra 处理器,带来更强劲的多元化 AI 算力;此外,粤港澳大湾区一体化算力服务平台发布,催化板块情绪好转。长期维度看,算力是数字经济时代的核心生产力,空间广阔;同时,算力基础设施在数字中国建设框架中上升到新的高度,产业正处于高速增长期。
全球计算力指数研究覆盖了六个大洲的 15 个国家,算力先发国家或地区的优势会随着算力投资比重的增加进一步获得强化。最新评估结果显示,十五个样本国家的计算力指数平均每提高 1 点,国家的数字经济和 GDP 将分别增长 3.6‰和 1.7‰。美国和中国依然分列前两位,同处于领跑者位置。亚马逊云服务在全球云计算排名中也占据重要地位,截止到 2022 年的数据,全球云计算排名前三的是亚马逊(Amazon Web Services,AWS)、微软(Microsoft Azure)、阿里云(Alibaba Cloud)。
亚马逊云服务的成功得益于其强大的技术实力和广泛的服务覆盖面。其核心技术包括弹性计算、对象存储、数据库服务等。例如,弹性计算服务包括云服务器 EC2,用户可以根据需要灵活选择服务器配置,实现快速扩展或缩减;对象存储服务 S3 提供了高可靠性、低成本的数据存储解决方案;多种数据库服务满足了不同用户的需求。
此外,亚马逊云科技还提供广泛、深入的机器学习服务及配套的云基础设施,正在帮助十万多位客户加速其机器学习之旅。探索适合业务需求的机器学习服务,并学习入门方法,如 Amazon SageMaker 完全托管的服务每月有 250 个小时的笔记本使用时间、每月 50 个小时的训练时间、每月 125 个小时的托管时间等。
亚马逊云科技上的计算服务也备受赞誉。数百万组织在亚马逊云科技计算平台上运行不同的工作负载。亚马逊云科技连续 11 年被公认为云基础设施和平台服务的魔力象限领导者,它正在帮助 Lyft、Netflix、Coca-Cola 和 Moderna 等组织降低基础设施成本,并加快世界上可靠、安全、功能强大的云技术的创新。
在数据库服务方面,数十万客户通过迁移到亚马逊云科技托管型数据库服务实现了节省,这些服务融合了开源数据库的灵活性和低成本以及商用数据库稳健的企业功能集。它们能够提供的性能是常用数据库的 3 – 5 倍,同时能扩展以支持每秒超过 2000 万请求和存储数 PB 的数据。
亚马逊云科技上的存储服务也为用户提供了一整套服务来存储、访问、管理和分析数据,以降低成本、提高敏捷性和加速创新。从对象存储、文件存储和数据块存储服务、备份和数据迁移选项中进行选择,以构建云 IT 环境的基础。例如,Amazon S3 对象存储服务具有 99.999999999%(11 个 9) 的持久性、5GB 标准存储等。
综上所述,亚马逊云服务在全球云计算领域的重要地位以及生成式 AI 对算力的巨大需求,促使亚马逊云服务推出 AI 算力升级套餐,以满足市场需求并继续引领云计算行业的发展。
二、亚马逊云服务 AI 算力升级套餐内容
(一)全新芯片发布
- Amazon Graviton4:性能提升显著,相比当前一代的 Graviton3 处理器,处理速度快 30%,内核增加 50% 以上,内存带宽增加 75%。这一强大的性能提升为数据库应用和大型 Java 应用带来了明显的提速效果。在当今数字化时代,高效的数据库应用和大型 Java 应用对于企业的业务运营至关重要。Amazon Graviton4 的出现,为这些关键应用提供了更强大的算力支持,助力企业提升业务效率。
- Amazon Trainium2:专为大模型训练优化而生。与第一代 Trainium 芯片相比,性能提高到 4 倍,内存容量提高到 3 倍,能效提高到 2 倍。这使得它在加速大模型训练方面表现出色。在生成式 AI 迅速发展的当下,大模型训练对算力的需求日益增长。Amazon Trainium2 能够在极短的时间内训练基础模型和大语言模型,为企业和开发者提供了高效的训练解决方案。
(二)与英伟达合作
- 成为首家在云端配备英伟达 GH200 Grace Hopper 超级芯片和 NVIDIA GB200 Grace Blackwell 超级芯片的云厂商,这一举措为客户提供了强大的 GPU 算力。通过与英伟达的深度合作,亚马逊云科技进一步巩固了其在云计算领域的领先地位,为客户提供更广泛的算力选择。
- 推出 NVIDIA DGX Cloud 在 AWS 上运行,加速训练含有超过 1 兆参数的生成式 AI 与大型语言模型。NVIDIA DGX Cloud 的推出,为企业和开发者提供了构建和部署大模型所需的专用基础设施和软件,极大地提高了生成式 AI 和大型语言模型的训练效率。
- 合作推动 Project Ceiba,构建全球最快的 GPU 驱动的 AI 超级计算机。Project Ceiba 是一台专为英伟达自身的研究和开发而设的超级计算机,独家托管在亚马逊云科技上。通过第四代 EFA 网络扩展,为每个 Superchip 提供高达 800 Gbps 的低延迟、高带宽网络吞吐量,计算性能从 65exaflops 提升至 414 exaflops,提升了六倍多。
(三)Amazon Bedrock 功能升级
- 推出专有模型导入功能,企业可接入定制模型,降低开发成本,加速生成式 AI 应用开发。借助全新的 Amazon Bedrock 专有模型导入功能,企业现在能够将自己的定制模型导入到 Amazon Bedrock 中,以完全托管的 API 形式进行访问。只需点击几下,客户即可将他们使用 Amazon SageMaker 或其他工具开发的模型集成到 Amazon Bedrock 平台上,享受无缝的可扩展性、强大的应用保护能力、遵循负责任 AI 原则等优势。
- 模型评估功能正式可用,帮助企业快速分析和比较模型,评估时间从几个星期缩短到几个小时。模型评估功能是企业快速分析和比较 Amazon Bedrock 上模型的最快方式。客户可以立即开始评估,通过选择预定义的评估标准并上传自有数据集 / 提示词库,或者从内置的、公开可用的资源中进行选择。对于主观标准或需要细致判断的内容,Amazon Bedrock 使客户能够轻松将人工审核融入工作流程中,以根据特定应用场景的指标对模型进行评估。
(四)智谱 AI 新一代基座大模型上架
智谱 GLM-4-Air 在由西云数据运营的亚马逊云科技 Marketplace(中国区)正式可用,提供独享一年的底层算力和模型推理使用权限。GLM-4-Air 是智谱最新迭代的基座模型中性价比最高的版本,适用于信息总结、摘要提取、广告文案、小说写作、代码生成等文生文场景。用户可以在亚马逊云科技上部署 GLM-4-Air 进行高效的推理运算,其在推理过程中能够支持高达 8K 的上下文长度。智谱 AI 在今年推出新一代基座大模型 GLM-4,整体性能较上一代大幅提升,比肩世界先进水平。它推理速度更快,支持更高并发,大大降低推理成本。同时,GLM-4 的智能体能力得到大幅提升,可根据用户的意图,自动理解、规划指令以完成复杂任务。GLMs 个性化智能体定制功能同时上线,用户用简单提示词指令即能创建属于自己的 GLM 智能体,实现大模型的便捷开发。
三、亚马逊云服务 AI 算力升级套餐优势
(一)更好的性价比
- 自研芯片持续提升性价比和能效,为客户提供更多选择。
亚马逊云科技通过自研芯片不断提升性价比和能效。例如,在 re:Invent 2023 全球大会上,亚马逊云科技宣布推出 Amazon Graviton4 和 Amazon Trainium2 等新一代产品。Graviton4 较上一代产品性能提升 30%,独立核心增加 50% 以上,内存带宽提升 75% 以上;Trainium2 较上一代产品训练速度提升 4 倍,能效提升 2 倍,并能在 EC2 UltraClusters 中部署多达 100,000 个芯片。每一代自研芯片都为客户提供了基于 AMD、Intel 以及 NVIDIA 等的最新芯片和实例组合之外的更多选择,使 Amazon EC2 可以为客户虚拟运行几乎所有应用和工作负载,同时提供更好的性价比。
- 与英伟达合作,引入最新 GPU,降低成本。
亚马逊云科技与英伟达合作紧密,将最新的 NVIDIA GPU 引入亚马逊云科技。继成为全球首家提供 NVIDIA GH100 Grace Hopper 数据中心 GPU 访问的云服务商之后,又成为全球首家推出 NVIDIA GH200 NVL32 实例的云服务商。双方的合作不仅为客户提供了强大的 GPU 算力,还降低了成本。例如,以 HuggingFace BERT 模型为例,基于 Trainium 的 Trn1 实例和通用的 GPU 实例对比,在训练的吞吐率上面,单节点的吞吐率可以提升 1.2 倍,而多节点集群的吞吐率可以提升 1.5 倍,从成本考虑,单节点成本可以降低 1.8 倍,集群的成本更是降低了 2.3 倍。
(二)丰富的功能选择
- Amazon Bedrock 提供多种模型选择,让用户轻松构建定制化生成式 AI 应用。
Amazon Bedrock 是一项全面托管的服务,用户可轻松访问来自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊的多种行业领先大语言模型和其他模型。此外,Amazon Bedrock 还推出了专有模型导入功能,企业可接入定制模型,降低开发成本,加速生成式 AI 应用开发。借助全新的专有模型导入功能,客户只需点击几下,即可将自己使用 Amazon SageMaker 或其他工具开发的模型集成到 Amazon Bedrock 平台上,享受无缝的可扩展性、强大的应用保护能力、遵循负责任 AI 原则等优势。同时,模型评估功能正式可用,帮助企业快速分析和比较模型,评估时间从几个星期缩短到几个小时。客户可以立即开始评估,通过选择预定义的评估标准并上传自有数据集 / 提示词库,或者从内置的、公开可用的资源中进行选择。对于主观标准或需要细致判断的内容,Amazon Bedrock 使客户能够轻松将人工审核融入工作流程中,以根据特定应用场景的指标对模型进行评估。
- 全栈数据服务 Serverless 化,简化算力使用。
亚马逊云科技持续引领云计算发展,提供了全栈式的 Serverless 服务,广泛覆盖计算、存储、网络、容器、数据库、应用集成等多个方面。现阶段,亚马逊云科技为客户提供超过 25 种 Serverless 服务以及综合不同的排列组合,发挥 1+1>2 的效果,帮助客户快速构建现代化应用。例如,互联网电影数据库(IMDb)进行 Serverless 架构重构后,将单体应用拆分成不同的微服务,每个 Serverless 微服务对应着各自的业务单元。高峰时期,IMDb 能向 Amazon Lambda 发出每分钟 800,000 个请求,亚马逊云科技 Serverless 架构能提供及时响应,并且用户只需要为调用付费,从而节省大量成本。
(三)强大的安全保障
- Amazon Nitro 系统与英伟达芯片结合,阻止未授权个体访问模型权重,加密数据传输。
Amazon Nitro 系统和 NVIDIA GB200 的结合将能够阻止未授权个体访问模型权重。GB200 支持对 GPU 之间 NVLink 连接进行物理加密,以及对 Grace CPU 到 Blackwell GPU 的数据传输进行加密,同时亚马逊云科技 EFA (Elastic Fabric Adapter) 也能够对服务器之间的分布式训练和推理过程的数据进行加密。GB200 还将受益于 Amazon Nitro 系统,该系统将主机 CPU/GPU 的 I/O 功能卸载至专门的硬件上,以提供更加一致的性能,其增强的安全性可以在客户端和云端全程保护客户的代码和数据在处理过程中的安全。
- 创建可信执行环境,保护客户实例中的数据安全。
通过 Amazon Nitro Enclaves 和 Amazon KMS,亚马逊云科技为客户在 Amazon EC2 上使用 GB200 创建了可信执行环境。从 GB200 实例内部可以加载安全区(Enclave),并且可以直接与 GB200 超级芯片通信,保护客户实例中的数据安全。
四、亚马逊云服务 AI 算力升级套餐的应用场景
(一)企业级生成式 AI 落地
- 助力企业训练自己的生成式 AI 大模型,提高训练效率。
亚马逊云服务的 AI 算力升级套餐为企业训练生成式 AI 大模型提供了强大的支持。其中,Amazon Trainium2 芯片专为大模型训练优化而生,性能比第一代 Trainium 芯片提高到 4 倍,内存容量提高到 3 倍,能效提高到 2 倍。这使得企业能够在更短的时间内训练出基础模型和大语言模型,大大提高了训练效率。此外,亚马逊云服务还与英伟达合作,推出 NVIDIA DGX Cloud 在 AWS 上运行,加速训练含有超过 1 兆参数的生成式 AI 与大型语言模型,为企业提供了构建和部署大模型所需的专用基础设施和软件。
- 为企业提供更有性价比的算力,降低成本。
亚马逊云服务通过自研芯片和与英伟达合作,不断提升性价比和能效,为企业提供更有性价比的算力。例如,Amazon Graviton4 和 Amazon Trainium2 等新一代自研芯片,性能提升显著,同时成本降低。与英伟达的合作引入了最新的 GPU,如成为首家在云端配备英伟达 GH200 Grace Hopper 超级芯片和 NVIDIA GB200 Grace Blackwell 超级芯片的云厂商,降低了企业的成本。以 HuggingFace BERT 模型为例,基于 Trainium 的 Trn1 实例和通用的 GPU 实例对比,在训练的吞吐率和成本方面都有显著优势。
(二)个性化患者体验
利用 Amazon SageMaker 和生成式 AI 实现大规模个性化患者体验,推动个性化医疗保健服务。
在医疗保健领域,亚马逊云科技通过 Amazon SageMaker 和生成式 AI 为患者提供个性化的医疗保健服务。Salesforce Data Cloud 和 Amazon SageMaker 的结合,使得医疗保健机构能够构建统一的患者视图,有效实施人工智能策略,优化患者体验。例如,通过自动化 “患者提醒” 活动,Ascension Health 使年度体检率提高了 26%,新增主治医生预约量增加了 27%,筛查和疫苗覆盖率提高了 20%。
SageMaker Canvas 是一款无代码产品,让业务团队能够构建、定制和部署机器学习和生成式 AI 模型。它提供了多种预构建模型,用于预测、图像分析、文本分析和生成式 AI 等场景。用户还可以构建自定义模型,并与机器学习专家协作、共享模型、获取反馈,最终将模型投入生产。Canvas 还提供了 Amazon Bedrock 服务,这是一种简单、安全且负责任的方式,用于在亚马逊云科技上构建生成式 AI 应用程序。
在预测糖尿病患者的再入院风险案例中,分析师可以通过 Salesforce Data Cloud 获取到统一、协调和丰富的 360 度客户数据,在 SageMaker Canvas 中直接连接到 Salesforce Data Cloud,无需进行 ETL 即可访问最新、最准确的数据。准备好数据后,分析师可以启动模型构建器,根据具体问题类型选择合适的模型。模型训练完成后,分析师可以将其注册到 Salesforce Data Cloud 中,基于模型预测的患者倾向性创建细分市场,并将这些患者激活到 Salesforce Marketing Cloud 或其他电子邮件发送引擎,注入健康行动故事,为患者提供个性化的健康建议。
此外,GE 医疗与亚马逊云科技达成战略合作,携手打造针对医疗领域定制的基础模型和生成式人工智能应用,旨在帮助临床医生提高医疗诊断和患者护理水平。GE 医疗计划借助 Amazon Bedrock 创建并部署定制化的生成式 AI 应用,进一步扩大生成式 AI 为客户带来的优势。同时,GE 医疗计划利用 Amazon SageMaker 开发的基础模型来升级其应用套件,加速基于网络的医疗影像应用的开发和部署,并通过整合这些基础模型来提升效率、互操作性和改善用户体验。
五、总结
亚马逊云服务推出的 AI 算力升级套餐,通过全新芯片发布、与英伟达合作、Amazon Bedrock 功能升级以及智谱 AI 新一代基座大模型上架等举措,为用户提供了更好的性价比、丰富的功能选择和强大的安全保障。在生成式 AI 时代,亚马逊云服务将继续引领云计算领域的发展,为企业和个人用户带来更多创新的解决方案。
在性价比方面,亚马逊云服务通过自研芯片和与英伟达合作,不断提升产品的性价比和能效。例如,Amazon Graviton4 和 Amazon Trainium2 等新一代自研芯片,性能提升显著,同时成本降低。与英伟达的合作引入了最新的 GPU,如成为首家在云端配备英伟达 GH200 Grace Hopper 超级芯片和 NVIDIA GB200 Grace Blackwell 超级芯片的云厂商,降低了企业的成本。以 HuggingFace BERT 模型为例,基于 Trainium 的 Trn1 实例和通用的 GPU 实例对比,在训练的吞吐率和成本方面都有显著优势。
在功能选择方面,Amazon Bedrock 提供了多种模型选择,让用户轻松构建定制化生成式 AI 应用。同时,全栈数据服务 Serverless 化,简化了算力使用。例如,互联网电影数据库(IMDb)进行 Serverless 架构重构后,将单体应用拆分成不同的微服务,每个 Serverless 微服务对应着各自的业务单元。高峰时期,IMDb 能向 Amazon Lambda 发出每分钟 800,000 个请求,亚马逊云科技 Serverless 架构能提供及时响应,并且用户只需要为调用付费,从而节省大量成本。
在安全保障方面,Amazon Nitro 系统与英伟达芯片结合,阻止未授权个体访问模型权重,加密数据传输。同时,创建可信执行环境,保护客户实例中的数据安全。例如,通过 Amazon Nitro Enclaves 和 Amazon KMS,亚马逊云科技为客户在 Amazon EC2 上使用 GB200 创建了可信执行环境。从 GB200 实例内部可以加载安全区(Enclave),并且可以直接与 GB200 超级芯片通信,保护客户实例中的数据安全。
免费小程序《字形绘梦》上线啦!
欢迎大家体验!
RA/SD 衍生者AI训练营。发布者:風之旋律,转载请注明出处:https://www.shxcj.com/archives/7306