您目前处于:
2023年,生成式AI技术破茧成蝶,生成式AI能够自动生成数据或内容的人工智能,与仅仅基于输入数据进行分类或预测的判别式AI不同,生成式AI可以创造新的、未曾见过的输出。这类AI通常基于生成式模型,可以在多种任务中生成各种类型的数据,如文本、图像、音乐或视频等。
文本生成,像OpenAI的GPT–3就是一个能够生成连贯、有意义文本的模型。
图像生成,有些生成式模型可以创造全新的、逼真的图像,或是基于给定的草图生成完成的艺术作品。
音乐和声音生成:生成式AI也可以用于生成新的音乐作品或声音效果。
数据增强:在机器学习训练中,有时可用的数据量是有限的。生成式AI可以用来增加训练数据,从而改善模型的性能。
风格迁移:例如,可以将某种艺术风格应用于图像或视频,或将文本转化为特定的写作风格。
但同时,生成式AI又是一把双刃剑,它既可以帮助企业解决实际问题,又面临着数据泄露等巨大风险。今年年初,某大型全球化企业就在大模型训练过程中,泄露了企业数据库中的机密信息,给企业带来了巨大的负面影响。而此类事件依然层出不穷。生成式AI在训练与使用过程中,有诸多环节都将面临数据泄露风险,应该以何种方式保障安全呢?
8月31日,亚马逊云科技re:Inforce 2023中国站正式开启,此次大会以“AI时代 全面智能的安全”为主题,目标就是帮助企业解决生成式AI在全部流程环节中的安全挑战。
亚马逊云科技大中华区解决方案架构总监代闻表示:安全是构建生成式AI应用不可回避的重要议题。从全栈角度出发,应该从数据、传输、应用到基础设施整体构建出可靠的合规体系,这样才能真正保障AI应用的安全。
代闻
亚马逊云科技一直严格遵从客户拥有和控制数据的理念,提供了行业领先的技术和物理措施来防止未经授权的访问,为数据提供涵盖存储、传输、使用、治理等各个环节的加密及保护服务。
举例而言,企业在训练AI模型过程中首先要访问数据库,现代企业的业务数据是创新的基础,也是“命脉”,一旦数据泄露就将带来不可逆的恶劣影响。同时,在数据传输、使用、治理、访问等各个环节,也会面临泄露风险。
针对生成式AI,亚马逊云科技将安全防护划分为三个阶段,分别为:数据和模型安全、应用安全和全球合规,并基于此提供了更为系统化的安全防护工具。
在数据保护方面,亚马逊云科技重点推荐的第一项服务就是Amazon KMS。其全称为Amazon Key Management Service,是一项通过硬件安全模块来保护用户密钥的云端安全服务。借助Amazon KMS,用户可以创建和管理加密密钥,并控制相关权限。这些密钥可用于跨各种亚马逊云科技服务和用户应用程序访问加密数据。
同样地,数据传输也是安全防护的重要阶段,此环节可通过Amazon Nitro来构建独立的安全传输通道。Amazon Nitro是一种虚拟化基础设施,Amazon Nitro安全芯片可用于加密和验证虚拟机的访问,并可检测未经授权的硬件修改和恶意软件的植入。依托于虚拟化技术,Amazon Nitro系统还能够提供更好的网络和存储性能。
有了安全的存储和传输,针对计算环节亚马逊云科技则有Amazon Nitro Enclaves计算加密。它可将计算实例进行隔离,并控制应用互访vCPU和内存,可帮助用户减少用于处理最敏感数据的应用程序的攻击面,从而保护计算安全。
涂鸦信息技术有限公司安全总监刘龙威表示:涂鸦智能是一家全球化的物联网解决方案商,以亚马逊云科技Amazon Nitro为安全的云基础,通过硬件隔离的方式保障了整个用户数据体系的可信。与Amazon KMS联动实现了更高基本的安全管理,从而服务于78万的开发者及海量的IoT设备,并使其牢不可破。
在re:Inforce 2023大会上,亚马逊云科技与涂鸦智能成立“联合安全实验室”,双方将在智能家居、数据安全、安全文化建设、海外合规等领域,重点就机密计算及数据隐私、Matter技术合作及体系建设、生成式AI在IoT领域等安全实践展开联合共创。
此外,亚马逊云科技中国方案开发中心还正式发布了敏感数据保护解决方案,可实现自动发现企业敏感数据,并在统一平台管理数据资产。例如在Amazon S3存储中,允许用户创建数据目录、使用内置或定制数据识别规则定义敏感数据类型,以机器学习方式来匹配并识别敏感信息,并做出警告。以可视化方式进行管理,进而帮助用户实现对敏感数据的管理与保护。目前该解决方案已经可以提供下载。
数据在存储、传输及计算环节的安全得到了保障,接下来需要关注的自然就是模型的构建环节了。
代闻表示:Amazon IAM API每秒调用次数超过10亿,其为大模型的构建提供了强大的源动力。Amazon SageMaker正在为设置、授权、验证、调优等环节提供针对模型的访问策略,并通过Amazon Model Cards、Amazon Model Monitor及Amazon Model Registry等工具全方位地监控模型的运行。
在AI大模型的初始爆发期,很多企业的模型训练环节都处于“裸奔”状态,即原始数据与模型未加防护,此时的数据泄露风险也是最高。
针对这些痛点,模型三剑客之一的Amazon SageMaker Model Cards问世了,它是一套文档化机器学习模型的规范格式工具,可实现对模型信息的统一管理,包括模型的描述、功能、性能等信息。通过使用Amazon Model Cards,用户可以更好地了解和评估机器学习模型,以选择最适合其需求的模型,并为下一步监测与管理做好准备。
Amazon SageMaker Model Monitor提供的就是自动化监控与检测服务,可以帮助用户在生产环境中监控模型的性能、数据质量和数据偏差,以确保模型的准确性和稳定性。
功能方面Amazon Model Monitor提供了数据捕获、数据分析、数据报告和数据警报,可生成详细的报告和警报通知用户,有利于促进模型的持续改进和优化。
Amazon Model Registry则是Amazon SageMaker提供的一个功能强大的工具,用于管理和跟踪机器学习模型的版本和元数据。它提供了版本控制、回滚、元数据管理和集成功能,使用户能够更好地管理和部署模型。
在Amazon SageMaker这三套工具的帮助下,能够让用户实现模型管理自动化,极大提升了工作效率。
大模型之潮已经势不可挡,如果企业级用户自身技术能力较弱,是否可以尝试构建大模型呢?
就在今年4月,亚马逊云科技发布了完全托管的基础模型服务Amazon Bedrock,可让用户根据需求通过API访问及使用其中的基础模型。Amazon Bedrock可使用用户自己的数据私下自定义FM,并使用相关工具和功能将它们无缝集成和部署到应用程序中,无需管理任何基础设施。
举例而言,用户希望在零基础的情况下构建一套文本生成大模型,那么就可以通过简单的操作在亚马逊云端自定义出模型需求,并通过各种模型工具将其集成并部署到应用之中,就像拼装乐高一样简单,极大降低了模型构建的门槛。
度过了激动人心的模型构建环节,接下来是开发。很多企业级用户对开发戏称是:人多手杂,容易出错,同时还经常出现安全性问题。
针对这些痛点,亚马逊云科技展示了两套自动化工具服务,能够帮助用户排忧解难。
Amazon CodeWhisperer 可以看作是AI编程助手,经过数十亿行代码的训练,可以根据用户需求和现有代码实时生成从代码片段到全函数的代码建议。Amazon CodeWhisperer支持主流编程语言和IDE,还可以为用户提供有关 API 安全性、性能和最佳实践的建议。
融合机器学习和自动化分析就有了Amazon CodeGuru Security,它是一套强大的代码漏洞扫描工具,可提供漏洞修补建议,并解决检测配置错误、权限问题和敏感数据的泄露等安全问题。有效提升代码的安全性和可靠性。
当生成式AI大模型经历开发后就迎来上线运行,而在该阶段的安全防护也不能掉以轻心。因为在实际操作过程中,有很多安全事件都出在运行环节。此时,应用程序需要保护模型本身、数据及用户隐私等来自多方面的安全,而最有效的方式就是:验证。
Amazon Verified Permissions是亚马逊云科技向开发者提供的一种验证用户访问权限的机制。通过该服务,开发者可以确保用户只能访问其应用程序需要的有效权限,以保护用户的隐私和数据安全。
当用户向应用程序授权时,亚马逊会验证并返回一个访问令牌,该令牌包含用户已授权的权限。开发者可以使用这个令牌来验证用户的权限,并根据需要执行相应的操作。
通过令牌式验证,开发者可以确保用户数据的安全性,并且遵守隐私法规和规定。同时也通过访问权限控制来保障应用程序的数据安全。
在全球安全合规方面,亚马逊云科技的全球化基础设施包括超过200大类广泛而深入的云服务和解决方案,包括覆盖全球的安全合规、高速稳定的云基础设施,以及来自亚马逊的全球资源和创新文化。
据了解,亚马逊云科技现已在全球获得超过140个安全标准和合规认证。并进一步通过在其500多项自身合规审计控制项中使用 AI 技术,大幅提升了自身的合规效率,将审计时间节约了53%。
此外,亚马逊云科技还通过零信任架构,来帮助用户增强安全性、灵活性、扩展性并有效降低来自安全方面的成本,帮助企业构建更安全、高效和可靠的云安全体系。
生成式AI为我们带来更多的创作、个性化服务、与用户的交互以及创新和研究的可能性。也为人类创造力和智慧的拓展提供了新的工具和平台。
在短短几个月的时间里,生成式AI在中国市场就掀起了一场全行业的“百模大战”,并将AI创新推向了一个新的高峰。诸多企业开始了探索与尝试,同时也迎来了更为复杂的安全性挑战。为了帮助企业迎接这日益复杂的安全挑战,亚马逊云科技通过技术积累、创新能力和对AI的深入理解,推出了多项面向生成式AI全流程的安全服务,着力帮助企业解决实际问题。
生产式AI的安全性式是一个多面且持续的挑战,确保这类AI工具不被用于或恶意目的、同时确保它们的输出可靠并不造成意外伤害至关重要的。
提高生成式AI的安全性是一项重要的任务,可以采取多种方法来降低潜在的风险。例如:改进训练数据的质量、监督和审核机制、对输出限制、反馈循环方面、以及道德框架和指导原则、法律和法规等等。
总之,提高生成式AI的安全性需要综合考虑技术、法律、伦理和社会因素。这是一个不断发展的领域,需要持续得努力来减少风险并确保AI系统对社会的积极影响。
安全之事无小事,关乎企业发展之命脉。此次大会亚马逊云科技携同合作伙伴一起,以客户为中心,通过安全服务深入到应用AI的每一个环节,共同构建起面向AI的未来安全。