[11章]AI+云原生应用开发 从设计到部署运维全链路实战与提效
学习地址1:https://pan.baidu.com/s/1BySWlfZQuVhqV0SrdP4xPw 提取码:ogob
学习地址2:https://pan.baidu.com/s/1nnaenTM06-t-sNRVn3VILQ 提取码:ah8f
一、AI人工智能的发展趋势
AI人工智能,作为一项前沿技术,正在以迅猛的步伐发展。从最初的机器学习到如今深度学习的广泛应用,AI已经在各个领域展现出巨大的潜力。无论是医疗、教育、金融,还是智能制造、智能交通,AI都在深刻地改变着我们的生产方式、生活方式以及思维方式。然而,要将AI的广泛应用真正落地,离不开强大的计算资源和高效的数据处理能力,这就需要更高级别的基础设施支持。
二、云原生的概念及特点
在当今数字化时代,云计算已经成为企业和个人不可或缺的计算资源。云原生作为一种基于云计算理念的软件开发和部署模式,正在逐渐改变我们的应用开发和部署方式。云原生技术不仅仅局限于容器化和微服务架构,还包括自动化管理、持续集成和持续部署等多个方面,从而实现了应用程序的高度可伸缩性、灵活性和弹性。
云原生技术的核心是容器化。容器化技术可以将应用程序及其依赖项打包成一个独立的运行环境,使得应用程序在不同环境中都能够一键部署和运行。这种方式大大简化了应用程序的开发、测试和部署过程,提高了开发效率。同时,容器化技术还可以实现资源的动态分配和优化,使得应用程序能够在云端实现高效、弹性伸缩。
微服务架构也是云原生技术的重要组成部分。通过将一个大型应用程序拆分成多个小型服务,每个服务可以独立开发、部署和升级。这种架构模式大大降低了应用程序的复杂性,提高了应用程序的灵活性和可维护性。同时,微服务架构还可以借助容器化技术实现轻松的横向扩展,满足不同业务场景下的性能需求。
三、什么是云原生 AI 套件
那云原生 AI 套件是以什么样的形态提供给客户的,适合什么样的客户场景,又具有哪些能力优势呢?
首先,我们看下云原生 AI 套件的产品形态,如何把云原生 AI 的能力提供给客户?
云原生 AI 套件通过多个可组装、可扩展、可定制的组件来提供云原生 AI 能力。以 Kubernetes 容器服务为底座,向下封装对各类异构资源的统一管理,向上提供标准 Kubernetes 集群环境和 API,运行各个核心组件。并结合容器镜像服务,以及可观测、智能诊断、弹性伸缩等容器服务相关能力,提供更加全面的产品方案。
云原生 AI 套件的核心组件能力包括四大分层模块,以满足企业客户不同角色、不同架构层级的场景需求。从下往上依次是异构算力管理、AI 任务管理、AI 数据加速、AI 工程管理。
云原生 AI 工程化的第一步,就是搭建一个 K8s 集群管理云上的异构算力,因此第一层就是异构算力管理模块,包括对异构资源的管理运维、弹性伸缩,以及调度与共享。
有了异构计算集群,算法工程师就可以开始提交 AI 作业,通过 K8s 集群的标准接口访问存储服务,以及进行 AI 作业调度和 GPU 资源分配,最后训练好的模型部署在集群中,这样基本实现了 AI 开发和生产流程。因此,往上一层是 AI 任务管理,包括对 AI 任务的提交运行、调度与弹性。
四、从云原生到AI原生
从云原生到 AI 原生,这是技术发展的必然趋势。云原生技术使得企业能够更高效地部署和管理应用程序,提高了灵活性和可扩展性。而 AI 原生则将这一趋势推向了新的高度,为企业带来了更强大的智能和自动化能力。
云原生的核心原则包括微服务、容器化、自动化和持续交付等。这些技术使得应用程序能够更快速地部署、扩展和更新,适应不断变化的业务需求。然而,随着人工智能技术的迅速发展,我们需要将这些原则应用于 AI 领域,以实现更高效的 AI 开发和部署。
大模型和AIGC正在重新定义基础设施,AI原生设计思想也正在深入各行业的应用开发过程中,形成软件开发新范式,AI原生将带来一系列的变革,包括技术栈的变化,工具链的变化,基础设施的变化,开发流程的变化,安全策略的变化,设计理念的变化以及组织架构层面的变化。
五、自动驾驶场景的AI开发
AI为实现自动驾驶的核心技术,准度和性能要求极高
在智能化、网联化、电动化、共享化的背景下,自动驾驶成为智能网联汽车行业发展的重点,也成为了下一代汽车企业转型升级的技术高地。自动驾驶对算力、实时性、安全性等系统性能的要求极高,且自动驾驶的工作环境复杂多变又涉及公共交通安全,要求计算机在极短时间做出正确的判断,因此需要以强大的算力、算法和数据传输能力作为支撑。在自动驾驶实现过程中,人工智能算法承接传感器接收的实时信息并进行数字化处理和分析,经过决策算法对周围环境进行的判断和预测,并对驾驶操作进行调整。