Kubeflow v1.6 支持 Kubernetes v1.22 并推出 Kubeflow Pipeline v2 功能的 Alpha 版本
Kubeflow 社区很高兴宣布 Kubeflow v1.6 软件版本现已可用,该版本支持 Kubernetes v1.22 并引入了 Kubeflow Pipeline v2 (KFP v2) 功能的 Alpha 版本。
Kubeflow v1.6 还为 Katib 中的基于群体的算法添加了新的超参数支持,并在 Kubeflow 的分布式训练操作器中提供了 PyTorch、MXNet、MPI、XGBoost 的组合 Python SDK。对于模型服务,v1.6 新增了 ClusterServingRuntime 和 ServingRuntime CRD,并在 InferenceService Predictor Spec 中引入了新的 Model Spec,这在 KServe 0.8 中提供了一种指定模型的新方式。此外,v1.6 清理了中央仪表盘中的一些 CVE,并使 PodDefaults webhook 能够获取新的证书更新。对于 Kubernetes 升级,社区开发并测试了每个 Kubeflow 组件清单与 Kubernetes v1.22 的兼容性。由于 v1.22 引入了一些突破性更改,此次升级是一项团队协作的努力,并且这种 Kubeflow 发布管理过程将有助于社区未来更新 Kubernetes 和其他软件依赖。该软件可在此处获取:here。
在开发这些新软件功能的同时,Kubeflow 社区还完成了年度用户调查。此次调查为 Kubeflow 的需求提供了许多有益的用户见解,您可以在调查结果中了解更多信息。在众多亮点中,我们想重点指出下图所示的对模型监控日益增长的需求。

我们认为对监控的日益关注表明 Kubeflow 用户群正在走向成熟。社区正在努力解释 Kubeflow 的现有功能,并构建符合用户新的模型监控需求的功能。此外,用户调查结果和 Kubeflow 工作组路线图将在即将举行的 Kubeflow 峰会上进行讨论。您可以在此处了解更多关于 Kubeflow 峰会的信息:here。
回到本次软件发布,以下将更详细地介绍 v1.6 的亮点。
Kubeflow v1.6 详细信息
从新功能引入的角度来看,Kubeflow v1.6 包括 KFP v2 新前端、后端和 SDK 的实验版本,它们提供现代化的 UI 和 DAG、对元数据的一流支持以及简化的组件创作体验。此幻灯片演示文稿KFP v2 简介提供了 v2 的良好概述。
KFP v2 Alpha 版本引入了
您可以在这些文档中了解更多关于 KFP v2 及相关突破性更改的信息
对于那些仍然依赖 KFP v1 功能的用户,Kubeflow v1.6 及其 KFP v2 组件与旧版 Kubeflow Pipelines v1.8 SDK 中的成熟功能完全经过测试和支持。这提供了与当今成千上万的 KFP v1 用户在生产中利用的相同功能。
除了 KFP v2 alpha 版本外,Kubeflow 1.6 还包括对 Katib 用户的功能增强和操作改进。这些包括支持:
- 基于群体的训练算法
- 增强的配置验证检查,这将节省调试参数配置错误的时间
- 安全修复
- MetricsUnavailable Status 支持,这将使调试更容易
在 Kubeflow v1.6 中,训练操作器工作组添加了这些有价值的增强功能:
- PyTorch、MXNet、MPI、XGBoost 的 Python SDK
- 也为 PyTorch、MXNet、MPI、XGBoost 生成了 Clientset (Golang)
- 支持 MPI 的 gang scheduling
Kubeflow v1.6 对 Kubeflow 笔记本、中央仪表盘、web 应用和控制器有一些功能和操作上的改进。以下列出了被认为是中型或更大的已关闭 PR。您可以在此处查看已关闭 PR 的完整列表:here。
- 支持 K8s 1.22
- PodDefaults webhook 获取新证书
- 在中央仪表盘、Jupyter、Tensorboard、Volumes Mgr 中显示所有命名空间中的对象
- 更新了镜像的托管容器注册表,注意 - 这对于使用自定义清单的用户可能是突破性更改
- 中央仪表盘的 CVE 修复
清单工作组在 1.6 版本中贡献了多项增强功能。这些增强功能包括测试每个 Kubeflow 组件清单的:
对于模型服务,Kubeflow v1.6 集成了 KServe v0.8.0 版本,其中包括这些增强功能:
- ClusterServingRuntime 和 ServingRuntime CRD
- 在 InferenceService Predictor Spec 中引入新的 Model Spec,作为指定模型的新方式
- 支持 Knative 1.0+
- transformer 到 predictor 网络通信的 gRPC 支持
- ModelMesh 备用后端的跨命名空间支持
KServe 的 Python SDK 存在以下突破性更改:
- KFModel 重命名为 Model
- KFServer 重命名为 ModelServer
- KFModelRepository 重命名为 ModelRepository
要了解更多信息,请参阅KServe v0.8 发行说明和发行博客文章。
加入社区
我们要感谢所有为 Kubeflow 1.6 做出贡献的人,特别是 Anna Jung 作为 v1.6 发布经理所做的工作。Kubeflow 社区非常高兴亚马逊网络服务通过提供AWS 推广积分来扩展他们的支持。我们希望这项赞助能够使许多 Kubeflow 工作组可持续地在 AWS 上托管他们的测试和 CI/CD 基础设施,这对于保持社区的高开发速度至关重要。正如您所见,Kubeflow 社区充满活力且多元化,正在为全球的组织解决实际问题。
想帮忙吗?Kubeflow 社区工作组定期召开公开会议,并一直在寻找更多的志愿者和用户来释放机器学习的潜力。如果您有兴趣成为 Kubeflow 贡献者,请随时查看以下资源。我们期待与您合作!
- 访问我们的Kubeflow 网站或Kubeflow GitHub 页面
- 加入Kubeflow Slack 频道
- 加入kubeflow-discuss 邮件列表
- 参加每周社区会议