OpenStack Placement服务：资源调度与Kubernetes部署实战-代码聚汇网

OpenStack Placement服务：资源调度与Kubernetes部署实战

周传炽

1. Placement 资源调度服务深度解析

在 OpenStack 云平台中，资源调度是核心功能之一。Placement 服务作为 OpenStack 的资源调度中枢，负责管理整个云平台的物理资源与虚拟资源之间的映射关系。它就像一位精明的仓库管理员，不仅清楚知道每个货架上有什么商品（计算节点资源），还能根据客户需求（虚拟机创建请求）快速找到最合适的货架进行配货。

1.1 Placement 的核心职责

Placement 服务主要承担三大关键职能：

资源提供者跟踪：记录所有计算节点、存储节点等物理设备的资源情况。每个计算节点在 Placement 中都被视为一个资源提供者（Resource Provider），拥有唯一的 UUID 标识。
资源清单管理：维护每个资源提供者的详细库存，包括：
- 计算资源（VCPU 数量）
- 内存资源（以 MB 为单位）
- 存储资源（以 GB 为单位）
- 加速器资源（如 GPU）
资源分配建议：当 Nova 需要创建虚拟机时，Placement 会根据请求的规格（flavor）提供最优的资源分配方案，确保资源利用最大化。

提示：从 Queens 版本开始，Placement 从 Nova 中独立出来成为单独服务，这种架构解耦使得资源调度更加灵活高效。

1.2 为什么需要 Placement 服务？

在早期的 OpenStack 版本中，资源调度功能直接集成在 Nova 服务中。这种设计存在几个明显问题：

扩展性差：随着云平台规模扩大，集中式调度成为性能瓶颈
功能局限：难以支持新型硬件资源（如 GPU、FPGA）
调度策略单一：无法实现复杂的资源预留和共享机制

Placement 服务的独立部署解决了这些问题，它采用微服务架构，通过 REST API 提供资源调度服务，使得：

资源管理更加精细化
调度策略可以灵活扩展
支持多种资源类型混合调度

2. Kubernetes 环境下的 Placement 部署实战

2.1 部署前置条件检查

在 Kubernetes 上部署 Placement 前，需要确认以下基础服务已就绪：

MySQL 数据库服务：用于存储 Placement 的元数据
Keystone 身份服务：提供认证和授权
Helm 工具：版本建议 v3.8+
OpenStack-Helm 仓库：已添加到本地 Helm 仓库列表

可以通过以下命令检查基础服务状态：

bash复制# 检查 MySQL 状态
kubectl get pods -n openstack -l application=mysql

# 检查 Keystone 状态
kubectl get pods -n openstack -l application=keystone

# 检查 Helm 版本
helm version --short

2.2 配置文件详解

Placement 的 Helm 配置文件（placement.yaml）包含多个关键部分：

2.2.1 镜像配置

yaml复制images:
  tags:
    placement: <your-registry>/placement:2024.1-ubuntu_jammy
    dep_check: <your-registry>/kubernetes-entrypoint:latest-ubuntu_focal

placement：指定 Placement 服务容器镜像
dep_check：初始化检查依赖的辅助镜像

注意：生产环境建议使用私有镜像仓库，并将标签固定为具体版本号，避免使用 latest 标签。

2.2.2 Pod 资源配置

yaml复制pod:
  replicas:
    api: 2
  resources:
    requests:
      memory: "128Mi"
      cpu: "100m"
    limits:
      memory: "512Mi"
      cpu: "1000m"

replicas.api：设置 API 服务副本数为 2，确保高可用
resources：定义容器的资源请求和限制
- 初始请求：100m CPU + 128Mi 内存
- 上限限制：1000m CPU + 512Mi 内存

经验值：对于中型规模 OpenStack 集群（50-100 计算节点），建议将内存限制提高到 1Gi。

2.2.3 服务配置

yaml复制conf:
  placement:
    DEFAULT:
      debug: false
    placement_database:
      connection_recycle_time: 600

debug：生产环境应设为 false
connection_recycle_time：数据库连接回收时间（秒）

2.2.4 认证配置

yaml复制endpoints:
  identity:
    auth:
      placement:
        username: placement
        password: <your-placement-password>
  oslo_db:
    auth:
      placement:
        username: placement
        password: <your-placement-db-password>

identity：Keystone 认证信息
oslo_db：数据库连接信息

安全提示：密码应使用加密存储，可通过 Helm secrets 或外部 secret 管理工具管理。

2.2.5 节点调度配置

yaml复制labels:
  api:
    node_selector_key: openstack-control-plane
    node_selector_value: enabled

此配置确保 Placement Pod 会被调度到带有 openstack-control-plane=enabled 标签的节点上。

2.3 执行部署命令

使用 Helm 进行部署或升级：

bash复制helm upgrade --install placement openstack-helm/placement \
  --namespace openstack \
  -f placement.yaml \
  --timeout 600s

关键参数说明：

--install：如果不存在则安装
--namespace：指定部署的命名空间
-f：指定配置文件
--timeout：设置超时时间为 10 分钟

部署过程会依次执行：

检查依赖服务
创建 ConfigMap 和 Secret
部署 Placement API 服务
初始化数据库

2.4 部署验证

2.4.1 检查 Pod 状态

bash复制kubectl get pods -n openstack -l application=placement

正常状态应显示为 Running，例如：

code复制NAME                          READY   STATUS    RESTARTS   AGE
placement-api-7f8c6d8c-abcde   1/1     Running   0          2m
placement-api-7f8c6d8c-fghij   1/1     Running   0          2m

2.4.2 测试 API 功能

bash复制kubectl exec -n openstack deploy/keystone-api -- \
  openstack resource provider list

预期输出应包含已注册的资源提供者列表（初始部署可能为空）。

3. Placement 资源管理实战

3.1 资源提供者管理

3.1.1 查看资源提供者列表

bash复制openstack resource provider list

输出示例：

code复制+--------------------------------------+----------------+------------+
| UUID                                 | Name           | Generation |
+--------------------------------------+----------------+------------+
| 7a0c5d1e-3b3a-4a9f-b6d1-2f5e6c8d9a0e | compute-node1  | 1          |
| 8b1d6e2f-4c4b-5b0g-c7e2-3g6f7h8i9j0k | compute-node2  | 1          |
+--------------------------------------+----------------+------------+

3.1.2 查看特定资源提供者详情

bash复制openstack resource provider show <provider-uuid>

输出包含资源提供者的详细属性和资源信息。

3.2 资源清单管理

3.2.1 查看资源清单

bash复制openstack resource provider inventory list <provider-uuid>

典型输出：

code复制+----------------+-----------+----------+----------+--------+-----------+--------+
| resource_class | allocation | reserved | min_unit | max_unit | step_size |  total |
+----------------+-----------+----------+----------+--------+-----------+--------+
| VCPU           | 0         | 0        | 1        | 64     | 1         | 64     |
| MEMORY_MB      | 0         | 512      | 1        | 262144 | 1         | 262144 |
| DISK_GB        | 0         | 20       | 1        | 2048   | 1         | 2048   |
+----------------+-----------+----------+----------+--------+-----------+--------+

各字段含义：

allocation：已分配量
reserved：预留量（通常为系统预留）
min_unit/max_unit：最小/最大分配单位
step_size：分配增量步长
total：资源总量

3.2.2 资源类别详解

Placement 支持的主要资源类别：

资源类别	说明	单位	典型配置值
VCPU	虚拟 CPU 核心数	个	根据物理 CPU 设置
MEMORY_MB	内存容量	MB	物理内存 × 1024
DISK_GB	磁盘容量	GB	根据存储配置设置
VGPU	虚拟 GPU 设备	个	根据 GPU 卡数量
PCI_DEVICE	PCI 设备（如网卡）	个	根据硬件配置

3.3 高级资源管理技巧

3.3.1 资源预留配置

在生产环境中，通常需要为宿主机预留部分资源：

bash复制openstack resource provider inventory set \
  --resource VCPU=64 \
  --resource MEMORY_MB=262144 \
  --resource DISK_GB=2048 \
  --reserved 512 \
  <provider-uuid>

此命令设置：

总 VCPU：64 核
总内存：256GB（262144MB）
总磁盘：2TB（2048GB）
预留内存：512MB

3.3.2 资源超分配置

OpenStack 支持通过设置 allocation_ratio 实现资源超分：

bash复制openstack resource provider inventory set \
  --allocation_ratio VCPU=16.0 \
  --allocation_ratio MEMORY_MB=1.5 \
  <provider-uuid>

这表示：

CPU 超分比为 16:1
内存超分比为 1.5:1

注意：超分设置需要根据实际负载情况调整，过高的超分比可能导致性能下降。

4. 常见问题排查与优化

4.1 资源提供者未注册

现象：执行 openstack resource provider list 返回空列表

可能原因：

Nova Compute 服务未正确启动
Nova 与 Placement 通信故障
计算节点未正确上报资源

排查步骤：

检查 Nova Compute Pod 状态：

bash复制kubectl get pods -n openstack -l application=nova,component=compute

查看 Nova Compute 日志：

bash复制kubectl logs -n openstack <nova-compute-pod-name>

检查 Placement API 可达性：

bash复制kubectl exec -it <nova-compute-pod-name> -n openstack -- \
  curl -v http://placement-api.openstack.svc:8778

解决方案：

重启 Nova Compute 服务：

bash复制kubectl delete pod -n openstack -l application=nova,component=compute

检查 Nova 配置中的 Placement 连接信息：

bash复制kubectl exec -n openstack <nova-api-pod-name> -- \
  grep placement /etc/nova/nova.conf

4.2 资源分配失败

现象：创建实例时提示 "No valid host was found"

排查步骤：

检查资源提供者的库存状态：

bash复制openstack resource provider inventory list <provider-uuid>

检查资源使用情况：

bash复制openstack resource provider usage show <provider-uuid>

检查调度过滤器设置：

bash复制kubectl exec -n openstack <nova-scheduler-pod-name> -- \
  grep scheduler_default_filters /etc/nova/nova.conf

常见解决方案：

调整资源超分比：

bash复制openstack resource provider inventory set \
  --allocation_ratio VCPU=8.0 \
  <provider-uuid>

增加资源预留：

bash复制openstack resource provider inventory set \
  --reserved 1024 \
  <provider-uuid>

4.3 性能优化建议

数据库优化：
- 为 Placement 数据库单独配置高性能存储
- 调整 MySQL 的 innodb_buffer_pool_size 参数
- 定期执行 openstack-placement-manage db purge 清理旧数据
API 性能优化：
- 增加 Placement API 副本数（建议 3-5 个）
- 配置 API 服务的 worker 数量：
```
yaml复制conf:
  placement:
    wsgi:
      api_workers: 4
```

缓存配置：

启用 oslo_cache 减少数据库查询：

yaml复制conf:
  placement:
    cache:
      enabled: true
      backend: dogpile.cache.memcached
      memcache_servers: memcached.openstack.svc:11211
    ```

5. 生产环境最佳实践

5.1 高可用部署方案

多副本部署：
```
yaml复制pod:
  replicas:
    api: 3
```

跨可用区部署：

yaml复制labels:
  api:
    pod_anti_affinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        - labelSelector:
            matchExpressions:
              - key: application
                operator: In
                values: [placement]
          topologyKey: kubernetes.io/hostname

数据库集群：
- 使用 Galera Cluster 或 MySQL InnoDB Cluster
- 配置读写分离

5.2 监控与告警配置

关键监控指标：
- API 响应时间（P99 < 500ms）
- 数据库查询延迟
- 资源分配成功率
- 调度请求队列长度

Prometheus 监控示例：

yaml复制conf:
  placement:
    DEFAULT:
      metrics_enabled: true
      metrics_port: 9000

告警规则示例：

yaml复制- alert: PlacementAPIHighLatency
  expr: histogram_quantile(0.99, sum(rate(placement_api_request_duration_seconds_bucket[1m])) by (le)) > 1
  for: 5m
  labels:
    severity: warning
  annotations:
    summary: "Placement API high latency detected"

5.3 灾备与恢复策略

定期备份：

bash复制kubectl exec -n openstack <placement-db-pod-name> -- \
  mysqldump -u placement -p<password> placement > placement_backup.sql

恢复流程：
- 停止 Placement 服务
- 还原数据库
- 验证数据一致性
- 逐步恢复服务
故障转移测试：
- 定期模拟节点故障
- 验证自动恢复能力
- 记录恢复时间指标（RTO）

6. 与 Kubernetes 的深度集成

6.1 使用 Kubernetes 作为资源提供者

通过定制开发，可以让 Placement 识别 Kubernetes 节点作为资源提供者：

开发资源上报控制器：
- 监听 Kubernetes 节点资源变化
- 通过 Placement API 实时更新资源清单

示例资源上报逻辑：

python复制def update_k8s_node_resources(node):
    rp_uuid = get_node_uuid(node)
    inventories = {
        'VCPU': node.status.capacity['cpu'],
        'MEMORY_MB': convert_to_mb(node.status.capacity['memory']),
        'DISK_GB': get_available_disk(node)
    }
    placement_client.set_inventory(rp_uuid, inventories)

6.2 基于 Placement 的 Kubernetes 调度器

可以扩展 Kubernetes 调度器，使其参考 Placement 的资源分配建议：

开发调度器扩展：

go复制func Filter(ctx context.Context, pod *v1.Pod, nodeInfo *framework.NodeInfo) *framework.Status {
    resources := get_requested_resources(pod)
    if !placement_client.check_resources(node.Name, resources) {
        return framework.NewStatus(framework.Unschedulable, "Insufficient resources in Placement")
    }
    return nil
}

调度流程整合：
- 先通过 Placement 筛选合适节点
- 再执行 Kubernetes 默认调度逻辑
- 最终绑定到最优节点

6.3 混合云资源管理

Placement 可以统一管理跨 Kubernetes 和传统虚拟化的资源：

架构设计：
- Kubernetes 集群作为资源提供者类型 A
- OpenStack 计算节点作为资源提供者类型 B
- 通过 Placement API 统一查询和分配

资源分配策略：

yaml复制policies:
  - name: hybrid-scheduling
    rules:
      - resource_class: VGPU
        providers: [type-a]
      - resource_class: VCPU
        providers: [type-a, type-b]
        allocation_ratio: 
          type-a: 4.0
          type-b: 2.0

7. 版本升级与迁移策略

7.1 版本升级注意事项

数据库迁移：
- 使用 placement-manage db migrate 命令
- 先备份再升级
- 测试环境验证迁移脚本
API 兼容性：
- 检查新版 API 的变化
- 评估对现有客户端的影响
- 必要时提供适配层

滚动升级步骤：

bash复制# 1. 更新 Helm 仓库
helm repo update

# 2. 下载新版 chart
helm pull openstack-helm/placement --version <new-version>

# 3. 执行升级
helm upgrade placement ./placement-<new-version>.tgz \
  -f placement.yaml \
  --namespace openstack

7.2 从传统部署迁移到 Kubernetes

数据迁移流程：
- 导出传统部署的数据库
- 转换数据格式（如有必要）
- 导入到 Kubernetes 环境的数据库
服务切换策略：
- 并行运行新旧系统
- 逐步将流量切换到新系统
- 验证无误后下线旧系统
迁移验证清单：
- 资源提供者列表一致
- 资源库存数据准确
- API 响应符合预期
- 调度结果正确

8. 安全加固指南

8.1 认证与授权配置

Keystone 集成：

yaml复制conf:
  placement:
    keystone_auth[token](https://taotoken.net?utm_source=general):
      auth_type: password
      auth_url: http://keystone-api.openstack.svc:5000/v3
      username: placement
      password: <secure-password>
      project_name: service
      user_domain_name: Default
      project_domain_name: Default

TLS 加密：
- 为 API 启用 HTTPS
- 使用 Kubernetes Ingress 或 Service Mesh 管理证书

8.2 网络安全策略

NetworkPolicy 配置：

yaml复制network_policy:
  ingress:
    - from:
        - podSelector:
            matchLabels:
              application: nova
      ports:
        - port: 8778
          protocol: TCP

服务网格集成：
- 通过 Istio 实现 mTLS
- 配置细粒度的访问控制

8.3 审计与合规

启用审计日志：

yaml复制conf:
  placement:
    DEFAULT:
      log_file: /var/log/placement/placement-api.log
      debug: false
      log_level: INFO
    audit:
      enabled: true
      middleware: true

关键审计事件：
- 资源分配请求
- 库存变更操作
- 身份验证事件

9. 性能调优实战案例

9.1 大规模集群优化案例

场景：500+ 计算节点的 OpenStack 集群，Placement API 响应变慢

优化措施：

数据库优化：
- 将 MySQL 迁移到高性能 SSD 存储
- 调整 InnoDB 缓冲池大小（从 1GB 增加到 8GB）
- 添加合适的索引：
```
sql复制CREATE INDEX idx_resource_provider_uuid ON allocations (resource_provider_id);
```

API 层优化：

增加 API 副本数到 5 个

配置 oslo_cache 使用 Redis：

yaml复制conf:
  placement:
    cache:
      enabled: true
      backend: dogpile.cache.redis
      redis_url: redis://redis.openstack.svc:6379/0

查询优化：
- 调整 Nova 的调度查询频率
- 批量处理资源分配请求

效果：

API P99 延迟从 1200ms 降至 300ms
资源分配成功率从 95% 提升到 99.9%

9.2 混合负载场景优化

场景：同时运行虚拟机容器的工作负载，资源调度冲突