如何在托管式计算环境中将现有 Amazon FSx for Lustre 文件系统挂载到 AWS Batch?
上次更新时间:2022 年 2 月 23 日
我想在托管式计算环境中将现有 Amazon FSx for Lustre 文件系统挂载到 AWS Batch。是否可在不创建自定义 Amazon Machine Image (AMI) 的情况下进行该项设置?
简短描述
将 Amazon Elastic Compute Cloud (Amazon EC2) 启动模板与 AWS Batch 配合使用。此配置允许您将现有 Amazon FSx for Lustre 文件系统挂载到容器中,而无需创建自定义 AMI。
重要提示:在创建文件系统时,请使用分配给计算环境的相同 Amazon Virtual Private Cloud (Amazon VPC) 和子网。
解决方法
1. 创建 Amazon FSx for Lustre 文件系统。然后,选择持久性或临时性文件系统部署类型。
提示:对于长期存储和工作负载,请使用持久性文件系统。对于临时存储和短期数据处理,请使用暂存文件系统。
2. 复制文件系统 ID(例如 fs-12345678)。您需要文件系统 ID 以运行启动模板。
3. 创建启动模板,该模板包括用户数据部分,并使用 MIME 分段文件格式。有关更多信息,请参阅 Cloud-init 网站上的 Mime 分段归档。
Amazon Linux 2 MIME 分段文件示例
重要提示:将 fs-12345678 替换为文件系统 ID。将 us-east-1 替换为 AWS 区域。将 xxxxxxxx 替换为八个字符的 Amazon FSx 挂载名称。
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="==MYBOUNDARY=="
--==MYBOUNDARY==
Content-Type: text/cloud-config; charset="us-ascii"
runcmd:
- file_system_id_01=fs-09c9ae4593b53a741
- region=us-east-1
- fsx_directory=/scratch
- fsx_mount_name=xxxxxxxx
- amazon-linux-extras install -y lustre2.10
- mkdir -p ${fsx_directory}
- mount -t lustre -o noatime,flock ${file_system_id_01}.fsx.${region}.amazonaws.com@tcp:/${fsx_mount_name} ${fsx_directory}
--==MYBOUNDARY==--
注意:此 MIME 分段文件示例将计算资源配置为安装 Extras 库中的 Lustre 2.10 软件包。该文件还会在 /scratch 挂载现有的 Amazon FSx for Lustre 文件系统。有关其他 Linux 发行版的安装说明,请参阅安装 Lustre 客户端。
4. 启动模板以调用用户数据。
5. 创建一个名为 mount-fsx-lustre.json 的文件。
注意:根据使用案例调整卷大小。
Amazon Linux 2 启动模板示例
{
"LaunchTemplateName": "user-data",
"LaunchTemplateData": {
"BlockDeviceMappings": [
{
"Ebs": {
"DeleteOnTermination": true,
"VolumeSize": 30,
"VolumeType": "gp2"
},
"DeviceName": "/dev/xvda"
}
],
"UserData": "TUlNRS1WZXJzaW9uOiAxLjAKQ29udGVudC1UeXBlOiBtdWx0aXBhcnQvbWl4ZWQ7IGJvdW5kYXJ5PSI9PU1ZQk9VTkRBUlk9PSIKCi0tPT1NWUJPVU5EQVJZPT0KQ29udGVudC1UeXBlOiB0ZXh0L2Nsb3VkLWNvbmZpZzsgY2hhcnNldD0idXMtYXNjaWkiCgpwYWNrYWdlczoKLSBhbWF6b24tZWZzLXV0aWxzCgpydW5jbWQ6Ci0gZmlsZV9zeXN0ZW1faWRfMDE9ZnMtODc0MTc4MDYgICAgIAotIGVmc19kaXJlY3Rvcnk9L21udC9lZnMKCi0gbWtkaXIgLXAgJHtlZnNfZGlyZWN0b3J5fQotIGVjaG8gIiR7ZmlsZV9zeXN0ZW1faWRfMDF9Oi8gJHtlZnNfZGlyZWN0b3J5fSBlZnMgdGxzLF9uZXRkZXYiID4+IC9ldGMvZnN0YWIKLSBtb3VudCAtYSAtdCBlZnMgZGVmYXVsdHMKCi0tPT1NWUJPVU5EQVJZPT0tLQ=="
}
}
Amazon Linux 1 启动模板示例
{
"LaunchTemplateName": "userdata",
"LaunchTemplateData": {
"BlockDeviceMappings": [
{
"Ebs": {
"DeleteOnTermination": true,
"VolumeSize": 8,
"VolumeType": "gp2"
},
"DeviceName": "/dev/xvda"
},
{
"Ebs": {
"DeleteOnTermination": true,
"VolumeSize": 22,
"VolumeType": "gp2"
},
"DeviceName": "/dev/xvdcz"
}
],
"UserData": "TUlNRS1WZXJzaW9uOiAxLjAKQ29udGVudC1UeXBlOiBtdWx0aXBhcnQvbWl4ZWQ7IGJvdW5kYXJ5PSI9PU1ZQk9VTkRBUlk9PSIKCi0tPT1NWUJPVU5EQVJZPT0KQ29udGVudC1UeXBlOiB0ZXh0L2Nsb3VkLWNvbmZpZzsgY2hhcnNldD0idXMtYXNjaWkiCgpwYWNrYWdlczoKLSBhbWF6b24tZWZzLXV0aWxzCgpydW5jbWQ6Ci0gZmlsZV9zeXN0ZW1faWRfMDE9ZnMtODc0MTc4MDYgICAgIAotIGVmc19kaXJlY3Rvcnk9L21udC9lZnMKCi0gbWtkaXIgLXAgJHtlZnNfZGlyZWN0b3J5fQotIGVjaG8gIiR7ZmlsZV9zeXN0ZW1faWRfMDF9Oi8gJHtlZnNfZGlyZWN0b3J5fSBlZnMgdGxzLF9uZXRkZXYiID4+IC9ldGMvZnN0YWIKLSBtb3VudCAtYSAtdCBlZnMgZGVmYXVsdHMKCi0tPT1NWUJPVU5EQVJZPT0tLQ=="
}
}
注意:如果要将用户数据添加到 Amazon EC2 控制台中的启动模板,请确保执行以下操作之一:以纯文本格式粘贴用户数据,或从文件上传用户数据。
如果使用 AWS Command Line Interface (AWS CLI) 或 AWS SDK,则必须先对用户数据进行 base64 编码。然后在调用 CreateLaunchTemplate 时将该字符串作为 UserData 参数的值提交。
6. 运行以下 AWS CLI 命令,以基于您在步骤 5 中创建的 mount-fsx-lustre.json 文件创建启动模板:
重要提示:将 us-east-1 替换为 AWS 区域。
aws ec2 --region us-east-1 create-launch-template --cli-input-json file://mount-fsx-lustre.json
create-launch-template 命令输出示例
{
"LaunchTemplate": {
"LaunchTemplateId": "lt-08cb09d54bcf551f3",
"LaunchTemplateName": "fsx-test",
"CreateTime": "2020-06-30T17:13:22.000Z",
"CreatedBy": "arn:aws:iam::12345678999:user/test",
"DefaultVersionNumber": 1,
"LatestVersionNumber": 1
}
}
7. 创建新的计算环境并将该环境与您的启动模板相关联。
重要提示:默认情况下,AWS Batch 托管计算环境使用适合于计算资源的经批准 Amazon Elastic Container Service (Amazon ECS) 优化 AMI 版本。您必须明确设置经 Amazon ECS 优化的 Amazon Linux 2 AMI 和其他 Linux 发行版的 AMI ID。
当 AWS Batch 启动实例时,Amazon FSx for Lustre 文件系统现在将挂载到容器实例上。
8. 使用 SSH 连接到由 AWS Batch 启动的实例,以检查文件系统是否随容器实例一起挂载。然后,运行以下 Linux df 命令:
$ df -h
df 命令输出示例
Filesystem Size Used Avail Used% Mounted on
devtmpfs 3.9G 0 3.9G 0% /dev
tmpfs 3.9G 0 3.9G 0% /dev/shm
tmpfs 3.9G 448K 3.9G 1% /run
tmpfs 3.9G 0 3.9G 0% /sys/fs/cgroup
/dev/xvda1 30G 4.2G 25G 15% /
172.31.79.79@tcp:/xxxxxxxx 1.1T 4.5M 1.1T 1% /scratch
tmpfs 798M 0 798M 0% /run/user/1000
{
"jobDefinitionName": "Fsx-sample",
"jobDefinitionArn": "arn:aws:batch:us-east-1:12345678999:job-definition/userdata:1",
"revision": 1,
"status": "ACTIVE",
"type": "container",
"parameters": {},
"containerProperties": {
"image": "busybox",
"vcpus": 1,
"memory": 1024,
"command": [],
"volumes": [
{
"host": {
"sourcePath": "/scratch"
},
"name": "Scratch"
}
],
"environment": [],
"mountPoints": [
{
"containerPath": "/scratch",
"sourceVolume": "Scratch"
}
],
"ulimits": [],
"resourceRequirements": []
}
}
10. 使用您在步骤 9 中创建的任务定义提交 AWS Batch 任务。