AWS Glue Sparkジョブのバージョン管理について

このブログシリーズ 「クラウドセキュリティ 実践集」 では、一般的なセキュリティ課題を取り上げ、「なぜ危険なのか?」 というリスクの解説から、 「どうやって直すのか?」 という具体的な修復手順(コンソール、AWS CLI、Terraformなど)まで、分かりやすく解説します。
この記事では、AWS Glue Spark ジョブは、サポートされているバージョンで実行する必要がありますについて、リスクと対策を解説します。

ポリシーの説明
AWS Glue Sparkジョブがサポート終了(End of Support: EOS)またはライフサイクル終了(End of Life: EOL)となったバージョンで実行されている場合、重大なセキュリティリスクと運用上の問題が発生します。サポートされているバージョンでGlueジョブを実行することで、最新のセキュリティパッチ、パフォーマンス最適化、新機能へのアクセスが確保され、AWS SLAの保証を受けることができます。2025年現在、AWS Glue 5.0がApache Spark 3.5.4を含む最新バージョンとして提供されています。
リスク
古いバージョンのAWS Glue Sparkジョブを使用し続けることには、以下のリスクがあります:
- セキュリティ脆弱性の放置: EOSバージョンにはセキュリティパッチが提供されないため、新たに発見された脆弱性が修正されず、データ漏洩やサイバー攻撃のリスクが高まります。例えば、Log4j脆弱性(CVE-2021-44228)のような重大な脆弱性が発見された場合、古いバージョンでは修正パッチが提供されません。
- 技術サポートの喪失: EOSバージョンで実行されるジョブは技術サポートの対象外となり、障害発生時に迅速な問題解決が困難になります。AWSサポートへの問い合わせも対応してもらえなくなります。
- SLA保証の無効化: サポート終了バージョンではAWSのSLA(サービスレベル契約)が適用されず、通常99.9%の可用性保証を受けられません。
- 機能とパフォーマンスの損失: Glue 5.0ではGlue 3.0と比較して最大32%の高速化と22%のコスト削減が実現されており、古いバージョンの使用は経済的損失につながります。特に大規模なデータ処理ではコスト差が顕著に現れます。
- 互換性の問題: 新しいライブラリやフレームワークは古いGlueバージョンではサポートされない場合があり、開発の柔軟性が失われます
修復方法
コンソールでの修復手順
既存のGlue Sparkジョブを最新のサポートバージョンに更新する手順を説明します。
重要な前提条件:
- AWS Glue 0.9/1.0から4.0以降への直接移行はできません(暗号化SDKの互換性のため)
- まずAWS Glue 2.0/3.0に移行してから、最新バージョンへ段階的に移行する必要があります
ジョブバージョンの更新手順:
- AWS管理コンソールにログインし、AWS Glueコンソール(https://console.aws.amazon.com/glue/)にアクセス
- ナビゲーションペインで「ETLジョブ」→「ジョブ」を選択

- 更新対象のジョブを選択し、「アクション」→「ジョブの編集」をクリック
- 「ジョブの詳細」タブで以下を設定:
- Glueバージョン:「Glue 5.0 – Spark 3.5, Python 3」を選択(最新推奨)
- 言語:Python 3またはScalaを選択
- ワーカータイプとワーカー数を確認

- 依存関係の確認:
- 「スクリプトライブラリとジョブパラメータ」セクションを展開
- 使用しているライブラリがGlue 5.0と互換性があることを確認
- 必要に応じてPython/Javaライブラリのパスを更新
- セキュリティ設定の確認:
- 暗号化設定を使用している場合は互換性を確認
- IAMロールに必要な権限があることを確認
- 「保存」をクリックして変更を適用
移行前のテスト手順:
- 開発環境で新しいテストジョブを作成
- 本番ジョブと同じスクリプトとパラメータを設定
- Glue 5.0バージョンを選択
- 少量のサンプルデータでテスト実行
- 結果を検証し、エラーがないことを確認
- パフォーマンスメトリクスを比較
バージョンごとの主要な変更点
Glueバージョン | Sparkバージョン | Pythonバージョン | サポート終了予定 | 主な特徴 |
---|---|---|---|---|
0.9 | 2.2.1 | 2.7 | 2024年6月 | 旧バージョン(非推奨) |
1.0 | 2.4.3 | 3.6 | 2024年6月 | 旧バージョン(非推奨) |
2.0 | 2.4.3 | 3.7 | サポート中 | 移行経路として使用 |
3.0 | 3.1.1 | 3.7 | サポート中 | 安定版 |
4.0 | 3.3.0 | 3.10 | サポート中 | Rayジョブサポート |
5.0 | 3.5.4 | 3.11 | サポート中 | 最新版(推奨) |
最後に
この記事では、AWS Glue Sparkジョブにおけるバージョン管理の重要性と最新バージョンへの移行方法を解説しました。
Glue 5.0への移行は、単なるバージョンアップではなく、ビジネス価値を生み出す投資です。セキュリティ強化によるリスク低減、最大32%のパフォーマンス向上、そして22%のコスト削減は、企業の競争力を大幅に向上させます。
重要なポイント:
- サポート終了バージョンの使用は即座に停止し、移行計画を立てる
- 段階的移行アプローチを採用し、各ステップで徹底的なテストを実施
- オートスケーリングやジョブインサイトなどの新機能を積極的に活用
- 定期的なバージョンレビューを実施し、常に最新状態を維持
この問題の検出は弊社が提供するSecurifyのCSPM機能で簡単に検出及び管理する事が可能です。 運用が非常に楽に出来る製品になっていますので、ぜひ興味がある方はお問い合わせお待ちしております。 最後までお読みいただきありがとうございました。この記事が皆さんの役に立てば幸いです。