本記事は、Cloudera ソフトウェア・エンジニア Aaron T. Myers によるエイプリルフール記事を翻訳したものです。
原文についてはこちらをご覧ください。
繰り返しますが、これはエイプリルフール記事です。以下の内容についてのご質問等には一切お答えしかねますのでご了承ください。
はじめに
数ヶ月前、私の同僚Charles Zedlewskiはは、Apache Hadoopのバージョン番号を説明している素晴らしい記事を書きました。その投稿は次の図のようにまとめることができます。
Charlesの投稿はApache Hadoopのバージョン番号の履歴を説明している素晴らしい作業ですが、それはHadoopのバージョン番号がどこに向かっているのかをユーザーが理解する助けにはなりません。
問題
Hadoopは”クラウドのオペレーティングシステム”とよく言われるようになっています。この説明に異論を挟むまでもなくはっきりしていることは、既に定着したオペレーティングシステムとマインドシェアを争うつもりなら、まず我々のバージョン番号を標準化する必要があるということです。Hadoopのリリースの最初の5年ぐらいでは、バージョン番号は全て”1″よりも少ない数値でした。2011年後半にはHadoop 1.0のリリースと、まもなく誕生するHadoopの2.0のリリースでは遅れを取り戻すために多くのことが行われましたが、コミュニティはさらなる作業をしなければなりません。
解答
その1:バージョンのバックデート
オプションのバックデートと同様に、過去のいくつかのリリースはより高いバージョン番号に付け替えられます。Hadoopの0.16ラインから始まり、由緒ある0.20ラインを経由して、メジャーバージョンは1から始まり、そしてフィボナッチ数列によって増分されます。しかし、これらのリリースのマイナーバージョンは、混乱を少なくするため、今までの数字が保たれます。これにより、次のようなバージョン番号のマッピングが得られます。
以前の “1.0.x”と”2.0.x”として知られているリリースでは同じように増加されますが、今回は明示的にフィボナッチ数列で次の2つの番号が設定され、それらのマイナーバージョンが0にリセットされます。従って、それぞれ8.0と13.0になります。
以前の “1.0″と “2.0″として知られている2つのリリースの重要性を明確に区別するために、これらのバージョンは、新しい6つの部分の番号付け方式、すなわち、8.0.0.0.0.0と13.0.0.0.0.0が採用されます。この方式での最後の3つの部分の意図は、これらはいずれも”0″になることはないということです – 余分なゼロは、リリースの重要性を識別するためにのみ使用されています。より多くのゼロが将来的に追加される可能性があります。
注:8.x.y.0.0.0(旧1.0.0)の成熟度を考えると、このリリースラインでは、今後スペルミスの修正、またはドキュメントの単一行の追加のコードの変更のみを受け入れます。
その2:分数のマイナーバージョン
さらに他の”オペレーティングシステム”からHadoopを区別するために、Hadoopのリリースは、必要に応じて、コミュニティの意志で分数のバージョン番号を付加することができるようになります。これは、ソフトウェア業界では比類のないバージョニングの柔軟性をHadoopに与える必要があります。例としては、 “Apache Hadoop 13 ½”、 “Apache Hadoop 33 ⅓”、あるいは “Apache Hadoop 21 C / d”が含まれるかもしれません。
その3(最後):コードネーム
他の “オペレーティングシステム”では、バージョン番号によってではなく、覚え易いコードネームで呼ばれることも多いです。Hadoopも同様に、これらの分野において対抗することができなければなりません。まだコミュニティでの投票はありませんが、次のコードネームが提案されています。
Apache Hadoop 8.x.y.0.0.0は代わりに“Lion”と呼ばなければならない。
Apache Hadoop 13.x.y.0.0.0は代わりに“Vista”と呼ばなければならない。
Apache Hadoop 21.x.y.0.0.0は代わりに“Hadoop Database 11g”と呼ばなければならない。
これらの新しいコードネームは、Hadoopがこれまで行き届いていないビッグデータ処理小売市場に広めるべきであり、Dougの当初の目標である“すべての家庭にクラスタを”を実現するのに役立ちます。
Cloudera Manager バージョン互換性レイヤ
各企業、組織内で稼働しているApache Hadoopの多くの異なるバージョンの拡大がどうなるかと歩調を合わせるために、独自の互換性とバージョン管理レイヤーを導入するためのCloudera Managerが必要になります。本日初めて発表されたこの製品は、オペレーターがApache Hadoopのすべての過去、現在、再番号付け、および将来のバージョンの監視および管理をすることができる、単一のコンソールをサポートします。この製品はCloudera Middle Managerと呼ばれるものとします。


