Hadoopとは、 Googleの基盤技術であるMapReduceをJavaでオープンソース実装したもので、 分散処理のフレームワークです。Hadoopを使うと、 1台のサーバでは時間の掛かるような処理を、 複数のサーバで分散処理させることができます。 「⁠処理を割り振ったサーバ ...
第28回ではHadoop Streamingの仕組みについて説明しました。今回は、 実際にHadoop Streamingを利用してデータ解析したときの具体的な話や、 利用してみて困った (ハマった) Hadoop Streaming特有の問題とその解決法について紹介していきます。 実際に利用してみて ...