とある技術者の研鑽結果

SIerのお仕事でたまった鬱憤を最新テクノロジー勉強で晴らすためのブログです

Spark

Sparkソースコードリーディング(5) - spark.textFile関数最後

textFile関数の最後 hadoopFIle関数の最後はHadoopRDDをnewして終了 new HadoopRDD( this, confBroadcast, Some(setInputPathsFunc), inputFormatClass, keyClass, valueClass, minPartitions).setName(path) ただnewしているだけですが興味深い点を2点まず…

Sparkソースコードリーディング(2) - confBroadcast(01)

引き続きtextFile def textFile(path: String, minPartitions: Int = defaultMinPartitions): RDD[String] = { hadoopFile(path, classOf[TextInputFormat], classOf[LongWritable], classOf[Text], minPartitions).map(pair => pair._2.toString).setName(p…