Lazy logs

日々の怠惰録

VLDB2011勉強会で発表してきた

DB系の先生・学生の皆様が中心で開催しているデータベース勉強会で開催されたVLDB2011勉強会で参加・発表してきました.

僕の担当セッションは,Research Session 18: MapReduce and Hadoopということで,資料をさらします.
普段からこの周辺分野をやっているわけでは無いため,大分ナナメ読みでしたので,ところどころ間違ってるかと思いますがご容赦下さい.

さっくり概要を言うと,
1本目のColumn-Oriented Storage Techniques for MapReduceと,3本目のCoHadoop: Flexible Data Placement and Its Exploitation in Hadoopは,HDFS上のファイルフォーマットやデータチャンクのcolocationを工夫しましょうねという論文.

2本目のAutomatic Optimization for MapReduce Programと4本目のProfiling, What-if Analysis, and Cost-based Optimization of MapReduce Programsは,プログラマが書いたMapReduceのプログラムを解析して最適化もしくは適切なパラメタチューニングをしようという論文でした.

結構どれも似たような話をしていて,はやりなのかなぁと思いました.

しかしながら,正直2本目の論文はよく概要程度しかわからなかった・・・
暇が出来たら1本づつまとめようかと思います.