Lazy logs

日々の怠惰録

読んだ

あけましておめでとうございます.
漫画3冊購入.

年1冊ペースで出版される鬼頭莫広の最新作.
展開はすごく静かだけど,内容はすごく自分好みで刺激的.
話中で議論されている点数制の話や責任能力二元論の話は,
偏った考えとわかりつつも同じことを考えたことがあったため,
考えに共感できる部分も多かった.

早く新刊読みたいけど,また1年後か…


他の2冊は淡々と.3月のライオンは表紙が可愛い.

進撃の巨人(12) (講談社コミックス)

進撃の巨人(12) (講談社コミックス)

2012年まとめ

一言で言うと負けの一年.
毎年負けている気がするけど,今年も同様.

本当に屁のつっぱりにもならないような事しかできず,
まわりを大きく落胆させた一年だった.
僕自身も死にたくなるような気持ちで過ごした日は多かった.

小判鮫のように獲得した成果ではなく,自力で獲得した成果が欲しいと願うが,
この日記も継続できないような口だけ野郎なので,願うだけで2013年も終えそうだ.

他人との比較に興味はないので,
せめて自分自身が満足してこれをやったと言えるものを作りたい.

あの世で俺にわび続けろ

LIVE A LIVEの実況動画見てたら夏休み終わってた.

An Analysis of Structured Data on the Web (PVLDB, Vol.5, No.7)

前回と同様にPVLDB.

An Analysis of Structured Data on the Web

Webから特定のドメイン(例えば,レストランやホテルなど)に関するエンティティを抽出してくる際の,Webデータの特性やデータ構造の分布などを解析した論文.
自宅のネット環境がアレなので,こちらも同じく今月末あたりにまとめます.

Scalable k-means++ (PVLDB, Vol.5, No.7)

PVLDBでタイトルの論文が公開されてたので読みました.
Scalable k-means++

正直なところ,証明やら解析やらがよくわからなかったけど,あとでまとめます.

ICDE2012で気になる論文

ICDE2012のAccepted Papersが公開されたみたいなので,タイトルだけ見て気になる論文をメモ.
面倒なので著者は省略.

  • 25. Iterative Graph Feature Mining for Graph Indexing
  • 74. Leveraging P2P Structure for Large-scale Data Processing
  • 82. Effective Data Density Estimation in Ring-based P2P Networks
  • 105. Physically Independent Stream Merging
  • 106. Lookup Tables: Fine-Grained Partitioning for Distributed Databases
  • 121. Effective and Robust Pruning for Top-Down Join Enumeration Algorithms
  • 140. An Efficient Graph Indexing Method
  • 156. Towards Preference-aware Relational Databases
  • 159. Multidimensional Analysis of Atypical Events in Cyber-Physical Data
  • 163. On Discovery of Traveling Companions from Streaming Trajectories
  • 281. Temporal Analytics on Big Data for Web Advertising
  • 286. Parametric Plan Caching Using Density-Based Clustering
  • 309. A General Method for Estimating Correlated Aggregates over a Data Stream
  • 316. Learning-based Query Performance Modeling and Prediction
  • 327. Fuzzy Joins Using MapReduce
  • 369. Community Detection with Edge Content in Social Media Networks
  • 399. Incremental Detection of Inconsistencies in Distributed Data
  • 431. Parallel Top-K Similarity Join Algorithms Using MapReduce
  • 539. Extending Map-Reduce for Efficient Predicate-Based Sampling
  • 562. Processing of Rank Joins in Highly Distributed Systems
  • 567. Micro-Specialization in DBMSes
  • 580. Three-level Processing of Multiple Aggregate Continuous Queries
  • 615. ISOBAR Preconditioner for Effective and High-throughput Lossless Data Compression
  • 84. Adaptive Windows for Duplicate Detection
  • 88. Load Balancing for MapReduce-based Entity Resolution
  • 289. Load Balancing in MapReduce Based on Scalable Cardinality Estimates

VLDB2011勉強会で発表してきた

DB系の先生・学生の皆様が中心で開催しているデータベース勉強会で開催されたVLDB2011勉強会で参加・発表してきました.

僕の担当セッションは,Research Session 18: MapReduce and Hadoopということで,資料をさらします.
普段からこの周辺分野をやっているわけでは無いため,大分ナナメ読みでしたので,ところどころ間違ってるかと思いますがご容赦下さい.

さっくり概要を言うと,
1本目のColumn-Oriented Storage Techniques for MapReduceと,3本目のCoHadoop: Flexible Data Placement and Its Exploitation in Hadoopは,HDFS上のファイルフォーマットやデータチャンクのcolocationを工夫しましょうねという論文.

2本目のAutomatic Optimization for MapReduce Programと4本目のProfiling, What-if Analysis, and Cost-based Optimization of MapReduce Programsは,プログラマが書いたMapReduceのプログラムを解析して最適化もしくは適切なパラメタチューニングをしようという論文でした.

結構どれも似たような話をしていて,はやりなのかなぁと思いました.

しかしながら,正直2本目の論文はよく概要程度しかわからなかった・・・
暇が出来たら1本づつまとめようかと思います.