Lazy logs

日々の怠惰録

読んだ

あけましておめでとうございます.
漫画3冊購入.

年1冊ペースで出版される鬼頭莫広の最新作.
展開はすごく静かだけど,内容はすごく自分好みで刺激的.
話中で議論されている点数制の話や責任能力二元論の話は,
偏った考えとわかりつつも同じことを考えたことがあったため,
考えに共感できる部分も多かった.

早く新刊読みたいけど,また1年後か…


他の2冊は淡々と.3月のライオンは表紙が可愛い.

進撃の巨人(12) (講談社コミックス)

進撃の巨人(12) (講談社コミックス)

2012年まとめ

一言で言うと負けの一年.
毎年負けている気がするけど,今年も同様.

本当に屁のつっぱりにもならないような事しかできず,
まわりを大きく落胆させた一年だった.
僕自身も死にたくなるような気持ちで過ごした日は多かった.

小判鮫のように獲得した成果ではなく,自力で獲得した成果が欲しいと願うが,
この日記も継続できないような口だけ野郎なので,願うだけで2013年も終えそうだ.

他人との比較に興味はないので,
せめて自分自身が満足してこれをやったと言えるものを作りたい.

An Analysis of Structured Data on the Web (PVLDB, Vol.5, No.7)

前回と同様にPVLDB.

An Analysis of Structured Data on the Web

Webから特定のドメイン(例えば,レストランやホテルなど)に関するエンティティを抽出してくる際の,Webデータの特性やデータ構造の分布などを解析した論文.
自宅のネット環境がアレなので,こちらも同じく今月末あたりにまとめます.

Scalable k-means++ (PVLDB, Vol.5, No.7)

PVLDBでタイトルの論文が公開されてたので読みました.
Scalable k-means++

正直なところ,証明やら解析やらがよくわからなかったけど,あとでまとめます.

ICDE2012で気になる論文

ICDE2012のAccepted Papersが公開されたみたいなので,タイトルだけ見て気になる論文をメモ.
面倒なので著者は省略.

  • 25. Iterative Graph Feature Mining for Graph Indexing
  • 74. Leveraging P2P Structure for Large-scale Data Processing
  • 82. Effective Data Density Estimation in Ring-based P2P Networks
  • 105. Physically Independent Stream Merging
  • 106. Lookup Tables: Fine-Grained Partitioning for Distributed Databases
  • 121. Effective and Robust Pruning for Top-Down Join Enumeration Algorithms
  • 140. An Efficient Graph Indexing Method
  • 156. Towards Preference-aware Relational Databases
  • 159. Multidimensional Analysis of Atypical Events in Cyber-Physical Data
  • 163. On Discovery of Traveling Companions from Streaming Trajectories
  • 281. Temporal Analytics on Big Data for Web Advertising
  • 286. Parametric Plan Caching Using Density-Based Clustering
  • 309. A General Method for Estimating Correlated Aggregates over a Data Stream
  • 316. Learning-based Query Performance Modeling and Prediction
  • 327. Fuzzy Joins Using MapReduce
  • 369. Community Detection with Edge Content in Social Media Networks
  • 399. Incremental Detection of Inconsistencies in Distributed Data
  • 431. Parallel Top-K Similarity Join Algorithms Using MapReduce
  • 539. Extending Map-Reduce for Efficient Predicate-Based Sampling
  • 562. Processing of Rank Joins in Highly Distributed Systems
  • 567. Micro-Specialization in DBMSes
  • 580. Three-level Processing of Multiple Aggregate Continuous Queries
  • 615. ISOBAR Preconditioner for Effective and High-throughput Lossless Data Compression
  • 84. Adaptive Windows for Duplicate Detection
  • 88. Load Balancing for MapReduce-based Entity Resolution
  • 289. Load Balancing in MapReduce Based on Scalable Cardinality Estimates

VLDB2011勉強会で発表してきた

DB系の先生・学生の皆様が中心で開催しているデータベース勉強会で開催されたVLDB2011勉強会で参加・発表してきました.

僕の担当セッションは,Research Session 18: MapReduce and Hadoopということで,資料をさらします.
普段からこの周辺分野をやっているわけでは無いため,大分ナナメ読みでしたので,ところどころ間違ってるかと思いますがご容赦下さい.

さっくり概要を言うと,
1本目のColumn-Oriented Storage Techniques for MapReduceと,3本目のCoHadoop: Flexible Data Placement and Its Exploitation in Hadoopは,HDFS上のファイルフォーマットやデータチャンクのcolocationを工夫しましょうねという論文.

2本目のAutomatic Optimization for MapReduce Programと4本目のProfiling, What-if Analysis, and Cost-based Optimization of MapReduce Programsは,プログラマが書いたMapReduceのプログラムを解析して最適化もしくは適切なパラメタチューニングをしようという論文でした.

結構どれも似たような話をしていて,はやりなのかなぁと思いました.

しかしながら,正直2本目の論文はよく概要程度しかわからなかった・・・
暇が出来たら1本づつまとめようかと思います.