夏の読書感想文(Googleを支える技術)
最近何もやる気起きないくらいには暑いですね
学生生活最後の夏休み、内定出るタイミングの問題でHatenaのサマーインターンとか申し込みすらできなかったので今年はインターン活何もない。というわけで夏らしいことをしよう、夏といえば宿題、宿題といえば大っ嫌いな読書感想文だよなーってことで Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ) という本を読みました
Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)
- 作者: 西田圭介
- 出版社/メーカー: 技術評論社
- 発売日: 2008/03/28
- メディア: 単行本(ソフトカバー)
- 購入: 47人 クリック: 1,166回
- この商品を含むブログ (374件) を見る
目次
こんなこと書いてます
- Googleの誕生
- 検索エンジンの話
- Googleの大規模化
- 分散システム構築の基本的な考え方
- Googleの分散ストレージ
- GFS
- Bigtable
- chubby
- Googleの分散データ処理
- MapReduce
- Sawzall
- Googleの運用コスト
- GoogleのDCの運用コストなど
- Googleの開発体制
- ソフトウェア開発の文化
興味あった所
全部興味深いんだけど、特に気になったのは検索エンジンとMapReduceの話だったので、この2つだけ軽い感想を
Google初期の検索エンジンの仕組みの話
リストのようなことが書いてた
- PageRankの仕組み
- アンカーテキストからurlはなんのページかを判断する
- DBのインデックスをいかに工夫して作るか
チームラボでレコメンドエンジンのアルゴリズム考えてみようっ!てのやってからレコメンドエンジンとか検索エンジンみたいなの興味あるから面白かった
一応検索エンジンの概要的なのはわかったから、どこかのタイミングで自作してみたい
MapReduce
ビックデータがバズり始めた頃くらいから名前だけは聞いてたんだけど、なんなんだろうと思ってたのがスッキリした
- Map
- シャッフル
- Reduce
という3ステップで結果を得るらしい。Map, Reduceで結果を得るってのは普通にやってたんだけどシャッフルの部分がなるほどなーって勉強になった。
読み終わってMapReduceちょっとググったら
こんな記事見つけてしまって(゜゜)←こんな顔になったけど
後継としてGoogle Cloud Dataflowってのが出てるって勉強になったからいっかと割り切る…
まとめ
Hadoopとか最近流行ってるしSparkみたいなのもちょっとは勉強した方がいいんかなーとこの本読んで強く思った。でも今したいこととはちょっと違うんだよなー…w
もし僕が興味あった部分以外でも、何か興味がある部分があれば、まぁまぁ古い本だから安いし、買ってみてはどうでしょうか
Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)
- 作者: 西田圭介
- 出版社/メーカー: 技術評論社
- 発売日: 2008/03/28
- メディア: 単行本(ソフトカバー)
- 購入: 47人 クリック: 1,166回
- この商品を含むブログ (374件) を見る
今度は図書館で借りてきたし 達人プログラマー―システム開発の職人から名匠への道 読まないとなー
- 作者: アンドリューハント,デビッドトーマス,Andrew Hunt,David Thomas,村上雅章
- 出版社/メーカー: ピアソンエデュケーション
- 発売日: 2000/11
- メディア: 単行本
- 購入: 42人 クリック: 1,099回
- この商品を含むブログ (351件) を見る