Auf dem dritten ACM SIGOPS International Workshop für "Large Scale Distributed Systems and Middleware" hat Jeff Dean von Google einen interessanten Vortrag gehalten. Die Folien gibt es zum Glück auch online via
http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote-ladis2009.pdf. Die Präsentation ist einen ausführlichen Blick Wert. Natürlich werden nicht alle bei Google eingesetzten Lösungen genau vorgestellt. Trotzdem bekommt man ein gutes Gefühl wie Google aktuell arbeitet und welche Goals für die zukunft anstehen (Projekt Spanner).
Allein die Zahlen für
GFS sind schon beeindruckend:
- 200+ clusters
- Many clusters of 1000s of machines
- Pools of 1000s of clients
- 4+ PB Filesystems
- 40 GB/s read/write load
Oder auch die Infos zu
BigTable:
- Currently ~500 BigTable clusters
- Largest cluster: 70+ PB data; sustained: 10M ops/sec; 30+ GB/s I/O
Ich finds beeindruckend!