Zur Abwechslung mal wieder was aus der Welt meines Arbeitgebers, die neuen TV Spots laufen seit einigen Tagen im Fernsehen. Die Spots selbst sind gewähnungsbedürftig, was bei einem Werbespot eine gute Eigentschaft ist. Schließlich erzeugt man darüber Aufmerksamkeit. Schauen wir mal was Otto in den kommenden Wochen und Monaten noch alles vom Stapel lässt!
amazon and Splunk published a case study about the usage of AWS for Splunk Storm, another nice Story for building products on the cloud: AWS Case Study: Splunk. Another interesting part of the story is the usage of Opscodes Chef as infrastructure automation solution. So bad, that we at otto group could not use AWS because Amazon is one of our competitors.
Alex gave an interesting statement regarding the AWS and how important a flexible and reliable plattform is:
“Here at Splunk, what we’ve traditionally been good at is managing big data. AWS has made it possible to build and manage a large service,” Munk says.
“We track uptime and service availability, and AWS has surpassed our expectations,”
Alex, if you read this: I love Storm, get on with it (and keep track on my suggestion list)!
Oracle hat eine neue Version des "The Underground PHP and Oracle Manual" veröffentlicht. Das Werk kann über Oracle kostenlos heruntergeladen werden und richtet sich an PHP Entwickler die Verbindung zur Oracle Datenbanken aufnehmen müssen/möchten/sollen. Darüber hinaus sind diverse Hinweise zur Installation z.B. von OCI8 enthalten. Das Dokument ist daher auch für Administratoren oder DevOps interessant.
Anbei eine kurze Anlistung der Kapitel um einen Eindruck der Inhalte (insgesamt 362 Seiten) zu bekommen:
Die Kapitel 10-15 sollte man sich direkt ansehen, hier geht es um das wesentlichen z.B. Connection Pooling. Das Kapitel 18 ist ebenfalls interessant, wenn man in mehreren Sprachen unterwegs ist.
Das Dokument selbst bezieht sich nur auf "Oracle Database Express Edition 11g Release 2", in der Praxis ist es aber auch bei "vollwertigen" Oracle Datenbanken anwendbar (abgesehen von den spezifischen Installationshinweisen).
Bereits 2010 hatte ich von meinen Bereitschatsaufwänden berichtet, 2011 hab ich vergessen und werde ich jetzt mit 2012 nachreichen. Immerhin ein positiver Trend, wobei ab 2012 geplante Einsätze nicht mehr in der Bereitschaftszählung auftauchen. Würde man diese ergänzen, dann kommen 18 Stunden hinzu.
Splunk Enterprise 5 is available for download, now! Watch out the "What's new" page. The most important things from the long list:
- report acceleration (one klick to faster reports)
- dynamic drilldowns (go from "the what" to "the why")
- integrated PDF generation (yes!)
- index replication (for high availability on commodity hardware)
- modular inputs (App developers -> wake up!)
- Splunk Hadoop Connect
- Splunk App for HadoopOps
- Full SDK integration (every endpoint allows replies woth json data)
Regarding the report acceleration, there is an statement from me, online on computerwoche.de:
Schnellere Reports sind unglaublich viel wert, aber wirklich beeindruckend ist die Einfachheit, mit der wir sie in Splunk Enterprise 5 aufsetzen können!
In english:
Faster reports are incredibly valuable, but what's really amazing is the ease in which we can set them up in Splunk Enterprise 5.
In den vergangenen Wochen war Otto mehrfach in der Presse. Das große SAP IT Projekt wurde gestoppt und Restruktorierungsprojekte führen zu Umbauten innerhalb einiger Konzerngesellschaften. Das hat sich anscheinend auch bis zu den Headhuntern rumm gesprochen: Die Anzahl der Anfragen bezüglich Stellenwechseln sind erheblich gestiegen. Dabei dominiert im Moment Xing vor LinkedIn, was sicherlich auch an der internationalen Ausrichtung von LinkedIn liegt (jedenfalls habe ich innerhalb von LinkedIn mehr Kontakte außerhalb Deutschlands, als bei Xing).
How it looks like, if a backend system is flooded with requests from another system?
With Splunk it cool look like that (one day normal traffic and one day with this "little" error):
What happended?
We are operating an orchestrated SOA environment and one request type from the frondends forced the middleware to run in something like a loop. Those errornous Requests spreads out into thousands of backend requests (everytime the same one).
How we find it?
We are logging the duration and a custom Transaction ID in our application server access logs. As showed on .conf in Las Vegas ("Where did that order go? Real World Tales of Purchase and Transaction Tracing") our Transaction ID help us finding erros like this one. We saw that many thousand requests with the same transaction ID was send out for only one frontend request. Without the Transaction ID, we could not find such errors. In that case we would see the big amount of traffic for this domain/services, but not the connection to the causer.
Return of Investment
Calculating the ROI is hard, because this backend scaled perfectly and no request was lost (which is a good value with a factor 9 higher traffic). But finding the error was under 15 minutes. We saw long running request from the frontend, searching for backend requests regarding this frontend request shows the problem directly. Next step was the chart above for showing the increasing traffic for this domain. Fixing this error took a bit longer, due some shakedown tests... but Splunk really helps, and that counts!
Sorry for the delayed entry, but I am busy at the moment. I would like to thank all the Splunkers I met in Las Vegas at the .conf 2012. It was a pleasure to meet you and talk with you about. Furthermore there where many many interesting presentations with so many inputs for our business, thanks to all the speakers for this great job. The intro video from the keynote is available only:
I am not allowed to publish the presentation from Dan and me online, but if you have any questions about the content, send me an email.
Im September (10-13ter) ist es soweit, die Splunk User Conference findet statt. Diesmal in Las Vegas und mit einem Vortrag von mir! Im offiziellen Session Kalender ist der Vortrag im Using Splunk Track zu finden. Im Moment wird die Session am 12.09. von 10:30 bis 11:30 Uhr noch mit einem Arbeitstitel geführt, die Beschreibung wird aber noch auf folgende geändert:
Where did that order go?
Real World Tales of Purchase and Transaction Tracing
Otto Group, one of Europe's largest retailers, will show how Splunk makes it easier for their operations staff and business analysts to do root cause analysis on order tracking issues. This session will detail how Otto has built apps and views on Splunk to more easily follow the sequence of events in a transaction. Otto will also share logging best practices that trace transactions across application boundaries, and a primer on Splunk's transaction search.
Amir has written a blog post about "How to create very reliable web services" and I think he is definitely right with his tips. Every WebOps, DevOps or Admin should read this post to get an idea of whats possible and much better: Whants needed!
I would solve some of the tasks with Splunk, but that is up to you!
Erin posted a blog post about the diversity of using Splunk. She wrote about some of the interesting things which you could do with the data and provided some use cases like my Monitor a heating system with Splunk or the brand new Monitor the sunshine intensity with Splunk Storm. Another interesting idea is Rick's Splunk LED Monitor. At this point I am missing the "Extreme Feedback Device" of my colleague Michael. He is using our Splunk data to switch some lights if the error count rises. The lamps changs the colors to signal the errors by backend. If the error count is over the highest "allowed" level the lamps starts flashing. A few weeks after he installed the ExtremeFeedbackDevice (EFD?) we got bugged about the calls from his team members. They call us every time the color switches or flashing starts. We stopped the calls by fixing the errors and reducing long running requests and not by bringing EDF down. That's another nice success story which shows how easy it is to make more out of the data.
Wie bereits berichtet habe ich auf den Splunk Lives in Düsseldorf und München jeweils einen Vortrag über "Splunk bei der otto group" gehalten. Das Feedback nach den beiden Vorträgen war sehr gut, was zeigt das wir doch interessante Dinge umgesetzt haben. Neben den Vorträgen gab es natürlich auch viele neue Kontakte und einen offenene Erfahrungsaustausch zwischen bestehenden Anwendern wie auch Interessenten.
Leider hatte mir das Hilton in Düsseldorf ein Zimmer direkt an den Fahrstühlen zugeteilt was mit entsprechenden Lärm in der Nacht verbunden war. Erschreckend eigentlich das es in einem Hilton Hotel überhaupt solche Zimmer gibt. Immerhin durfte ich Dank dem HHonors Gold Status kostenlos im Internet surfen.
In München habe ich dann im Le Meridien übernachten dürfen. Das Hotel liegt direkt neben dem Hauptbahnhof und ist vom Flughafen in ca. 45 Minuten (S-Bahn) zu erreichen. Das Hotel selbst ist sehr schön dekoriert und läd zum wohlfühlen ein. Leider bin ich zu spät eingetroffen und das SPA nutzen zu können.
Nach dieser "Reisewoche" erwartet mich nun eine etwas entspanntere Zeit wobei vor Ostern noch unser Schlafzimmer tapeziert wird. Das ist natürlich mit dem Abbau des Schrankes verbunden. Man hat ja sonst nix zu tun.
Ab dem 29.03.2012 ist die April Ausgabe der iX im Handel. Diese enthält einen Review Artikel über Splunk den ich geschrieben habe.
Systemmanagement – Review Wachdienst Log-Daten-Management: Troubleshooting mit Splunk
Jede IT-Installation produziert Unmengen an Systemmeldungen, Log-Dateien und Ähnliches. Wer diese Bits und Bytes richtig behandelt, kann daraus wertvolle Informationen gewinnen. Ein Werkzeug wie Splunk hilft beim Auswerten der täglich anfallenden Datenmengen.
Wer also ein wenig mehr über Splunk und die Möglichkeiten dieser Software erfahren möchte muss sich nur eine iX kaufen.
Link zum Heft: http://www.heise.de/ix/inhalt/2012/04/74/
Ende März finden die SplunkLive Veranstaltungen in Düsseldorf, Zürich und München statt. Alle Splunk interessierten können an diesen kostenlos teilnehmen.
27.03.2012 - Düsseldorf, Hilton Düsseldorf
28.03.2012 - Zürich, Crowne Plaza Zürich
29.03.2012 - München, Le Méridien München
Ein Kollege und ich werden auf der Veranstaltung darüber berichten wie Splunk innerhalb der otto group IT eingesetzt wird. Die Termine in Düsseldorf und München werden dabei von mir betreut. Wer mich also mal wieder außerhalb Hamburgs treffen möchte oder einfach nur an unseren Informationen zu Thema Splunk interessiert ist, ist herzliche eingeladen.