Głównym sprawcą awarii była migracja do usługi User ID, która obsługuje uwierzytelnianie danych logowania do konta. Problem pojawił się w październiku, kiedy firma przeniosła się na nowy system alokacji zasobów systemowych, pozwalając częściowo działać staremu.

Pozostawiając te stare komponenty na miejscu, nieprawidłowo wróciły z błędem o zerowym zużyciu. Przerwa w dostawie nastąpiłaby wcześniej, gdyby nie okres karencji wprowadzony przez firmę. Niestety ta poprawka wygasła, a jej zautomatyzowane systemy zaczęły zachowywać się tak, jakby problem był prawdziwy. Google wdrożyło zabezpieczenia zapobiegające tego typu problemom, ale nie zostały one stworzone do obsługi dokładnie tego przypadku, który miał miejsce w poniedziałek rano.

Chociaż inżynierowie firmy byli w stanie stosunkowo szybko rozwiązać problem, Google twierdzi, że planuje wdrożyć nowe środki, aby zapobiec podobnej sytuacji w przyszłości. W szczególności jednym z jego celów jest lepsze informowanie, gdy awaria wyłącza usługi. Planuje również ulepszyć swoje systemy monitorowania, aby szybciej wychwycić nieprawidłowe konfiguracje.