Přejít na obsah


Fotka

Výpadek T-Mobile


  • Pokud chcete vložit odpověď, přihlašte se
14 odpovědí na toto téma

#1 Pe_Bo

Pe_Bo

    Advanced Member

  • Members
  • PipPipPip
  • 613 příspěvků(y)

Publikováno 01 červenec 2020 - 15:25

T-Mobile má výpadek systémů, který už trvá více než 24 hodin. Vypadá to, že nejde ani jejich SMS brána - může to někdo potvrdit? Jinak normální SMS jdou, i ty z banky.

 


  • 0

#2 taxoft

taxoft

    Advanced Member

  • Members
  • PipPipPip
  • 1 644 příspěvků(y)

Publikováno 01 červenec 2020 - 15:33

Normální SMS nejdou stoprocentně. Vím o dvou čtyřech zprávách, které jsem dnes nedostal a dozvěděl se o nich až z následného telefonátu. Naopak poslali notifikaci o měsíc starém dávno zaplaceném vyúčtování a tři měsíce starou potvrzující zprávu o zřízení uživatele na webu.

 

Takže ani na ty SMS se nespoléhejte.


  • 0

Dobrovolník si myslí, že ví, co je správné, a dělá to. Aktivista si myslí, že ví, co je správné, a nutí to dělat ty ostatní.


#3 HaLuMa

HaLuMa

    Autor Geogetu

  • Members
  • PipPipPip
  • 14 508 příspěvků(y)

Publikováno 01 červenec 2020 - 20:11

Z technického hlediska naprosto nechápu, jak může takový moloch běžet z jednoho diskového pole. Takže buď jsou to neskuteční matláci, nebo je skutečná příčina mnohem horší a tají to.
  • 1

#4 dejwy

dejwy

    dejwy

  • Members
  • PipPipPip
  • 1 215 příspěvků(y)

Publikováno 01 červenec 2020 - 21:27

Z technického hlediska naprosto nechápu, jak může takový moloch běžet z jednoho diskového pole. Takže buď jsou to neskuteční matláci, nebo je skutečná příčina mnohem horší a tají to.

 

Pochybuji, že to běží z jednoho, ale i tak při objemu dat dnes desítky TB při poruše dat na jednom a synchronizaci je nutné zajistit zpětné dopsání posledních dat či obnovu dat ze zálohy a to může trvat opravdu dlouho.
Jinak jistě, že to tají, málokdo se přizná, to je taková standardní praxe.Těch lidí, kteří přijdou a řeknou, nedomyslel jsem to a to a podělalo se to, omlouvám se, dáváme to do kupy, těch je málo...


  • 1

#5 taxoft

taxoft

    Advanced Member

  • Members
  • PipPipPip
  • 1 644 příspěvků(y)

Publikováno 01 červenec 2020 - 22:16

23:15 Teď přišly dvě z těch zpožděných zpráv z odpoledne. Ty dvě zhruba z poledne nedorazily pořád.


  • 0

Dobrovolník si myslí, že ví, co je správné, a dělá to. Aktivista si myslí, že ví, co je správné, a nutí to dělat ty ostatní.


#6 zvedavkanocni

zvedavkanocni

    recesistka

  • Members
  • PipPipPip
  • 4 040 příspěvků(y)

Publikováno 01 červenec 2020 - 22:43

Hm, mně SMS poslaná od známého kolem půl deváté přišla teď před půlnocí. Jindy si píšeme večer v pohodě jako kdybychom spolu mluvili.... pořád mu říkám, aby přešel na WhatsApp. Data prý fungují, jen se nedají dobíjet?
  • 0

#7 HaLuMa

HaLuMa

    Autor Geogetu

  • Members
  • PipPipPip
  • 14 508 příspěvků(y)

Publikováno 02 červenec 2020 - 9:35

Pochybuji, že to běží z jednoho, ale i tak při objemu dat dnes desítky TB při poruše dat na jednom a synchronizaci je nutné zajistit zpětné dopsání posledních dat či obnovu dat ze zálohy a to může trvat opravdu dlouho.

Desitky TB jsou drobné. Tady bych očekával i o dva řády víc. Ale zrovna u mobilního operátora bych očekával, že je pád jednoho pole nevyděsí. Dokonce bych očekával, že je nevyděsí ani pád celého jednoho datacentra... kurňa, od čeho jsou všechna ta enterprise fault-tolerance řešení? A kdo jinej si je může dovolit, než těžce výdělečný mobilní operátor?


  • 0

#8 tarmara

tarmara

    Air-cooled

  • Members
  • PipPipPip
  • 969 příspěvků(y)

Publikováno 02 červenec 2020 - 9:48

Desitky TB jsou drobné. Tady bych očekával i o dva řády víc. Ale zrovna u mobilního operátora bych očekával, že je pád jednoho pole nevyděsí. Dokonce bych očekával, že je nevyděsí ani pád celého jednoho datacentra... kurňa, od čeho jsou všechna ta enterprise fault-tolerance řešení? A kdo jinej si je může dovolit, než těžce výdělečný mobilní operátor?

ta fault-tolerance není zadarmo, a geograficky oddělená failover řešení jsou naročná na konfiguraci, HR, HW, SW....to co se stalo bych viděl možná na nějaký podělaný disaster/recovery test, kdy se provedla jen disaster fáze a pak se to začlo sr.t. Vždycky je v těhlech řešeních nějaký bottleneck u kterého už se nevyplatí mít zálohu, takže při jeho odchodu do křemíkového nebe se možná čeká na dodávku. Zažil jsem v rámci D/R testu odchod síťového prvku, který nebyl skladem a dva dny jsme byli bez (shodou okolností) diskového pole a nepomohla ani záložní lokalita....


  • 0

#9 Modrak

Modrak

    Advanced Member

  • Members
  • PipPipPip
  • 2 345 příspěvků(y)

Publikováno 02 červenec 2020 - 11:02

To maj z toho, ze si ty data neopsali vcas na papir B)


  • 2

#10 panzerstepan

panzerstepan

    Advanced Member

  • Members
  • PipPipPip
  • 1 562 příspěvků(y)

Publikováno 02 červenec 2020 - 11:14

ta fault-tolerance není zadarmo, a geograficky oddělená failover řešení jsou naročná na konfiguraci, HR, HW, SW....to co se stalo bych viděl možná na nějaký podělaný disaster/recovery test, kdy se provedla jen disaster fáze a pak se to začlo sr.t. Vždycky je v těhlech řešeních nějaký bottleneck u kterého už se nevyplatí mít zálohu, takže při jeho odchodu do křemíkového nebe se možná čeká na dodávku. Zažil jsem v rámci D/R testu odchod síťového prvku, který nebyl skladem a dva dny jsme byli bez (shodou okolností) diskového pole a nepomohla ani záložní lokalita....

Myslis takovej T-mobile Cernobyl :)


  • 0

#11 HaLuMa

HaLuMa

    Autor Geogetu

  • Members
  • PipPipPip
  • 14 508 příspěvků(y)

Publikováno 02 červenec 2020 - 11:20

ta fault-tolerance není zadarmo, a geograficky oddělená failover řešení jsou naročná na konfiguraci, HR, HW, SW...

Budu se opakovat... kdo jinej by si mohl takové řešení dovolit, než velmi výdělečný mobilní operátor?


  • 1

#12 tarmara

tarmara

    Air-cooled

  • Members
  • PipPipPip
  • 969 příspěvků(y)

Publikováno 02 červenec 2020 - 11:33

Budu se opakovat... kdo jinej by si mohl takové řešení dovolit, než velmi výdělečný mobilní operátor?

když jsem mluvil se známým, co dělával pro O2 a odcházel kvůli přetěžování zaměstnanců a neustálému cost-cuttingu (servisy BTS a backendu, delší intervaly obnovy HW), tak si nedělám iluze, že existuje nějaká korelace mezi ziskovostí a investicemi do vybavení...spíš bych to viděl na důslednou ekonomickou analýzu toho co se dá ještě ojebat a jaký bude mít případný průser ekonomický dopad. Proto možná u TM trvá oprava technologií pro plebs tak dlouho a korporátní dodávky pod kvalitním SLA se smluvními pokutami už jsou dávno vyřešené....chtělo by to nějaký insider pohled.


  • 2

#13 HaLuMa

HaLuMa

    Autor Geogetu

  • Members
  • PipPipPip
  • 14 508 příspěvků(y)

Publikováno 02 červenec 2020 - 11:39

No jo, ale to by ta bezpecnejší řešení nepoužíval nikdo. Jedni na to nemají, a druzí jsou držgrešle.

Ergo, někde musí existovat velké firmy, kde nevládnou kreténi. (Kreten8 promine, toho jsem nemyslel.)


  • 0

#14 tarmara

tarmara

    Air-cooled

  • Members
  • PipPipPip
  • 969 příspěvků(y)

Publikováno 02 červenec 2020 - 12:43

No jo, ale to by ta bezpecnejší řešení nepoužíval nikdo. Jedni na to nemají, a druzí jsou držgrešle.

Ergo, někde musí existovat velké firmy, kde nevládnou kreténi. (Kreten8 promine, toho jsem nemyslel.)

Ale oni ani v TM nemusí být kreténi - SLAčka vyřeší jako první, tak aby případné pokutičky nebyly větší než to co se na discích ušetřilo....no a pak se řeší věci, ze kterých žádný vícenáklad nekouká....selský rozum za tím neradno hledat....


  • 0

#15 majkaz

majkaz

    Advanced Member

  • Members
  • PipPipPip
  • 252 příspěvků(y)

Publikováno 02 červenec 2020 - 13:53

Ale oni ani v TM nemusí být kreténi - SLAčka vyřeší jako první, tak aby případné pokutičky nebyly větší než to co se na discích ušetřilo....no a pak se řeší věci, ze kterých žádný vícenáklad nekouká....selský rozum za tím neradno hledat....

 

Přesně. Zkušenosti říkají, že spousta firem, nejen TM, si v podstatě spočítají to, kolik pokut se jim ještě vyplatí v porovnání s náklady na to, aby bylo vše 100%. Už jsem taky zažila, že garantované lhůty, za které se platilo, nakonec zas tak garantované nebyly. Nebo se oprava nějak nouzově lepila z "odkloněných" věcí pro běžný plebs a skutečná oprava nastala až po nějaké době.

Skutečné umění v tomhle je, trefit tu správnou míru šetření, kde to ještě bude vycházet. Tady to zkrátka jednou nevyšlo, a hned hodně viditelně.


  • 3




0 uživatel(ů) prochází toto téma

0 uživatelů, 0 návštěvníků 0 anonymních uživatelů

Reklama