Смертельная секунда

Очередной эпичный успех СПО — по всему миру падают сервера на ядрах 3.1 и 3.2 из-за вчерашнего перевода времени на 1 секунду.

http://serverfault.com/questions/403732/anyone-else-experiencing-high-rates-of-linux-server-crashes-during-a-leap-second

Уже выпущен мегапатч, который надо применять после (sic!!!) отключения ntpd: http://linux.brong.fastmail.fm/2012-06-30/fixtime.pl

Редхат выпустил статью в KB, которая рассказывает, что свежий RHEL 6 падает понарошку:

RHEL 6 customers may be affected by a known issue that causes NMI Watchdog to detect a hang when receiving the NTP leapsecond announcement. This issue is being addressed in a timely manner. If your systems received the leapsecond announcement and did not experience this issue, then they are no longer affected.

Ынтерпрайзность линукса заметна невооружённым взглядом — «проблеме несколько лет, мы положили болт, выключите NTP, и вообще — если сразу система не сдохла, то Вас пронесло. Это мы так о Вас заботимся за Ваши деньги».

Невооружённым взглядом наблюдается очередная линукспобеда — в середине 2012 года выплыл баг, который известен с 2008 года (http://lists.debian.org/debian-user/2009/01/msg00056.html). Штатным решением является отключение уязвимого сервиса (!!!!!!!!). Линукстехнологии во всей своей неприкрытой ослепительной красоте — три с лишним года висит баг, о том, что будут добавлять секунду, и этот баг 100% выплывет, известно в общем-то не день и не два, баг наглухо убивает систему, линуксрешение — на следующий день после того, как всё сдохло, выключить NTP.

Наверное, полупрозрачное СПО-коммунити из миллионов профессионалов очень хотело с 2009 года поправить этот баг, да вот родаки заставили матешу делать. Ну и Баллмер лично, конечно, помешал. И NTP нинужен.

Прекрасная иллюстрация линуксподхода во всей красе. Надо немедленно вкачать ещё бюджетных миллиардов в какого-нибудь забугорного производителя очередного дистрибутива с востребованностью «всем одноклассникам поставил». Только тогда в России будет всё с IT нормально. Ну, как в данном случае.

Реклама
Смертельная секунда

Смертельная секунда: 17 комментариев

    1. Есть ощутимая разница между «не знает, что делать» и «сделали так, что падает от предсказуемых действий, известных с 2007 года и являющихся штатными». Microsoft Lync, допустим, не все кодеки голосовые поддерживает — однако, если бы он ронял в BSoD систему от того, что ему приходил бы RTP-пакет, кодированный g.723/40k, это было бы совсем другое дело, нежели «просто не поддерживает». 🙂

  1. Немного не по теме, но:
    http://habrahabr.ru/post/146971/#habracut

    «Уважаемые пользователи, доводим до вашего сведения, что компания ООО «Оверсан-Меркурий» с 01 августа 2012 года прекращает оказание услуг по аренде вычислительных мощностей в облаке на базе технологии виртуализации Xen.

    Если Вы хотите продолжить пользоваться платформой Xen без перерыва и без изменения условий оказания услуг, мы можем предложить Вам перейти на обслуживание к нашему клиенту ООО «Клаудгейт Платформа», связаться с которым можно по электронной почте: sales@cloudgate.ru, либо телефону: +7 (495) 223-92-49. Также вы можете проконсультироваться у наших специалистов по вопросам переноса Ваших проектов на нашу облачную платформу на базе технологии Hyper-V.»

    1. Перед публикацией я пробежался по форумам и посмотрел, кто чаще пишет о проблемах — поэтому указал эти версии. Это не говорит о том, что в других версиях ядра такой проблемы нет.

      Кстати, на тему древности бага: http://linux.derkeiler.com/Mailing-Lists/Kernel/2007-07/msg00714.html

      Т.е. ещё в 2007 году уже стоял такой вопрос, т.к. уже были проблемы при манипуляции с leap second. Сейчас — 2012й. Во всех дистрибутивах, включая коммерческие, которые стоят в разы дороже Windows Server, встречается данная проблема. Что ещё добавить?

      Кстати, достаточно интересный момент, который открыто обычно не упоминается, к сожалению. Когда в Windows выходит очередной Service Pack, он всегда включает все вышедшие до себя обновления, т.е. является суммой Feature Pack + Update Rollup. Поэтому логика вида «это пофиксили в первом сервис-паке» — достаточно понятная, т.е. на момент выхода SP хотфиксов, не вошедших в него, нет. То ли дело в линуксе — там новое ядро — это обычно новый функционал, но совсем не обязательно ещё и фиксы. Поэтому достаточно интересно наблюдать за теми, кто пишет «а, это у ядра X, а у меня ядро ж более новое, всё, стопудово там это поправили, а кто не обновился просто лохи». Это, по сути, работает для Windows, а в случае линукса надо адресно проверять — там баг может висеть «несколько ядер подряд» и с ним ничего не смогут сделать.

      1. Кстати о версиях и багфиксах. Рекордом, насколько я знаю, является критическая уязвимость, незапатченная ни у кого, кроме одного вендора (и соответственно publicly disclosed).

        А вообще даже такой бардак не нужен, если они в бедном /proc/pid/mem не смогли пофиксить уязвимость за 7 попыток (а может попыток было и больше). Так что даже если патч принят в master — это еще не значит, что баг пофикшен — они ж не могут остановиться и ПОДУМАТЬ как сделать правильно — им еще уроки учить.

        1. > критическая уязвимость, незапатченная ни у кого, кроме одного вендора (и соответственно publicly disclosed

          …в течение 6 лет.

          Быстрофикс

    1. Увы, ещё достаточно много идиотов и просто начинающих в веб людей выбирает линукс для веба. Ничего не попишешь, так сложились в своё время карты и рынок недорогих пыхоплеядо-погроммистов. Страдают теперь вот. Жалко мне веб, вот где пустили метастазы питухи, так пустили. И ничего не поделать — сначала, по причине наличия огромного количества пыхоплеядо-исполнителей работающих чуть ли не за копейки делают проекты на связке пыхоплеяда+питухос+питухософт. Потом, когда нагруженность и посещаемость проекта вырастают до чуть больших, нежели у районного форума, проектов, приходится нанимать уже более дорогих пыхосеньоров и перебирать новомодные линуксфреймворки, линуксплатформы и линукстехнологии. Затем всё, порой, приходит к тому, что под сложившийся спагетти-код проекта пишется своя дорогущая и уникальная самописная платформа (в терминальных случаях, как у фейсбука, например, получается монстр вроде самопального компилятора из ПХП в нативный код через трансляцию в C++). В результате на проект уходит по факту масса денег. То есть линух технологии — это такая каша из топора, как в одноименной сказке. По окончанию эти «технологии» пропадают, и весь проект оказывается, по — сути, сделанным целиком с нуля силами самих участников проекта. Чуть ли не начиная с момента перехода из реального режима в защищенный, то есть с полностью переписанной своей ОС и прикладным софтом на базе того, что пару сотен тысяч патчей назад было линухом, кассандрой, майскулом, питоном, пыхом, руби и прочим линуксговном.

      А питухи, если такой проект, несмотря на все их усилия, выживает, радостно потом кукарекают про очередной линуксуспех очередного успешного и популярного highload — сервиса, сделанного ПОЛОНОСТЬЮНАЛИНУХТИХНАЛОГИЯХ.

      И, видимо, уйдет это еще не скоро, покуда отправной точкой очередной светлой идеи будет найм пхп-программиста на фрилансру (и англоязычных аналогах, беда, к сожалению, интернациональна) и выбор линуксхостинга/впса за 500 рублей.

      1. Мысль надо развить 🙂
        А то что-то мне подсказывает, что и на суперкомпьютерах из Топ-100, где якобы сплошь стоит Линукс, от Линукса только одно название осталось, а реально весь код уже давно переписан.

        1. ВНЕЗАПНО, кстати. Подкину в пользу этого достаточно простое наблюдение — крайне часто, когда на роутерах вместо фирменной закрытой ОС ставят какой-нибудь дд-врт, скорость падает в разы. Спрашиваешь — ну как же так, ведь Открытый Код, почему когда стояла фирменная, то ощутимо быстрее работало, в разы? Узнаёшь новую версию — мол, линукс-то стопудово быстрее работает, просто производитель встроил детектор, что там линь, и специально просаживает скорость. Спрашиваешь — ну, а зачем это ему, он же не ОСью торгует, а железом, ему лишь бы сбыт коробочек шёл, если из них можно выжать больше, то ему, производителю, это только на пользу. На тебя смотрят со школьным презрением — мол, взрослый, а не понимаешь, на какие гадости способны Враги Свободы!

          1. Ну я бы сказал, что сохо роутеры в большинстве своём то ещё говнецо вне зависимости от прошивки. Вот почему люди используют их в продакшене а не дома (хотя и дома с ними обычно не всё ладно — линукс же) — это другой вопрос.

          2. А их смысла нет делать не-говнецом — каждые 10 долларов к розничной цене являются приговором вида «на кой покупать за 45 баксов то, что можно купить за 35».

          3. Ну тут спорно, у меня противоположный опыт, хотя соглашусь дд-врт медленнее, я меня помидорка, всем устраивает кроме вялой поддержки IPv6 и отсутсвием гостевой сети для WiFi, опять же родные прошивки на том же линуксе и сделаны (т.е. по фатку там опенсоурсного когда — 50 более %).

Обсуждение закрыто.