HighLoad++ Awards

Премия присуждалась по совокупности заслуг перед российским IT. И судя по шорт-листу номинантов, еще и «по непрерывности» тех самых заслуг: кандидаты не первый год плотно занимаются высоконагруженными системами. Они создают инструменты, с помощью которых формируется инфраструктурная база для площадок и сервисов, которыми пользуются миллионы пользователей.

Номинантов отбирал экспертный совет HighLoad++ Awards, куда вошли все члены программных комитетов всех конференций «Онтико» за 2018 год — в общей сложности 78 человек. Активисты сообществ, разработчики продуктов и технологий, техдиректора и техлиды заметных проектов. Персоны, которые вправе выразить от своего лица street credibility — уважение и доверие со стороны круга людей, которые образуют становой хребет отрасли. После долгого отбора и верификации экспертный комитет выделил 22 номинанта, из которых выбрали шестерых лауреатов премии.
Сами победители были немногословны — то ли от волнения, то ли продолжая в уме прикидывать, как оптимизировать очередной кусок кода. Чтобы раскрыть достижения, за которые вручалась премия, мы предложили «закомментить» свою победу.
1. Олег Бартунов (PostgreSQL Professional)
Один из ведущих разработчиков PostgreSQL в России, профессиональный астрофизик. Занимается разработкой решений для систем управления базами данных. А осенью 2017 сделал невозможное: организовал для студентов МГУ лекцию легенды IT — Стива Возняка.
PostgreSQL рос вместе с конференцией, и она служила важным средством его популяризации. Затрудняюсь даже подсчитать, сколько на ней сегодня докладов по PostgreSQL. От меня и нас всех — алаверды: тамтам «с кожей DBA и разработчиков».
Олег Бартунов
PostgreSQL рос вместе с конференцией, и она служила важным средством его популяризации. Затрудняюсь даже подсчитать, сколько на ней сегодня докладов по PostgreSQL. От меня и нас всех — алаверды: тамтам «с кожей DBA и разработчиков».
Олег Бартунов
PostgreSQL рос вместе с конференцией, и она служила важным средством его популяризации. Затрудняюсь даже подсчитать, сколько на ней сегодня докладов по PostgreSQL. От меня и нас всех — алаверды: тамтам «с кожей DBA и разработчиков».
Олег Бартунов
— Чем для вас интересен Highload++ сегодня? Менялись ли точки интереса со времен первых конференций?
— Сегодняшний HighLoad, независимо от отношения к нему, — это наш 
российский бренд, который нельзя игнорировать. Это площадка, где ты 
обязан быть, если хочешь достучаться до айтишников. Первые конференции были больше технические, сейчас это скорее шоу, место встречи, выставка. Технические вопросы вытеснились в небольшие залы, на митапы. 
— Что ежегодное участие в конференции дало вашему проекту?
— Postgres рос вместе с конференцией. В частности, благодаря ей мы получили широкий канал доступа к айтишникам для его продвижения. Сейчас у нашего сообщества две свои большие конференции и митапы, но все равно HighLoad++ остается местом, где сообщество привлекает к себе новичков, поэтому тема PostgreSQL на конференции по-прежнему актуальна для нас. И очень хорошо, что конференция понимает важность PostgreSQL: в 2018 году он собрал докладов больше, чем о других БД.
— Какие основные изменения в сфере высоких нагрузок за последние пять лет вы видите по своему направлению? Что изменилось?
— Высокие нагрузки начинают появляться повсюду, не только у небольшой группы интернет-проектов. Крупные федеральные системы стали использовать PostgreSQL, уровень требований к производительности, к поддержке ощутимо повысился. 
— Чего вам самому пока недостает в отрасли, какие челленджи не закрыты?
— Главный вызов для нас — нехватка специалистов по нашему профилю. Понимая, что сетовать на проблему и ждать Министерства образования — это путь в никуда, мы с самого первого дня засели за создание учебных курсов. За эти годы мы практически решили задачу профессионального образования администраторов баз данных. Есть свободные курсы, которые читаем мы сами и образовательные центры. Подготовлено два вузовских курса, которые уже прочитали в МГУ и Вышке. Один курс вышел в виде книги, и ее уже можно купить, второй на подходе. Мы призываем все вузы использовать наши материалы и учить студентов на основе PostgreSQL. Все образовательные ресурсы доступны с нашего сайта. Мы подготовили программу профессиональной сертификации, что давно необходимо для отрасли, собираемся запустить в этом году. Наконец, идем к созданию магистерской программы по технологиям баз данных, но это долгий путь, и мы только сделали первые шаги. 
— Что из сделанного вами и вашими коллегами по сообществу вокруг PostgreSQL видится вам самым важным?
— Премия показала, что у нас в стране можно создавать технологии, которые используются во всем мире, что можно сделать карьеру, принимая участие в создании открытых технологий. Что касается конкретно PostgreSQL-сообщества, то самый важный результат работы моей и моих коллег — это создание самого сообщества, одного из самых крупных и профессиональных в российском IT. 
— Кто еще кроме шести лауреатов, с вашей точки зрения, заслуживает премии?
— Достойных много, но я бы выделил Александра Лямина, который немало сделал для хайлоад-сообщества.
— Что пожелаете участникам хайлоад-сообщества?
— Желаю «не сидеть ровно», наблюдая, как другие делают прорывные проекты и рассказывают о них со сцены, а дерзать самому. Насущных задач очень много, не говоря уже о цифровом будущем.
2. Константин Осипов (Tarantool)
Разработчик, основатель и руководитель проекта Tarantool. Руководитель подразделения разработчиков в Mail.ru Group.
Эта заслуга не только моя — всего сообщества вокруг Tarantool. Но сейчас я хочу поделиться тем, что меня по-настоящему вдохновляет. Недавно мне поступил запрос от пользователя: «База данных внезапно перестает обрабатывать запросы после такого-то сообщения об ошибке». А такого не должно быть. Начал разбираться. Через четыре часа после переписки мой собеседник добавил: «Я просмотрел все логи и кое-что заметил. Перед тем как уйти в аут, она принимает соединение от 768 реплик. Тебе это число ни о чем не говорит?» — «Так вот в чем дело! Конечно, говорит!» Вот эта лояльность нашему продукту меня и драйвит. Масса пользователей уверена, что Tarantool им важен и нужен, пусть даже он не идеален, пусть даже на свете есть Postgres.
Константин Осипов
Эта заслуга не только моя — всего сообщества вокруг Tarantool. Но сейчас я хочу поделиться тем, что меня по-настоящему вдохновляет. Недавно мне поступил запрос от пользователя: «База данных внезапно перестает обрабатывать запросы после такого-то сообщения об ошибке». А такого не должно быть. Начал разбираться. Через четыре часа после переписки мой собеседник добавил: «Я просмотрел все логи и кое-что заметил. Перед тем как уйти в аут, она принимает соединение от 768 реплик. Тебе это число ни о чем не говорит?» — «Так вот в чем дело! Конечно, говорит!» Вот эта лояльность нашему продукту меня и драйвит. Масса пользователей уверена, что Tarantool им важен и нужен, пусть даже он не идеален, пусть даже на свете есть Postgres.
Константин Осипов
Эта заслуга не только моя — всего сообщества вокруг Tarantool. Но сейчас я хочу поделиться тем, что меня по-настоящему вдохновляет. Недавно мне поступил запрос от пользователя: «База данных внезапно перестает обрабатывать запросы после такого-то сообщения об ошибке». А такого не должно быть. Начал разбираться. Через четыре часа после переписки мой собеседник добавил: «Я просмотрел все логи и кое-что заметил. Перед тем как уйти в аут, она принимает соединение от 768 реплик. Тебе это число ни о чем не говорит?» — «Так вот в чем дело! Конечно, говорит!» Вот эта лояльность нашему продукту меня и драйвит. Масса пользователей уверена, что Tarantool им важен и нужен, пусть даже он не идеален, пусть даже на свете есть Postgres.
Константин Осипов
— Чем для вас интересен Highload++ сегодня? Менялись ли точки интереса со времен первых конференций?
— Честно говоря, мне HighLoad++ времен первых конференций был неинтересен. В 2008–2009 годах я убегал сразу после выступления: тогда я был в команде MySQL и рассказывал о нем. Десять лет спустя конференция может позволить себе пригласить действительно глубоких докладчиков, на которых интересно ходить. Пока, правда, в основном это докладчики западные, иногда с русскими корнями. Надеюсь, в дальнейшем мы будем находить и вытаскивать на конференцию больше наших звезд. 
— Что ежегодное участие в конференции дало вашему проекту?
— Три главных канала роста сообщества Tarantool — это Хабр, HighLoad++ и Mail.ru alumni. Этим все сказано. Лично я благодаря конференции понял, что мне как докладчику есть куда расти. Надеюсь, вырос, хотя до лучших спикеров HighLoad++ мне точно еще далеко.
— Какие основные изменения в сфере высоких нагрузок за последние пять лет вы видите по своему направлению? Что изменилось?
— Хайлоада в понимании ранних 2010-х больше нет. С одной стороны, средний сайт с достаточно высокими нагрузками можно сделать на стандартном железе и с помощью стандартного на текущий момент стека технологий. С другой — решения из интернет-индустрии все глубже проникают в классические компании, происходит пресловутая цифровизация. А технологические изменения очевидные, их конференция отражает в полной мере: Docker, Ansible, Kubernetes, Go. Технологический ландшафт стремительно меняется. Создавать и эксплуатировать решения становится проще, чем когда-либо. Хайлоад разросся в множество конференций: Backend Conf, DevOpsConf и т. д. Добавлю, что практически ни один большой проект в наши дни нельзя представить без анализа данных и машинного обучения; как и блокчейн, это специфика сегодняшнего дня.
Я вижу, что main memory databases, и в частности Tarantool, становятся повседневностью. Другое дело, что их разработчики многому научились: например, стало понятно, что без классических систем хранения все равно не обойтись.
— Чего вам самому пока недостает в отрасли, какие челленджи не закрыты?
— Чего мне недостает, так это такого Tarantool, каким он должен стать. Все то же, что есть сегодня, но более простое в использовании и управлении. Что до отрасли, у нас и впрямь беда с открытыми аналитическими СУБД: лично я не знаю ничего, кроме Greenplum и ClickHouse. Последний на правильном пути; им, правда, стоит серьезнее отнестись к ANSI, к поддержке ANSI SQL.
— Была ли переломная точка, по достижении которой стало ясно, что Tarantool взял какую-то качественную планку? В каком направлении собираетесь развивать проект?
— Вряд ли в жизни Tarantool была такая точка. Проект — это результат постоянных усилий, которые совершает большая группа людей. Думаю, это верно для 95% технологий и звездных проектов, но для проектов в таких высококонкурентных областях, как наша, в особенности. Открытое ПО — это марафонский забег, и всем, кто пытается связать с ним свою карьеру, нужно быть психологически готовыми к таким нагрузкам.
Однажды мы сумели «переизобрести» Tarantool — с выпуском версии 1.6. На мой взгляд, она сделала саму идею сервера приложений гораздо доступнее, в ней мы добавили полноценную поддержку модулей. В последние два года мы очень сильно вкладывались в возможности, которые еще мало где используются, — в новую подсистему хранения данных Vinyl и поддержку языка SQL. Многие возможности из нашего road-map могут показаться незначительными. В основном это «улучшения» существующих больших фич. Основной фокус нашей работы — сделать так, чтобы продуктом было проще пользоваться большему числу людей.
— Кто еще кроме шести лауреатов, с вашей точки зрения, заслуживает премии?
— С моей точки зрения, премией отмечали в первую очередь не людей, а проект. В этом смысле для меня на первом месте Kotlin, премию за который надо дать, судя по всему, Андрею Бреславу.
3. Максим Лапшин («Эрливидео»)
Основатель одного из по-настоящему передовых проектов на основе искусственного интеллекта. Автор продукта, который в реальном времени позволяет распознавать лица людей на видеозаписи. Основатель одного из первых сервисов видеостриминга Flussonic.
Чтобы развиваться, мне нужно было начать трансформацию из человека, который делает то, за что ему платят деньги, в человека, который делает то, что нужно другим людям. Это невероятно — делать то, чем пользуются миллионы человек по всему земному шару. И понимать, что ты сделал нечто лучше миллионов других людей. Здесь несомненна и заслуга той экосистемы, которую строят организаторы HighLoad++ вместе с теми, кто сидит в зале.
Максим Лапшин
Чтобы развиваться, мне нужно было начать трансформацию из человека, который делает то, за что ему платят деньги, в человека, который делает то, что нужно другим людям. Это невероятно — делать то, чем пользуются миллионы человек по всему земному шару. И понимать, что ты сделал нечто лучше миллионов других людей. Здесь несомненна и заслуга той экосистемы, которую строят организаторы HighLoad++ вместе с теми, кто сидит в зале.
Максим Лапшин
Чтобы развиваться, мне нужно было начать трансформацию из человека, который делает то, за что ему платят деньги, в человека, который делает то, что нужно другим людям. Это невероятно — делать то, чем пользуются миллионы человек по всему земному шару. И понимать, что ты сделал нечто лучше миллионов других людей. Здесь несомненна и заслуга той экосистемы, которую строят организаторы HighLoad++ вместе с теми, кто сидит в зале.
Максим Лапшин
— Чем для вас интересен Highload++ сегодня? Менялись ли точки интереса со времен первых конференций?
— Точки интереса в рамках конференции у меня, конечно же, меняются. На первых HighLoad я интересовался докладами с прицелом на то, могу ли я сам сделать нечто подобное и использовать полученные знания на практике. Потом привлекали прикладные решения, которые могут пригодиться моим коллегам. Сейчас мне любопытны не столько технические вопросы, сколько выстраивание отношений с коллегами и управлением бизнесом.
— Что ежегодное участие в конференции дало вашему проекту?
— Конференции — и HighLoad++, и РИТ++ — меняют ландшафт индустрии. Благодаря им меняется и то, как мыслят люди в них: вижу по тем, кто находится вокруг меня, и по тому, как трансформируется мой собственный mindset. Мне очень нравится, что у Олега и команды получается сводить вместе людей из разных миров. Например, они привлекают представителей мира бизнеса — не в таких количествах, как на каком-нибудь РИФ+КИБ, но в достаточных для того, чтобы айтишники могли приобщиться к новым для них взглядам на создание продукта.
— Какие основные изменения в сфере высоких нагрузок за последние пять лет вы видите по своему направлению? Что изменилось?
— Пожалуй, «Эрливидео» находится в стороне от глобальных хайлоад-трендов. Сегодня для всей индустрии высоконагруженных веб-систем главное — возможность быстро масштабироваться, быть готовым к внезапным всплескам нагрузки. У нас в «Эрливидео» другая ситуация. Нам как создателям софта приходится жить в парадигме «хватит масштабироваться, пора работать». Такой подход многие считают устаревшим, хотя, по-моему, опыт того же ClickHouse свидетельствует о том, что хоронить умение программировать рановато. Когда появляется возможность использовать то же железо в пять раз эффективнее, нам становится интересно, как это сделать, хотя ничто не мешает пропорционально отмасштабировать аппаратные мощности. Мы тоже занимаемся масштабированием нагрузок (в силу специфики нашей предметной области это не слишком проблематично), но для нас актуальнее повышение performance на одном отдельно взятом компьютере.
— Была ли переломная точка, по достижении которой стало ясно, что продукт «Эрливидео» взял какую-то качественную планку?
— Приятным для нас маркером доверия пользователей был тот факт, что в 2011 году без какого-либо влияния с нашей стороны, без пресейла наш продукт выбрал крупный оператор вместо решения Hikvision. Важные для нас победы случались и раньше, но эта запомнилась особенно. 
На мой взгляд, самое значимое из достигнутого «Эрливидео» — то, что мы сумели найти баланс между тем, что хорошо бы сделать, и тем, что нужно людям, и сохранили притом качество софта.
— Чего вам самому пока недостает в отрасли, какие челленджи не закрыты?
— На рынке очень грустная ситуация в отношении того, насколько мы, программисты, умеем делиться знаниями и умениями друг с другом. Например, придумали механику asset pipeline на Rails, и в 2011–2012 году о ней начали выходить статьи в американских блогах, о ней раструбили по всему миру. А я смотрю на нее и понимаю, что в 2008 на пару с фронтэндером сделал практически то же самое за месяц, но мы ничего не публиковали, не донесли до коллег ценность того, что создали. У нас в России сейчас более скептичны к новшествам, чем в американском IT-сообществе. На HighLoad++, бывает, кто-то предлагает решение, а из зала парируют: «Эка невидаль! Мы такое еще три года назад соорудили». На самом деле это лишь показатель того, насколько плохо мы доносим информацию друг до друга. Если ты делаешь что-то важное и крутое, расскажи. Если сделал мелкую, но полезную фичу, сформулируй, в чем ее суть, упакуй и расскажи. Площадка-то есть — тот же HighLoad++, другие конференции. У нас огромное количество талантливых людей со своими знаниями оказываются, в сущности, нигде. А ведь умение делиться наработками (и кстати, через них подавать себя) движет отрасль вперед. Вот в сфере deep learning люди очень живо обмениваются знаниями, поэтому она быстро развивается.
— Кто еще кроме шести лауреатов, с вашей точки зрения, заслуживает премии?
— Все люди в списке номинантов премии круты. Кому бы еще следовало дать премию, сложно сказать. Но если отталкиваться от той проблемы, которую я упомянул, — трудностей с обменом знаниями в сообществе, — то лучшим контрпримером к ней служит, по-моему, Андрей Ситник. Он наглядно показывает, как человек может доносить до других то, в чем он преуспевает.
— Что пожелаете участникам хайлоад-сообщества?
— Хочу пожелать всем участникам HighLoad++ большей открытости, готовности к коммуникации: это залог развития open source. И не только его. У многих крупных компаний есть закрытые продукты, которые лежат мертвым грузом и в конечном счете тянут бизнес вниз. Сегодня все мы строим бизнес на open source, это основа индустрии. А он живет лишь там, где приветствуются открытость и готовность к коммуникации. РИТ++ и HighLoad++ как раз те площадки, на которых мы можем обмениваться смыслами, идеями и ценностями.
4. Андрей Аксенов (Sphinx)
Основатель и главный разработчик Sphinx — одного из лучших решений для организации поиска на сайте, которое отличается высокой скоростью индексации данных и выполнения запросов. Среди прочего на Sphinx работает поиск на Хабре, Wikimapia и других популярных высоконагруженных площадках. В 2011 году издательство O’Reilly выпустило книгу Андрея «Introduction to Search with Sphinx».
О том, что мне присуждена премия, я узнал, когда невозвратные билеты из Москвы на пляж были куплены, а оплачивать мне приватный джет до Москвы Олег почему-то отказался. Большое спасибо организаторам конференции за то, что 12 лет проводят ее для нас со все большим размахом и все более высоким качеством. А посетителям HighLoad++ желаю жечь так, чтобы ушанка заворачивалась, фуфайка пропотевала и премию в следующем году вручали вам.
Андрей Аксенов
О том, что мне присуждена премия, я узнал, когда невозвратные билеты из Москвы на пляж были куплены, а оплачивать мне приватный джет до Москвы Олег почему-то отказался. Большое спасибо организаторам конференции за то, что 12 лет проводят ее для нас со все большим размахом и все более высоким качеством. А посетителям HighLoad++ желаю жечь так, чтобы ушанка заворачивалась, фуфайка пропотевала и премию в следующем году вручали вам.
Андрей Аксенов
О том, что мне присуждена премия, я узнал, когда невозвратные билеты из Москвы на пляж были куплены, а оплачивать мне приватный джет до Москвы Олег почему-то отказался. Большое спасибо организаторам конференции за то, что 12 лет проводят ее для нас со все большим размахом и все более высоким качеством. А посетителям HighLoad++ желаю жечь так, чтобы ушанка заворачивалась, фуфайка пропотевала и премию в следующем году вручали вам.
Андрей Аксенов
— Чем для вас интересен Highload++ сегодня? Менялись ли точки интереса со времен первых конференций?
— Мне лично HighLoad++ интересен тем, насколько он релевантен состоянию отрасли. Каждый год фронтир в IT сдвигается, возникают и становятся популярными новые технологии, и именно HighLoad++ дает актуальный на текущий момент срез фронтира. Мне конференция дала общение, расширение кругозора, прикладные знания, в конце концов, регулярные встречи с коллегами по индустрии, — все то, для чего конференции на самом деле-то и нужны.
— Какие основные изменения в сфере высоких нагрузок за последние пять лет вы видите по своему направлению? Что изменилось?
— Касательно положения дел в нише поисковых решений все очевидно: Elastic Search получил инвестиции, освоил их, всех — то есть весь Solr — победил и, наконец, недавно вышел на IPO. В плане технологическом мне видится, что люди-таки начинают интересоваться машинным обучением в приложении к поиску, «но это неточно». В остальном, как ни странно, ничего по-настоящему революционного на пятилетнем интервале я не наблюдаю.
— Была ли переломная точка, по достижении которой стало ясно, что продукт Sphinx взял какую-то качественную планку? В каком направлении собираетесь развивать проект?
— Наверное, какого-то мегапрорыва — «перелома хоккейной клюшки» — в развитии Sphinx не случилось. Было несколько важных вех. В личном плане один из значительных переломов произошел в начале пути, когда я решился уйти с фултайм-работы и заняться проектом всерьез. 
Sphinx сегодня и близко не номер один в своей нише, поэтому более важным мне кажется не то, что сделано, а, наоборот, несделанное. Честно говоря, мы проиграли неявкой «битву за облако», а зря, да и с точки зрения простоты эксплуатации Sphinx оставляет желать лучшего. Поэтому в среднесрочной перспективе сделаем фокус на этих двух направлениях. Конкретных фич, и рефакторов, и даже местами технологий в рамках общего road-map плюс текущих задач у нас масса — надеюсь, скоро увидите сами.
— Чего вам самому пока недостает в отрасли, какие челленджи не закрыты?
— Нерешенные глобальные челленджи в индустрии, по-моему, скорее про людей, чем про технологии. 
Приведу по одному примеру из достаточно больших, если задуматься, списков. Условно говоря, некоей «организационной», совсем общей базовой шкалы навыков не хватает больше, чем какого-то «технического» инструмента наподобие анализатора кода. Как, даже и в одиночку, взять и решить небольшую глупую техническую проблемку «Почему-то в 2018 года нет решения для поиска orphaned methods в проекте на C++?», если будет очень-очень надо, я отлично понимаю. А вот взять, выработать и затем выдержать внятный стандарт «Что должен знать и уметь настоящий junior developer» — всей индустрией поди осиль. Примеры, подчеркну, отдельные и не самые насущные, просто первое, что в голову пришло за минуту.
— Что пожелаете участникам хайлоад-сообщества?
— Участникам сообщества пожелаю оставаться участниками и людьми. Продолжать создавать новое и делать мир лучше, в идеале — не только для себя.
5. Алексей Миловидов (ClickHouse)
Разработчик ClickHouse, системы управления базами данных, используемых в «Яндекс.Метрике». ClickHouse может масштабироваться до десятков триллионов записей и петабайтов данных.
На мой взгляд, то, что вы тут сегодня устроили, даже как-то слишком круто. Но вот что меня беспокоит: осталась одна статуэтка — и осталась уйма людей, которые гораздо больше достойны ее.
Алексей Миловидов
На мой взгляд, то, что вы тут сегодня устроили, даже как-то слишком круто. Но вот что меня беспокоит: осталась одна статуэтка — и осталась уйма людей, которые гораздо больше достойны ее.
Алексей Миловидов
На мой взгляд, то, что вы тут сегодня устроили, даже как-то слишком круто. Но вот что меня беспокоит: осталась одна статуэтка — и осталась уйма людей, которые гораздо больше достойны ее.
Алексей Миловидов
Осторожно: гора ценного для DBA и разработчиков СУБД шок-контента!
— Чем для вас интересен Highload++ сегодня? Менялись ли точки интереса со времен первых конференций?
— Впервые интерес к конференции у меня возник, когда я посмотрел некоторые доклады с РИТ++ 2007. Там Игорь Сысоев рассказывал про nginx, Андрей Аксенов про Sphinx, а Федор Сигаев про PostgreSQL. Я всегда мечтал попасть на эту конференцию, а представления о том, что там еще и выступить можно, даже не возникало. Больше всего меня увлекают доклады о том, как кто-то открывает свою технологию. Для примера: в 2017 году мне понравились доклад Леонида Юрьева про «Позитивные таблицы» и доклад Олега Герасимова про систему Reindexer. Хотя я не буду пользоваться ни той, ни другой технологией, но в репозиторий зашел и приметил по крайней мере несколько интересных штук. Также мне по душе доклады, в которых честно описывают инфраструктуру компании так, что эта инфраструктура выглядит понятной. Особенно когда рассказывают о решении проблем, не объясняя все подряд «высокими нагрузками», «огромными объемами данных» и «нашими масштабами».
— Что участие в конференции дало вашему проекту?
— На HighLoad++ 2016, всего лишь через несколько месяцев после выкладки ClickHouse в open source, мой коллега Виктор Тарнавский решил написать маркером на одной из комнат о том, что там состоится ClickHouse Meetup. Результат оказался ошеломляющим: три часа подряд мы разговаривали с огромным количеством замечательных людей и на второй день конференции это повторили. С тех пор я не боюсь проводить ClickHouse Meetup: мы организовали уже 19 мероприятий в разных городах России и мира.
— Какие основные изменения в сфере высоких нагрузок за последние пять лет вы видите по своему направлению? Что изменилось? 
— Постепенно NoSQL решения становятся более зрелыми: в MongoDB появились транзакции, в Tarantool добавили поддержку SQL. А реляционные СУБД уверенно отнимают часть ниши NoSQL. Это происходит довольно медленно.
Несколько лет назад на каждом HighLoad были доклады о том, как кому-то пришлось внутри своей компании написать специализированную column-oriented базу данных для аналитики. Мне тоже удалось в этом поучаствовать и, возможно, в некотором смысле закрыть вопрос.
— Чего вам самому пока недостает в отрасли, какие челленджи не закрыты?
— В индустрии еще много чего не хватает. Скажем, отсутствует распределенная горизонтально масштабируемая open source multi-tenant реляционная OLTP СУБД, которой можно было бы пользоваться без проблем на существенном масштабе. Ближайший кандидат на эту роль — TiDB; также есть CockroachDB, но всерьез их пока мало кто воспринимает. В Google и «Яндексе» есть свои закрытые разработки.
Нет распределенной key-value базы данных, которая была бы оптимизирована для хранения данных на SSD, поддерживала приличный уровень сжатия данных, подходила для мелких объектов (начиная с десятка байт), давала возможность обрабатывать объекты хранимыми процедурами на native-коде, например для CRDT, и выдавала столько RPS, сколько есть IOPS. Для примера: Aerospike требует 128 байт оперативки на ключ, и это неприемлемо. В качестве кандидатов хотелось бы рассмотреть ScyllaDB и Tarantool, но у меня есть сомнения. Спрос огромный — в основном для рекламных систем и для того, чтобы следить за пользователями, и со временем должен только увеличиваться.
На мой взгляд, еще не полностью решен вопрос с хранилищем данных для количественного мониторинга. Здесь хорошо подходит ClickHouse, хотя система вовсе не заточена именно под временные ряды, но лучше как будто ничего нет. Такие системы, как InfluxDB и TimescaleDB, просто недоработаны, и ими стыдно пользоваться. Надо обратить внимание на VictoriaMetrics — очень молодой проект, который сделан специально для временных рядов и использует технические приемы из ClickHouse. В «Яндексе» есть внутренняя система Stockpile, которая на данных мониторинга может работать эффективнее ClickHouse.
Как-то не видно и хороших open source систем для эффективной аналитической обработки больших массивов geospatial-данных. Это очень важно для connected cars, smart cities и прочих buzzwords.
Нормальных HTAP (Hybrid Transactional / Analytical Processing) систем также не существует. Пока что все, кто себя так называет, не умеют делать хорошо и то и другое.
Отсутствуют хорошие POSIX-совместимые распределенные файловые системы. Нет хорошего open source Network Block Storage с erasure encoding, подходящего для использования в облаках.
Вроде бы до недавнего времени не было горизонтально масштабируемой open source strict consistent key-value базы с multi-key deterministic транзакциями хотя бы уровня ZooKeeper (или мне надо все-таки почитать подробнее про FoundationDB).
— В каком направлении собираетесь развивать проект? 
— В развитии ClickHouse наиболее важны для нас два принципа. Первый — это фокусировка на основном продуктовом свойстве, то есть скорости обработки аналитических запросов. Второй — это стремление быть примером open source продукта, наиболее дружественного по отношению к пользователям и контрибьюторам. Такого, чтобы каждый мог принять участие в его создании, внести свой вклад и научиться чему-то новому.
Крупные направления нашей работы в настоящее время: совместимость SQL диалекта и развитие JOIN; управление пользователями и правами доступа; правильное разделение ресурсов между запросами. В архитектурном плане решается задача изменения конвейера выполнения запроса, анализа и оптимизации запросов.
— Кто еще кроме шести лауреатов, с вашей точки зрения, заслуживает премии? 
— Есть один человек, который сначала работал в компании SpyLog над системой веб-аналитики (то был двоюродный дедушка «Яндекс.Метрики») и мучил там MySQL. Потом он научился мучить MySQL настолько хорошо, что написал об этом книгу, которая стала настольной для целого поколения разработчиков и DBA, а все, кто искал информацию об оптимизации MySQL, так или иначе попадали в его блог. Потом он основал компанию в США, которая сейчас является лидером в MySQL-экспертизе, и в этой области с ними пока не может конкурировать даже корпорация на букву O. Его компания делится своими наработками в open source, проводит конференции по open source базам данных и, возможно, вносит решающий вклад в развитие некоторых из них. Я люблю говорить загадками, но вы прекрасно понимаете, о ком я говорю.
— Что пожелаете участникам хайлоад-сообщества? 
— Как сделать доклад на HighLoad++? Можно взять любую систему, которую вы используете, и попробовать рассмотреть то, как она работает, во всех деталях. А когда детали (свалка нелепых наслоений) будут ясны, попробовать их рассмотреть с разных сторон и попытаться найти какие-то фундаментальные принципы, аналогии и взаимосвязи. Обычно материала набирается более чем достаточно, и вы еще долго не сможете закрыть вкладки в браузере.
6. Игорь Сысоев (nginx)
Создатель веб-сервера nginx, который получил широчайшее распространение без какого-либо пиара. Работа над проектом началась в 2002 году, когда Игорь работал системным администратором в «Рамблере», и почти весь код он писал в одиночку. Под данным Netcraft, на февраль 2018 года число сайтов, обслуживаемых nginx, превышало 447 млн.
Спасибо.
Игорь Сысоев
Спасибо.
Игорь Сысоев
Спасибо.
Игорь Сысоев
Игорь — человек насколько продуктивный и важный для российского хайлоада, настолько и непубличный. Как было сказано в видеопрезентации на церемонии, у него нет и никогда не будет секретарши и отдельного кабинета. Так что пусть достижения nginx и комьюнити вокруг него говорят вместо Игоря.