Потребность в оперативной экономической информации сегодня крайне велика: происходящие перемены, итоги и актуальные процессы требуют анализа и реакции, основанной на точных данных. О том, как устроен процесс производства этих данных и какими будут источники статистики в будущем, «Лента.ру» поговорила с Николаем Корженевским, экспертом в сфере макроэкономического анализа и работы с большими данными. В 2009 году он разработал и начал преподавать собственный курс в Высшей школе экономики, а в 2013 году возглавил Центр экономического прогнозирования Газпромбанка. Николай вел колонку в журнале Forbes Russia, опубликовал ряд авторских статей в авторитетных академических изданиях, посвященных финансам. Публичную известность Корженевскому принесли его программы на РБК-ТВ и России-24. Более десяти лет в прямом эфире он анализировал главные экономические события, многократно выступал модератором на Санкт-Петербургском экономическом форуме (ПМЭФ), Всемирном экономическом форуме в Давосе (WEF) и других крупнейших дискуссионных площадках. В феврале 2020 года Корженевский основал оригинальный проект СберИндекс, который стал критически значимым источником информации о состоянии потребительского спроса и бизнеса в России во время пандемии COVID-19.
«Лента.ру»: Николай, вы создали СберИндекс — уникальный проект, который занимается превращением больших данных в классическую макроэкономическую статистику. Буквально за два года он стал незаменимым источником информации и для общества в целом, и для принятия управленческих решений в частности. Как возникла эта идея?
Николай Корженевский: Больше десяти лет моим основным занятием была финансовая журналистика, которая требует анализировать всю доступную макроэкономическую информацию. И со временем стало очевидно, что доступно намного меньше, чем хотелось бы. Статистики вообще много не бывает, но здесь стали понятны конкретные проблемные зоны.
Во-первых, периодичность официальных данных и специфика методологий часто не позволяют добраться до некоторых важных выводов. Во-вторых, эти источники иногда достаточно свободно подходят к тому, чтобы прекратить публиковать или радикально изменить какой-нибудь критический набор данных. Классический пример — месячные оперативные оценки инвестиций и располагаемых доходов от Росстата. Их «убили» в 2016 году — и с тех пор этих цифр очень не хватает. В-третьих, есть проблема частых и существенных пересмотров данных. Сложно работать, когда картину экономической реальности значимо перерисовывают задним числом.
Это наиболее общие соображения, но их было достаточно, чтобы всерьез задуматься над решением проблемы. Я много лет преподавал в Высшей школе экономики, и в 2018 году началось мое академическое сотрудничество со Сбербанком по направлению анализа больших данных. А в 2020-м это выделилось в самостоятельный проект под названием СберИндекс.
Разработка собственной системы макроэкономических показателей — определенно очень амбициозная задача. Сколько времени потребовалось на то, чтобы реализовать ее на практике?
Самым сложным было разработать именно аналитическую часть. Ведь наверняка все хотели бы получать собственные экономические оценки, но проблема именно в том, что любая — даже крупная — компания «видит» только часть большой экономики. И главный научный вызов состоял в том, чтобы переходить именно к общей картине. Разработка этой части началась, как только мы получили первые данные в 2018 году. А первые результаты очень удачно появились ровно к началу пандемии COVID.
Вторая проблема в проектах такого рода — технологическая часть, и здесь нам очень повезло со Сбером. Принято считать, что СберИндекс получился потому, что банк занимает некую доминирующую позицию, собирает очень много данных, и их просто достаточно, чтобы судить обо всей экономике. Это неверно. Ключевая вещь — это технологическая инфраструктура, то есть хранилища big data, системы обработки и так далее. Конечно, открытия есть только там, где есть данные. Но это не должна быть огромная свалка данных, это должны быть качественные, консистентные массивы.
Сбер с 2008 года очень активно инвестировал в такие системы, и поэтому у нас получился результат, заслуживающий доверия. А вообще для производства таких оценок может быть достаточно и относительно небольшой доли рынка — условно, любого крупного банка, причем как в России, так и за ее пределами.
Насколько много смысла остается в прогнозах, в условиях, когда ситуация зависит от политических или геополитических — не экономических — факторов? Насколько неблагодарное занятие сейчас приводить какие-то конкретные цифры или выступать с ожиданиями, если все может измениться в одну минуту по внешним причинам?
В России неправильная культура восприятия прогнозов. О них нужно думать как о сценариях. Основной прогноз — это сценарий с наибольшей вероятностью.
Когда создано несколько вероятных образов будущего, можно подготовиться к тому или иному событию. Такие упражнения критически необходимы в ситуации непонятного воздействия внешних факторов.
Но, честно говоря, мне хорошо понятен скептический настрой вашего вопроса. Именно поэтому СберИндекс всегда занимался наукастингом (от англ. nowcasting) — то есть максимально оперативной оценкой происходящего сейчас. У проекта не было задачи прогнозировать, идея заключалась в том, чтобы нарисовать максимально полную и точную, чтоб не пересматривать десять раз, картину настоящего.
СберИндекс стал принципиально новым источником макроэкономических данных в России. Основное его преимущество — оперативность при низкой ошибочности оценок. К примеру, объем потребительских расходов, совершенных в 2022 году, будет известен вам уже 1 января 2023 года. Это настолько беспрецедентно, что даже Центральный банк периодически приводит данные проекта в основной публикации — «Отчете о денежно-кредитной политике». Но все же такой ресурс — это инструмент для аналитиков, или целевая аудитория может быть шире?
Хороший вопрос, и спасибо за такую характеристику проекта. Если отвечать честно, то, кажется, спрос на собственно экономические данные достаточно ограничен. Массовому потребителю нужна интерпретация, поэтому СберИндекс публиковал комментарии по наиболее сложным и спорным вопросам. Статистику нужно объяснять, тем более что мы хорошо понимали, что же там в цифрах.
Но подлинная ценность — это, конечно же, сами данные СберИндекса, которые стали источником нового знания. Экономисты и аналитики получили возможность максимально оперативной оценки происходящего, в большинстве случаев с задержкой в один-два дня. Почему это важно? Потому, что дает понимание происходящего в режиме практически реального времени и, соответственно, позволяет вырабатывать максимально оперативные управленческие решения. Вы привели пример ЦБ — и да, это действительно было высочайшим признанием. Но и конкуренты банка достаточно быстро инкорпорировали наши данные в свои аналитические модели. Крупнейшие СМИ и бизнес тоже стали активными и постоянными пользователями ресурса.
Так что непосредственно сайтом и услугами СберИндекса, наверное, всегда будет пользоваться в основном профессиональное сообщество. Но через это сообщество данные распространяются на огромную аудиторию.
В процессе подготовки к интервью я попыталась найти какие-то иностранные аналоги СберИндекса, но ничего не обнаружила. Как в мире обстоят дела с подобными системами — со статистическими сведениями не от государства, не от международных организаций?
Давайте сразу разделим статистические ресурсы на два типа: производителей данных и агрегаторов данных. СберИндекс, конечно же, относится к производителям. Полноценных аналогов нет. Столько разнообразных данных не производит ни одна из частных компаний. Во-первых, наши алгоритмы являются достаточно универсальными и позволяют эффективно обрабатывать массивы самой разной природы — от потребительских расходов до заработных плат или, скажем, туристических трат. Во-вторых, в нашем распоряжении действительно оказались уникальные данные, которые почти никогда не доступны традиционным статистическим организациям.
Если же говорить только о потребительских расходах, то есть схожий проект от испанского BBVA, а также стартап под названием tracktherecovery.org, основанный Гарвардским университетом, университетом Брауна и Фондом Билла и Мелинды Гейтс. И там, и там можно посмотреть на состояние потребления в соответствующих экономиках, примерно в тех же разрезах, что и на СберИндексе.
Но СберИндекс обладает принципиальным преимуществом. Вся производимая статистика гармонизирована со стандартами МВФ, Всемирного банка и так далее. То есть цифры в целом должны совпадать с тем, что потом, с задержкой, опубликуют официальные источники. Это сильно упрощает понимание данных и пользование ими. Экономическому сообществу не пришлось привыкать к каким-то новым цифрам с непонятной спецификой, и успех во многом был обеспечен именно этим.
На одном из экономических форумов вы говорили, что на горизонте десяти лет большие данные станут основным источником статистики. Означает ли это, что возможна какая-то новая революция — вроде той, импульс которой задала цифровизация, — и что она с собой принесет?
Пожалуй, стоит говорить не о революционных, а о быстрых эволюционных изменениях. Эволюция — непрекращающийся процесс. Прогресс происходит постоянно и стремительно. И да, я убежден, что на горизонте десяти лет большие данные станут основным способом получения львиной доли макростатистики. Это дешевый, оперативный и эффективный способ.
Не все осознают, но данные об инфляции в России по сей день появляются очень примитивно. Группа людей ходят по магазинам с блокнотиком и записывает цены. Предположу, что потом это переносится в какой-нибудь Excel, консолидируется — и получается индекс потребительских цен. Наилучшее ли это решение? Конечно же нет. Есть как минимум две технологичные альтернативы: данные кассовых аппаратов и данные онлайн-магазинов, где продается уже практически все. И те, и другие пока сложно использовать — там типичные проблемы зашумленности больших данных, но этот вопрос совершенно точно будет решен.
У оценок потребительской активности от СберИндекса, кстати, есть серьезный государственный конкурент — это данные Федеральной налоговой службы по обороту кассовых терминалов, которые пока являются закрытыми. Следует отдать должное налоговой: ведомство сумело реализовать сложные технологические решения. Думаю, что это общий тренд, и Росстат рано или поздно тоже оцифрует основные первичные источники.
Исчезнут ли при этом сотрудники, списывающие циферки с ценников? Надеюсь, что хотя бы в ближайшие пять лет не исчезнут. Нужно убедиться, что ряд по инфляции будет непрерывным и цифровые инновации не создадут в нем какого-нибудь структурного разрыва. Это отдельный пример, но логика распространяется на всю отрасль.
В последние годы много говорилось о русском платежном чуде — стремительных темпах проникновения карточных платежей, безналичных расчетов. Насколько это изменило те объемы данных, которые стали доступны для анализа, и сделало каждого из нас более прозрачным для бизнеса и государства?
Люди с большим удовольствием становятся прозрачными, если это создает удобства. Когда вы в последний раз вчитывались в условия какого-нибудь приложения в части передачи ему ваших данных?
Секретность и приватность — быстрые жертвы лени и удовольствий.
И безналичные платежи представляют собой как раз такой случай. Они создают принципиально новый уровень удобства, от которого никто уже не откажется.
Со стороны банка хранение информации о транзакциях является в первую очередь бизнес-необходимостью. Практически каждый человек хотя бы раз в жизни оспаривал транзакцию. Например, сумма случайно была списана дважды, что-то не проходило или вообще мошенники украли данные карты. Чтобы разбираться с такими ситуациями, компании обязаны вести базу данных всех операций. Мне сложно представить мир, в котором такой базы вообще не существует, так что всерьез обсуждать это бессмысленно.
Коль скоро такие данные есть, почему бы не получить от них дополнительную пользу? В случае СберИндекса — в виде той же макроэкономической статистики. Для практических задач требуются только обезличенные суммы транзакций и совершенно бесполезна любая личная информация. Не имеет никакого значения, потратил сто рублей Николай Корженевский или Вася Пупкин. Есть буквально два важных описательных признака: географический — то есть где произошла транзакция — и категория расходов. Последнее вообще устанавливается платежными системами, то есть Visa или Мир, и банки имеют к этому мало отношения. Подобных нюансов масса, но это внутренняя кухня, и рядовой пользователь редко разбирается в вопросе до таких деталей. Сказать, что банки за нами следят, намного проще.
Да, поклонники теорий заговора нередко опасаются того, что однажды некая огромная корпорация соберет о нас все-все данные, а потом каким-то образом поработит и использует нас. Какие самые большие риски связаны с тем, что бизнеск действительно агрегирует и копит все больше сведений о своих клиентах?
Для параноиков по этому поводу у меня всегда один ответ. Помните, чуть раньше мы говорили об отсутствии методов для решения многих задач? Так вот, существующие подходы обработки больших данных по-прежнему очень грубо идентифицируют множество пользователей или клиентов. Алгоритмы и технологии обработки транзакционных данных на сегодня являются слишком грубыми, чтобы стать инструментом серьезного вмешательства в личную жизнь.
Ровно поэтому до сих пор создаются решения, единственной целью которых является накопление сведений для адресного использования. Те же камеры наблюдения, устанавливаемые повсюду, — это куда большая угроза приватности. Или, скажем, инструменты прослушки. Вот если вы вдруг осознаете, что производство и установка таких устройств вдруг прекратились, — значит, нашелся другой способ.
Я не хочу сказать, что цифровизация не делает людей более прозрачными для бизнеса и государства — это не так. Но в деструктивных целях использование именно больших данных затруднительно. Появление объемных информационных баз, безусловно, позволяет собрать больше информации о конкретном человеке. Но для этого нужно заинтересоваться конкретным человеком, что по определению исключает массовость. Бизнес изучает отдельных лиц, если это очень важный и значимый клиент, и информация используется на пользу обеим сторонам.
И до появления супермассивов данных можно было получить массу информации о человеке, задавшись такой целью. Это было дольше и сложнее, но уж точно не невозможно.
В качестве последнего вопроса все же спрошу вас о прогнозах. Широкого читателя традиционно волновал больше всего курс рубля. Мы помним, как в начале всех событий он сначала рухнул, а потом, в условиях падения импорта и обрушения спроса на «токсичные валюты», рубль укрепился до уровней, для бюджета даже некомфортных. Сейчас это уже кажется вполне логичным и объяснимым, но тем не менее никто этого, кажется, широко не прогнозировал. Почему?
Потому что прогнозирование все равно сводится к экстраполяции, а ответ внешнего мира на военные действия России был уникальным.
И тем не менее в строго экономическом смысле прогнозы девальвации рубля были правильными. Ведь что такое девальвация? Это канал сокращения потребления посредством падения доступности импорта. Скажем, у вас есть 100 рублей, и доллар стоит 50 рублей. То есть у вас есть два доллара, и вы можете на них что-то приобрести. Потом происходит девальвация, и, к примеру, курс становится сто рублей за доллар. Тогда у вас уже один доллар, и купить товаров у внешнего мира вы можете в два раза меньше.
Но ведь в России произошло ровно это — доступность импорта резко сократилась. Просто механизм оказался иным: компании сами решили прекратить поставки товаров в Россию. Курс доллара к рублю мало изменился, но конечное потребление внутри страны все равно деградировало. Про это есть отличная статья Олега Ицхоки и Дмитрия Мухина, которая так и называется «Санкции и обменный курс». Кратко ее содержание в целом я уже пересказал.
Главное следствие заключается в следующем. Если будут налаживаться каналы импорта — что вероятно, так как даже Совок не умел производить нормальной потребительской продукции, — так вот, процесс восстановления импорта непременно повлечет за собой ослабление рубля. В конце февраля мы могли недолго наблюдать, где складывается рыночное равновесие при условно нормальном состоянии внешней торговли. Это примерно 100-110 рублей за доллар. А более точные прогнозы по датам и уровням оставим профессиональным прогнозистам.