Cybersecurity of the Big Data Economy
BRICS+ countries are nations with a growing economy and scientific potential whose development largely depends on advancements in the techno logical platform and the digitalization of industries. The digital transformation of state and municipal administration, the economy, and the social sector is not only impossible without uninterrupted Internet access, the training of skilled professionals for the IT industry, digital public administration, and the develop ment of domestic digital platforms, software, promising inventions, and artificial intelligence, but also without ensuring cybersecurity, which is at the forefront of this area in the national project ‘Data Economy and Digital Transformation of the State’.
The growing number of cyberthreats against digital infrastructure is turning into a challenge for all countries today. According to a Bank of Russia report on dif ferent types of computer attacks in the financial sector, the FinCERT automated incident processing system recorded more than 750 attacks on the financial sector in Russia alone in 2024. What is critically important is that these attacks were car ried out from almost all regions of the world, which clearly shows how difficult it is to combat such attacks from just a single state. The hackers actively exploited the infra structure of contractors, software vulnerabilities, and social engineering. Statistics show that they are increasingly using complex chains of actions and gaining access to sensitive data through ancillary, less secure systems. We can expect attacks on digital infrastructure to continue to grow, primarily using ancillary systems, the vul nerabilities of diverse stacks of software components, and social engineering. Data is the main asset of the new digital economy. However, intruders are gaining access to millions of data records as a result of cyberattacks. On average, during a single incident in 2024, more than 2.5 million records were leaked world wide (more than 2.3 million in Russia). Human error has fallen by the wayside: 99% of leaks are intentional. Over the past year, the percentage of leaks in industry and trade, sports organizations, media, and NGOs has only grown. In the future, we can assume that hackers will increasingly show interest in private data sets, the gen eralization (enrichment) of data, its combination with OSINT technologies, and using data to put pressure on companies through possible fines, reputational risks, fraud, and other illegal activities, including planning terrorist attacks. We can draw the following conclusions: the transition to a data economy must ensure the security of its main resource – the actual big data circulating in digi tal systems. Given the modern cyberthreat landscape, this is a complex task that requires various countries to consolidate their efforts both to protect assets as well as to investigate incidents and prosecute hackers. It must be effectively resolved so as not to jeopardize the confidentiality, reliability, availability, and integrity of big data of the digital economy. We will examine the role of data in the modern digital services that underlie the new technological paradigm. The big data economy requires us to view infor mation in at least two ways: taking decisions based on data and using data as an independent value (resource). Decision-making is what increases the intrinsic value of data. It results in new forms of relations within the knowledge society, such as data exchange or data outsourcing, as well as the creation and use of joint prod ucts based on data (e.g., artificial intelligence systems). These are essentially new forms of big data management in response to technological needs. However, the actual technologies – new non-relational DBMS for big data, distributed informa tion management systems, and artificial intelligence systems – have vulnerabilities and security imperfections that can result in such massive leaks. We will outline the following problems with ensuring the cybersecurity of the big data economy with respect to its main resource: a growing attack surface (including cross-border), the vulnerability of technologies, and the heterogeneity of infrastructure. As the need for data exchange and outsourcing increases, more and more people are gaining access to confidential information. This creates legal problems both in terms of obtaining consent for processing from the data owners and harmonizing legislation, as well as cybersecurity problems. The probability of data leaks in this case increases many times over, since data is becoming available to a wide range of people and starting to appear in different types of infrastructure built on the basis of various software and hardware. The next problem is the vulnerability of technologies. On the one hand, having heterogenous infrastructure increases the likelihood of open vulnerabilities. On the other hand, modern data-driven solutions and artificial intelligence systems are also susceptible to major cyberattacks that not only aim to extract their private architecture, but also the data used to create them. Even when technologies spe cifically designed to maintain privacy (such as federated learning) are used in the joint creation of AI models, such attacks remain relevant. The third problem that arises from the new paradigm of using information in the big data economy is the heterogeneity of infrastructure itself. Even within a sin gle, fairly large company in the banking or industrial sector, data has a complex life cycle, is processed in various systems, and circulates between them as they imple ment various business processes. As a rule, such systems trust each other, and a hacker can gain access to all private data by accessing one of them. This is one of the reasons why hackers are increasingly using ancillary systems and infrastructure to gain access to data. This means we must take a comprehensive approach to big data security within any kind of heterogeneous infrastructure and not only protect individual components, but data management systems as a whole at the techno logical and not just the legal level. As such, ensuring the protection and control of data usage in heterogeneous infrastructure is crucial to the cybersecurity of the entire data economy. Different degrees of data granulation, the lack of a single processing tool, and the hetero geneity of data sources, consumers, and information at the semantic level are what distinguish big data management systems for large-scale objects (including government services and cross-border systems) from traditional database management systems (including private clouds). These factors make it impossible to apply conventional means and methods of protection, such as end-to-end encryption and well-known methods of access control and audit, at the level of the big data management system as a whole. To ensure the comprehensive security of big data management systems, we need a common, consistent approach to its protection that can overcome the contradictions between heterogeneous components with different data granulation. Another challenge in building secure big data management systems is the need to support existing specialized tools for structuring and transforming information, accepted business practices, data outsourcing, and the joint use of data.
Technology should be based on a new consistent approach to ensuring the security of the data management system that incorporates the principles of com pleteness, unity, and consistency of data and process representation, as well as the principle of minimizing trust. What makes this approach unique is the consistency both at the level of mathematical models of heterogeneous components of the data architecture as well as between information processing levels. This consistent approach allows for access control, monitoring, and auditing throughout the entire life cycle of data and also minimizes threats and ensures secure information processing in the most productive mode. Developing solutions based on the paradigm of a consistent approach to protecting big data when conducting joint research, including as part of scientific and technical cooperation between BRICS+ countries, will enhance the confidentiality, availability, and integrity of the data economy’s main resource in the face of cyber threats. Reducing the number of data leaks, in turn, will help to avoid unforeseen expenses and significant reputational costs, simplify the international exchange of data in order to create technological products, boost the sustainability of the commercial and public sectors of the data economy, and ensure that citizens have greater trust in new technologies.
Говоря о кибербезопасности в эпоху экономики больших данных в первую очередь необходимо сказать о безопасности самой экономики больших данных в отношении киберугроз. В эпоху экономики данных, в условиях развития цифровых систем, государственных и региональных цифровых сервисов, возникает не только проблема сбора, обработки и хранения больших данных, но и задача обеспечения их комплексной безопасности. При нарастающем числе киберугроз государственным и частным сервисам, целостность, конфиденциальность и доступность больших данных являются важным фактором их успешной работы и стабильности общества.
Страны БРИКС+ - это страны с растущей экономикой и научным потенциалом, развитие которого во многом зависит от развития технологической платформы и цифровизации индустрий. Цифровая трансформация государственного и муниципального управления, экономики и социальной сферы невозможна не только без бесперебойного доступа к Интернету, подготовки квалифицированных кадров для ИТ-отрасли, цифрового госуправления, развития отечественных цифровых платформ, программного обеспечения, перспективных разработок и искусственного интеллекта, но и без обеспечения кибербезопасности. В рамках национального проекта «Экономика данных и цифровая трансформация государства» кибербезопасность поставлена во главу данного направления.
Вызовом для всех стран сегодня становится растущее число киберугроз в отношении цифровой инфраструктуры. Согласно отчету Банка России по типам компьютерных атак в финансовой сфере, в 2024 году только в нашей стране АСОИ ФинЦЕРТ зафиксировал более 750 атак в финансовой сфере, что критически важно, произведенных практически из всех регионов мира. Что говорит, в первую очередь, о сложности борьбы с такими атаками со стороны одного государства. Злоумышленниками активно использовались инфраструктуры подрядных организаций, уязвимости программного обеспечения, социальная инженерия. Отметим, что согласно статистике, все больше для получения чувствительных данных злоумышленниками используются сложные цепочки действий, доступ через смежные, менее защищенные системы. Можно сделать вывод о дальнейшем росте атак на цифровую инфраструктуру, в первую очередь, с использованием связанных систем, уязвимостей разнородных стеков программных компонентов и социальной инженерии.
Данные являются главной ценностью новой цифровой экономики. Однако, в результате кибератак злоумышленники получают доступ к миллионам записей данных. В ходе одного инцидента в 2024 году в мире в среднем «утекает» более 2,5 миллионов записей (в России более 2,3млн). Ошибки персонала отошли на второй план: 99% утечек носят умышленный характер. За последний год только выросли доли утечек в промышленности и торговле, спортивных организациях, СМИ, НКО. В дальнейшем можно предположить все больший рост интереса злоумышленников к приватным наборам данных, их обобщению (обогащению), совмещению с технологиями OSINT и использованию для давления на компании через возможные штрафы и репутационные риски, мошенничества, использование в другой противоправной деятельности, включая планирование террористичесих акций.
Можно сделать следующие выводы. Переход к экономике данных требует обеспечения безопасности ее основного ресурса – собственно больших данных, циркулирующих в цифровых системах. В условиях современного ландшафта киберугроз это комплексная задача, требующая консолидации усилий различных стран как для защиты активов, так и для расследования инцидентов и привлечения к ответственности. Без ее эффективного решения конфиденциальность, достоверность, доступность и целостность больших данных цифровой экономики оказывается под угрозой.
Рассмотрим роль данных в современных цифровых сервисах, лежащих в основе новой технологической парадигмы. Экономика больших данных задает рассмотрение информации по крайней мере в двух качествах: принятие решений на основе данных и использование данных как самостоятельной ценности (ресурса). Именно принятие решений обуславливает повышение самоценности данных. В результате, возникают новые формы отношений в рамках информационного общества, такие, как обмен данными или аутсорсинг данных, а также создание и использование совместных продуктов на основе данных (например, системы искусственного интеллекта). Это, фактически, новые формы управления большими данными обусловленные технологическими потребностями. При этом сами технологии: новые не реляционные СУБД для больших данных, распределенные системы управления информацией, системы искусственного интеллекта в свою очередь имеют уязвимости и несовершенства защиты, позволяющие столь масштабные утечки.
Обозначим следующие проблемы обеспечения кибербезопасности экономики больших данных в отношении ее основного ресурса: увеличение поверхности атаки (включая трансграничность), уязвимость технологий и гетерогенность инфраструктуры. По мере расширения необходимости обмена данными и их аутсорсинга все больше людей получают доступ к конфиденциальной информации. Это создает как юридические проблемы, связанные с получением согласий на обработку от частных лиц – владельцев информации и гармонизации законодательства, так и проблемы кибербезопасности. Вероятность утечки в этом случае возрастает многократно, так как данные становятся доступны широкому кругу лиц и начинают фигурировать в различных инфраструктурах, построенных на базе различного программного и аппаратного обеспечения.
Следующей проблемой тут же становится уязвимость технологий. С одной стороны, гетерогенность инфраструктур увеличивает вероятность наличия в них открытых уязвимостей. С другой, современные решения на основе данных, системы искусственного интеллекта (ИИ) также подвержены известным кибератакам направленным на извлечение не только их приватной архитектуры, но и данных, на которых они были обучены. Даже в том случае, когда при совместном обучении ИИ моделей используются технологии, изначально направленные на сохранение приватности (такие как федеративное обучение), такие атаки остаются актуальными.
Третья проблема, вытекающая из новой парадигмы использования информации в экономике больших данных – собственно гетерогенность инфраструктуры. Даже в рамках одной, достаточно крупной организации банковского или промышленного сектора данные имеют сложный жизненный цикл и обрабатываются в различных системах, циркулируя между ними в процессе реализации бизнес – процессов. Как правило такие системы доверены в отношении друг друга, и злоумышленник, получив доступ к одной из них, получает доступ ко всем приватным данным. В том числе поэтому отмечается все большее широкое использование нарушителями связанных систем и инфраструктур для получения доступа. Следовательно, необходим комплексный подход к безопасности больших данных в рамках гетерогенной инфраструктуры любой природы и защиту не отдельных компонентов, а систем управления данными в целом, на технологическом, а не только юридическом уровне.
Таким образом обеспечение защищенности и контроль использования данных в гетерогенной инфраструктуре лежит в основе кибербезопасноти всей экономики данных. Различная степень грануляции данных, отсутствие единого инструмента обработки, гетерогенность источников данных, потребителей и информации на семантическом уровне отличают системы управления большими данными крупномасштабных объектов (включая государственные сервисы, трансграничные системы) от традиционных систем управления базами данных (в том числе, в частных облаках). Эти факторы не позволяют на уровне системы управления большими данными в целом применить традиционные средства и методы защиты, такие как сквозное шифрование, хорошо известные методы контроля доступа и аудита.
Для обеспечения комплексной безопасности систем управления Большими данными необходим общий согласованный (консистентный) подход к их защите, позволяющий преодолеть противоречия между гетерогенными компонентами с различной грануляцией данных. Дополнительной сложностью при построении защищенных систем управления Большими данными является необходимость поддержки существующих специализированных инструментов структуризации и преобразования информации, принятых бизнес-практик, передачи данных на аутсорсинг и совместное использование.
В качестве основы технологии предлагается новый консистентный подход к безопасности систем управления данными, включающий принципы полноты, единства и консистентности представления данных и процессов, а также принцип минимизации доверия. Новизна подхода заключается в обеспечении согласованности (консистентности) как на уровне математических моделей гетерогенных компонентов архитектуры данных, так и между уровнями обработки информации. Консистентный подход позволяет обеспечить разграничение доступа, контроль и аудит на протяжении всего жизненного цикла объекта данных, минимизировать угрозы и реализовать защищенную обработку информации в максимально производительном режиме.
Разработка решений согласно парадигме консистентного подхода к защите больших данных в рамках совместных исследований, в том числе в границах научно-технического сотрудничества стран БРИКС+, позволит повысить конфиденциальность, доступность и целостность в условиях киберугроз основного ресурса экономики данных. Снижение числа утечек данных в свою очередь - избежать непредвиденных расходов и значительных репутационных издержек, упростить международный обмен данными для создания технологических продуктов, повысить устойчивость функционирования коммерческого и государственного секторов экономики данных, добиться увеличения доверия со стороны граждан к новым технологиям.
Социальные сети Instagram и Facebook запрещены в РФ. Решением суда от 21.03.2022 компания Meta признана экстремистской организацией на территории Российской Федерации.