云边端协同数据库
(Cloud-Edge-Device Collaborative Database)
作者:王宏志 崔双双
InfoBox:
背景:
随着我国数字经济的迅猛发展,云服务与边缘计算服务协同发展已成为重要战略[1]。云边端协同架构由中心云、边缘设备和物联网终端组成,通过将网络转发、存储、计算、智能化数据分析等工作放在边端处理,降低响应时延,有效解决云上集中处理带宽消耗大以及边端处理能力不足的问题。同时,云边端协同的新计算模式也对数据管理提出了新的需求。因此,需要设计一种云边端协同数据库,有效融合云边端计算能力,实现云边端数据处理、通信、存储等能力全面协同。
定义:
云边端协同数据库是指存储和管理云边端三层协同架构中数据的数据库管理系统。云边端协同架构由中心云、边缘设备和物联网终端组成,云边端协同数据库的核心任务是支持三层架构中数据的按需传输,并且在边端侧计算和存储资源受限情况下,提供端侧和边侧的实时查询处理与决策能力。同时,根据具体场景,云边端协同数据库还可具备存储和管理多模态数据的能力。
挑战:
(1)异构性。云边端协同的异构性主要包括设备异构和数据异构两个方面。一方面,异构设备之间的计算能力和通信资源存在巨大的差异,导致将同样的模型和方法应用于不同设备会产生不同代价,并且云边端协同中各级节点的存储和计算能力有着巨大差异。另一方面,云边端协同中,终端设备上产生海量监测数据,包括数值型数据、图像和音频数据等;同时,在边缘设备和云上,又包括大量结构化数据和非结构化数据。因此,异构性成为实现云边端协同数据库的第一个挑战。
(2)高维性。云边端协同场景下,终端设备上产生的传感器监测数据随采样时间有序变化,呈现为典型的时序数据。由于端设备采样频率高、时间维度高,时序数据的长度很大,需要更加快速的数据写入能力和高效的压缩技术。高维性成为实现云边端协同数据库的第二个挑战。
(3)实时性。云边端协同中,海量终端设备以较高的频率采集数据,使得数据规模进一步扩大。而云边端协同的业务需求,如生产线上的设备故障预警等,需要实时响应。因此,需具备面向大规模数据的实时响应能力,这为实现云边端协同数据库带来了第三个挑战。
(4)可用性。云边端协同的显著特点是系统存在频繁波动。受网络信号、能量损耗和设备故障等因素的影响,端侧的设备会频繁的加入或退出,边侧也会出现不稳定的情况。因而,如何应对协同系统的故障,保障系统可用性为实现云边端协同数据库带来了第四个挑战。
研究趋势:
应对云边端协同数据管理异构性、高维性、实时性、可用性的挑战,实现高效的云边端协同数据库,未来可重点从如下四个方面开展深入研究:
(1)云边端协同数据库的数据模型。数据模型是数据管理的基础[2][3]。首先,数据和设备异构带来了云边端三侧不同的数据模型需求以及云边端协同的数据模型新需求。其次,面向云边端协同的数据库中数据操作更加复杂多样,难以用传统代数运算来描述,很多查询都需要云边端协同处理。并且,云边端三侧不同的数据结构带来了新的数据完整性约束需求。因此,需要从云边端协同架构中存储的数据出发,研究云边端协同数据库的数据模型,为云边端协同架构中的数据存储与查询奠定坚实基础。
(2)云边端协同数据库的数据存储技术。云、边、端数据的来源多样且规模巨大,随着计算力逐渐下沉到边端侧,边端侧存储面临存算一体的设计挑战。首先,云边端数据的来源多样,类型不同,加之在不同应用的数据处理中,云、边、端数据存储的要求不同且数据来源复杂,端侧数据仅追加、无删改,写入压力大。特别地,边端侧还需要支撑有一定复杂程度的数据处理任务,实时管理和低时延响应要求高,因此,需要研究灵活多变的存储结构方案,支持面向存传算一体、计算力下沉需求,实现海量数据的高效并发存取。
(3)云边端协同数据库的数据索引技术。有效的索引对提升数据处理效率起着重要作用。首先,现有索引仅服务于云边端中一或两个层次,缺少云边端整体协同以及数据不断更新的综合考虑。其次,由于云边端设备的异构性,不同层次之间的数据难以统一索引且一个层次的索引很难扩展到其他层次。并且,云边端协同中设备间数据传输频繁,需要高效选择需传输数据,提高数据传输效率。因此,需要研究高效的索引技术。
(4)云边端协同数据库的查询处理和优化。首先云边端异构节点间普遍存在着云-边-端、边-边、端-端等协作形式,现有数据库的查询处理和优化方法难以适应这种分层架构下复杂的协作和异构节点中多样约束条件。其次,在云边端协同中,存在不同优化目标的多类查询,如连续、聚集和复杂查询等[4][5][6],当前尚未有面向多样优化目标的协同查询处理和优化的系统方法。并且,智能制造等应用场景中的高维时序数据以高速、不稳定数据流的形式写入数据库,如何在这类数据上实现各类查询的低时延处理尚无系统性解决方案。因此,需要研究高效的查询优化技术,应对上述挑战。
参考文献
作者介绍
王宏志教授
哈尔滨工业大学
主要研究领域:数据库、大数据管理与分析、大数据治理
wangzh@hit.edu.cn
崔双双 博士研究生
哈尔滨工业大学
主要研究领域:数据库存储、AI for DB
cuishuangs@stu.hit.edu.cn
计算机术语审定委员会及术语平台介绍:
计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入知识图谱的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。