繁杂互联网:是指具有自组织、自相似、吸引子、小世界、无对数中部分或全数性质的互联网。
元统计数据:为叙述统计数据的统计数据,主要是叙述统计数据特性的信息,用来全力支持如命令储存位置、历史统计数据、天然资源查找、文件记录等功能。
形式论方案:是对传统资料库中SQL导出的形式论方案的一场更进一步提炼出,这里是对资料库下层形式论的一场抽象化,如有SQL的形式论方案、图的形式论方案、AI的形式论方案等。
Hubble资料库全力支持多种形式论方案如图形式论方案、SQL逻辑方案、AI形式论方案等,当中图的形式论方案能提供更多标准的图的出访USB等。本次项目首先加进了Hubble资料库的图形式论方案;其次在元统计数据抒发层,透过图的形式来抒发元统计数据之间的关连亲密关系,使元统计数据在更高的层次被抒发出来。因为多维的抒发,带来更多捷伊特性,统计数据的关连性、关连亲密关系、易用性、服务中心性等能较好的做分析。透过Hubble作为支撑力,从SQL的反导出、应用领域的逆向工程,手动的构筑元统计数据互联网,符合Dama2.0的设计,为统计数据环境治理提供更多捷伊形式论的全力支持。
控制技术说明
元统计数据处置作为统计数据处置架构中一项重要的管理工作职能,被广泛地应用领域于企业的统计数据处置体系中。元统计数据是指叙述统计数据的统计数据,是对统计数据展开叙述、解释、功能定位使其更方便快捷索引、使用或管理工作的统计数据。元统计数据包括控制技术元统计数据和销售业务元统计数据。当中,控制技术元统计数据从统计计算机程序和统计数据处置技术细节方面对统计数据展开控制网络化叙述,销售业务元统计数据从销售业务名词、销售业务叙述、销售业务指标和销售业务规则对统计数据展开叙述。
元统计数据关连结点和关连亲密关系形成繁杂网。
Hubble资料库创造力的提出形式论方案的概念,是对SQL导出中形式论方案的升级,把资料库对不同形式论的支撑力表述为形式论方案,如SQL形式论方案、图形式论方案、AI形式论方案、3D点云形式论方案等。所有的是形式论方案相连接储存层、运维层、天然资源管理工作层,在对元统计数据的处置中采用了繁杂互联网的形式来做多维抒发,对元统计数据的关连性、关连亲密关系、易用性、服务中心性等在繁杂互联网层透过图的演算法快速同时实现。对于应用领域,该形式透过对SQL的反导出,以及应用领域逆向工程,同时实现元统计数据互联网的手动构筑。在形式论方案层,Hubble透过对下层下层USB天然资源的更进一步抽象化,对储存、运维、天然资源等这在SQL形式论重点对SQL的导出、SQL方案转化、SQL优化做处置,在图的形式论方案中对图的点、边、特性等做对应的态射,使图的基础元素能方便快捷的态射到下层储存中。
在对应用领域的SQL反导出中借助于了Hubble资料库的SQL导出能对Mysql、Oracle、DB2、Hive等常用的资料库的句法全数做到相容并导出为抽象化内部结构树,在对洼瓣内部结构做亲密关系抽出,态射到表与表头的亲密关系、表与表的亲密关系、表头与表头的亲密关系,从形式真正的血缘亲密关系图表,并透过演算法对图中的相似关系展开计算,得关连性亲密关系图表。每个图表中的基础结点就是原始结点,由于原始结点代表了控制技术元统计数据,根据原始结点生成销售业务对象并形成以销售业务对象为服务中心结点的繁杂互联网,同时实现了控制技术元统计数据和销售业务元统计数据的融合,从而,使得元统计数据处置系统能够更好地适应企业不断发展的销售业务需求,提高了元统计数据处置的灵活性和有效性,提升了统计数据资产的价值。
透过对图表控制技术元统计数据和销售业务元统计数据展开图算如Pagerank、最短路径、删边、介数等计算得图元统计数据的活跃性、连通性、易用性等图的基础特性,赋予元统计数据对应的表与表头,形成对应的血缘亲密关系。在图表的辅助下方便快捷做更进一步的主题构筑。在主题构筑中基于图表的血缘亲密关系以及基于Hubble统计数据的计算能力、多源异构的能力,能同时实现虚拟主题的构筑,做虚拟视图态射,减少统计数据的移动,以及储存空间的占用。
★专利申请号/公开号:CN112364096A
开发团队
·带队负责人姓名:乔旺龙
乔旺龙先生,金融科技产业联盟分布式资料库专委会委员、参加国家级相关发明专利编写多项,曾主导编写”智慧粮食系统内部统计数据采集研究”发表与《中国科技纵横》,2013年入职天云融创统计数据科技(北京)有限公司,现在我司担任副总裁,负责我司分布式基础组件的分布式产品线,包括分布式资料库、图计算等,其计算机相关知识扎实,在分布式、资料库等多个领域都有突破。
·隶属机构:天云统计数据
天云统计数据,首批国家级专精特新小巨人企业,资料库及人工智能基础软件独角兽企业。
在统计数据供给侧:天云统计数据荣膺全球领先的信息控制技术研究和顾问公司Gartner代表性中国资料库厂商TOP5;资料库产品Hubble同一产品同一软著同时透过信通院的事务和分析能力评测;工信部开展的2022年大统计数据产业发展试点示范项目, Hubble资料库作为唯一一款国产HTAP资料库入选,获得国家级重点项目推荐。
在统计数据消费侧:天云统计数据荣膺全球资讯机构Forrester魔力象限图“认知层”第一象限公司;提供更多认知层AI模型流水线生产平台AI PaaS; 中国证监会公布的“首批纳入资本市场金融科技创新试点项目”,天云统计数据的“单账户配资异常交易监测系统”从51个行业优质项目之中脱颖而出、位列三甲,成为“证监会版”监管沙盒项目之一。
天云统计数据已经为50+家五百强及上市公司提供更多服务。
2021年底,天云统计数据完成数亿元D轮融资,本轮由北京市国资基金、上海市国资基金、苏州市政府等多家国家队基金共同投资。
相关评价
在过去的数字化、智能化建设工作中积累了海量的统计数据,但各系统相对孤立。今天要做数字化转型,需要面向整体销售业务板块展开全域统计数据处置。中石化公司在几年前开始规划”集团——板块——企业”三级统计数据湖架构和形式论一致、物理分级的统计数据环境治理和统计数据处置体系。规划设计集团统一的分布式统计数据天然资源目录,并制定统一的统计数据处置权限,作为公司统计数据资产唯一的发布和共享平台。天云统计数据的AI平台,切合公司的需求,在智能油田、统计数据环境治理等项目中得到了较好的应用领域。
——中石化数字与信息化管理工作部处长 肖波
统计数据质量管理工作不单纯是一个概念,也不单纯是一项控制技术、也不单纯是一个系统,更不单纯是一套管理工作流程,统计数据质量管理工作是一个集形式论、控制技术、销售业务和管理工作为一体的解决方案。透过有效的统计数据质量控制手段,展开统计数据的管理工作和控制,消除统计数据质量问题进而提升企业统计数据变现的能力。天云统计数据质量智能分析工具设计理念—- (双模) IT 架构,模态1是可靠IT,持续稳定现有销售业务的发展,像马拉松运动员。模态2是敏捷(Agile)IT,推陈出新,布局新产品和模式,像短跑运动员。在企业向第三平台转型过程中,二者缺一不可、相辅相成。天云统计数据“统计数据质量服务”服务就是可靠IT和敏捷IT之间的“变速齿轮” 。
——国网普华项目负责人 尹将伯