2060071 atuptown 1705377369
223
基于flink的异构数据源流转系统🔥🔥
1天前
6854763 mindspore 1604325217
35
MindSpore Pandas is a data analysis framework, which is compatible with Pandas interfaces and provides distributed processing capabilities.
Python
1年前
11655508 datavane 1687246411
282
人人都会用的数据集成产品,并提供一站式、开箱即用的 DataOps 数据中台,大幅提高ETL实时数仓构建效率
Java
2个月前
11655508 datavane 1687246411
101
新一代数据可观测性系统,提供元数据管理和数据质量检查功能,让您心中有数!
Java
6天前
11655508 datavane 1687246411
287
新一代云原生大数据管家,旨在帮助用户快速构建起稳定、高效、可弹性伸缩的大数据云原生平台
Java
21天前
12
一个用于高性能工作负载场景下基于Kubernetes的容器批量调度引擎 Volcano是在Kubernetes上运行高性能工作负载的容器批量计算引擎。 它提供了Kubernetes目前缺少的一套机制,这些机制通常是许多高性能 工作负载所必需的,包括: - 机器学习/深度学习 - 生物学计算/基因计算 - 大数据应用
4个月前
12303739 baihai idp 1690958128
43
IDP 是一款面向数据科学家和大数据工程师的开源 AI IDE。
623
云雀 是一款数据集成工具,实现异构数据源的整合,帮助企业构建数据仓库、数据湖 等应用架构
Java
1个月前
5162368 dromara 1664439580
256
CloudEon 将基于 Kubernetes 的资源安装部署开源大数据组件,实现开源大数据平台的容器化运行,您可减少对于底层资源的运维关注
9天前
58
罗盘是一个大数据任务诊断平台,旨在提升用户排查问题效率,降低用户异常任务成本。 其主要功能特性如下: 非侵入式,即时诊断,无需修改已有的调度平台,即可体验诊断效果。 支持多种主流调度平台,例如DolphinScheduler、Airflow或自研等。 支持多版本Spark、Hadoop 2.x和3.x 任务日志诊断和解析。 支持工作流层异常诊断,识别各种失败和基线耗时异常问题。
4个月前
11439529 fire framework 1677489254
495
Fire框架是由中通大数据自主研发并开源的、专门用于进行Spark和Flink任务开发的大数据框架,可节约70%以上的代码量。首创基于注解进行Spark和Flink任务开发,具备实时血缘、根因诊断、动态调优、参数热调整等众多平台化功能。Fire框架在中通内部每天处理数据量高达数千亿,在外部已被数十家公司所使用。
Scala
8小时前
35
LakeSoul 端到端实时湖仓框架 Github 官方镜像 https://github.com/lakesoul-io/LakeSoul
Scala
6天前
8959543 dtstack dev 0 1650593715
502
基于flink的分布式数据同步框架
Java
12个月前
8873927 datalinkdc 1648208011
961
Dinky 是一个基于 Apache Flink 的实时数据开发平台,实现了敏捷的数据开发、部署和运维。
Java
9天前
LarkMidTable 是一站式开源的数据中台,实现中台的基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。
Java
12个月前

搜索帮助