Repository navigation

#

flume

专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...

10057
2 年前

大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料

Java
2878
5 天前

Apache Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log-like data

Java
2549
6 个月前

Extract logic from your apps with a user-friendly node editor powered by React.

TypeScript
1521
1 个月前

分布式实时日志分析与入侵检测系统

JavaScript
221
2 年前

最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban进行定时任务的调度,使用技术:Java/Scala语言,Hadoop、Spark、Hive、Kafka、Flume、Azkaban、SpringBoot,Bootstrap, Echart等;

JavaScript
127
3 年前

电影推荐系统、电影推荐引擎、使用Spark完成的电影推荐引擎

Scala
117
7 年前

基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。

Java
112
3 年前

Educational notes,Hands on problems w/ solutions for hadoop ecosystem

Python
87
6 年前

一个对用户行为日志进行分析的大数据项目

PLpgSQL
72
3 年前

Flume NG MongoDB source.

Java
71
2 年前

The goal of this project is to build a docker cluster that gives access to Hadoop, HDFS, Hive, PySpark, Sqoop, Airflow, Kafka, Flume, Postgres, Cassandra, Hue, Zeppelin, Kadmin, Kafka Control Center and pgAdmin. This cluster is solely intended for usage in a development environment. Do not use it to run any production workloads.

Shell
63
2 年前

基于Spark2.2新闻网大数据实时系统项目

Scala
61
6 年前

Flume plugin for RabbitMQ

Java
58
1 年前