深入浅出Kafka:高可用、顺序消费及幂等性 在我们旅行于数据海洋的途中,如果把 Kafka 比作是一艘承载无数信息航行的快船,前文《Kafka实战漫谈:大数据领域的不败王者》已经讲述了如何搭建起这艘快船,让它在起风的早晨开始了第一次航行。 但随着大浪的拍打,我们必须让它做好准备,以应对那些未知的暴风雨。 今天,我们来谈谈如何让这艘快船变得更强壮——让它有能力在风急浪高时稳稳地前行,不至于让宝贵的数据货物沉入海底。 在 Kafka 这艘数据游 开发运维 2023-12-18 竹子爱熊猫
7k Star,一款开源的 Kafka 管理平台,功能齐全、页面美观! 1 特征 2 入门 快速启动(演示运行) 持久安装 设置 git 3 配置向导 动态应用程序配置 4 数据脱敏 主题数据脱敏 5 自定义可插拔 serde 注册 传送门 Apache Kafka UI 是一个免费的开源 Web UI,用于监控和管理 Apache Kafka 集群,可方便地查看 Kafka Brokers、Topics、消息、Consumer 等情况,支持多集群管理、性能监控、访问 开发运维 2023-12-15 穿过生命散发芬芳
AutoMQ 社区双周精选第二期(11.2012.01) 本期概要 在开源的第二个双周里,作为一个成长中的开源项目,AutoMQ做了很多的优化和重构,以下是相关重点动态的总结。 AutoMQ Kafka:写链路耗时优化、快慢读隔离、Spot 实例强制回收容灾。 AutoMQ RocketMQ:历史数据冷读优化、LogCache 读写耗时优化、发布 v0.0.3-alpha 版本、发布 Helm Chart、发布文档站。 AutoMQ Kafka 精选动态 运维资讯 2023-12-13 泡泡
不要让Apache Kafka成为你的数据库 作者丨Andrew Mills 编译丨诺亚 关于Kafka到底能否被认为是数据库的讨论由来已久。支持方认为,Kafka不应该仅仅是一个消息队列,其工作机制涉及到海量数据的存储与处理,根据需求Kafka 是可以作为数据库来使用的。而反对方则表示,Kafka 没有传统数据库的数据模型,也不能很好地支持查询优化,而且Kafka没有严格的隔离机制,也就无从保证在并发读写情况下的数据准确。 本文作者Andr 数据运维 2023-12-10 张二河
消息队列备选架构选择,你选择哪个? 备选架构1 - 开源方案评估 kafka: 人力成本: 测试代表倾向于引入 Kafka,因为 Kafka 比较成熟,无须太多测试投入。 中间件团队部分研发人员也支持使用 Kafka,因为使用 Kafka 能节省大量的开发投入。 可维护性: Kafka 是 Scala 语言编写的,运维团队没有维护 Scala 语言开发的系统的经验,出问题后很难快速处理。 运维团队已经有一套成熟的运维体系,包括部署、 开发运维 2023-11-30 竹子爱熊猫
带你吃透Kafka的可靠性设计 作者 | 蔡柱梁 审校 | 重楼 目录 前言 可靠性分析 副本设计 leader选举机制 日志同步机制 1 前言 本文里面涉及到较多基础概念,如果忘记了,那么可以去看下《一文带你快速入门kafka》。 对于一个消息中间件而言,可靠性是是至关重要的要素之一。不管是面试或者实际工作中,我们都不得不面对几个问题:是几个九?消息会不会丢失?如何保证幂等?如何顺序消费?在这篇文章中,笔者会和大家一起去看 K 开发运维 2023-11-17 贤蛋大眼萌
Kafka两种集群详解和搭建教程 Kafka是一个能够支持高并发以及流式消息处理的消息中间件,并且Kafka天生就是支持集群的,今天就主要来介绍一下如何搭建Kafka集群。 Kafka目前支持使用Zookeeper模式搭建集群以及KRaft模式(即无Zookeeper)模式这两种模式搭建集群,这两种模式各有各的好处,今天就来分别介绍一下这两种方式。 1,Kafka集群中的节点类型 我们首先需要了解一下,一个Kafka集群是由下列几 开发运维 2023-11-09 醒在深海的猫
为什么 Kafka 的吞吐量那么高? 在众多的消息中间件中,Kafka 的性能和吞吐量绝对是顶尖级别的,那么问题来了, Kafka 是如何做到高吞吐的。在性能优化方面,它使用了哪些技巧呢?下面我们就来分析一下。 以'批'为单位 批量处理是一种非常有效的提升系统吞吐量的方法,操作系统提供的缓冲区也是如此。在 Kafka 内部,消息处理是以"批"为单位的,生产者、Broker、消费者,都是如此。 在 Kafka 的客户端 SDK 中,生产 开发运维 2023-11-07 醒在深海的猫
我们一起聊聊 B 站 Kafka 探索与实践 1.背景 Kafka 是我们公司各个部门的重要数据中间件,主要用于上报、暂存和分发各种数据。我们不仅支持大数据场景,同时也保障在线场景的稳定性。 我们拥有1000+台Kafka机器,组成了20多个集群,针对不同业务场景配置了不同规格的机器,磁盘类型包括HDD,SSD和NVME。每日PB级输入,输出数十PB,肩负着公司数据传输的重任。随着集群规模的扩张,我们也遇到了越来越多的挑战。 图片 2.面临的 开发运维 2023-11-03 穿过生命散发芬芳
Kafka 在分布式系统中的七大应用场景 Kafka 介绍 Kafka 是一个开源的分布式流式平台,它可以处理大量的实时数据,并提供高吞吐量,低延迟,高可靠性和高可扩展性。Kafka 的核心组件包括生产者(Producer),消费者(Consumer),主题(Topic),分区(Partition),副本(Replica),日志(Log),偏移量(Offset)和代理(Broker)。Kafka 的主要特点有: 数据磁盘持久化:Kafka 开发运维 2023-10-24 张二河
如何确定Apache Kafka的大小和规模 作者丨Andrew Mills 编译丨云昭 调整或扩展Kafka以获得最佳成本和性能的第一步是了解数据流平台如何使用资源。这里给一些实用的建议。 实现Apache Kafka的团队,或者扩展他们对强大的开源分布式事件流平台的使用,通常需要帮助理解如何根据他们的需求正确地调整和扩展Kafka资源。这可能很棘手。 无论您是在考虑云资源还是预处理硬件资源,了解Kafka集群将如何利用CPU、RAM和存储 开发运维 2023-10-23 三掌柜
使用Java与Apache Kafka构建可靠的消息系统 Apache Kafka 是一个分布式流处理平台,也是一种高性能、可扩展的消息系统。它在处理海量数据时表现出色,而且易于使用和部署。 Apache Kafka 是一种分布式发布-订阅消息系统,由 LinkedIn 公司开发。它具有高性能、高并发、可扩展等特点,适合用于大型实时数据处理场景。Kafka 的核心概念包括: 1、消息(Message):Kafka 中的基本数据单元,由一个键和一个值组成。 开发运维 2023-10-23 向阳逐梦
阅读:Kafka a Distributed Messaging System for Log Processing 本篇论文发表于2011年,应该是 Kafka 在 Linkedin 内部应用不久便发布的(可以从论文中的描述得知,可能更接近0.7版本),所以对于 Kafka 的架构设计及部分功能的与后续被广泛使用时会有显著差距,但核心的内容并无二致。 Kafka 诞生的初衷是用于处理海量的日志数据,所以相较传统的消息(Pub/Sub)系统拥有更高的吞吐量。而在 Kafka 之前对于日志的处理大多采用主动抓取的方 系统运维 2023-10-16 大猫
Mac及Linux环境下配置Kafka 准备Kafka 下载Kafka 💡这里以Kafka 3.5.0为例。Kafka的运行依赖Zookeeper,但由于现在的Kafka版本都内置了Zookeeper,因此无需额外配置。 前往Apache Kafka官网下载kafka_2.13-3.5.0.tgz。 解压Kafka 将下载的Kafka解压至安装目录,这里以/usr/local/为例: sudo tar -zxvf kafka_2.13- 系统运维 2023-10-16 穿过生命散发芬芳
深入探究Kafka ISR机制与Spring Cloud应用实践 Apache Kafka广泛应用于处理实时数据流,其中ISR(In-Sync Replicas)机制起到关键作用,确保数据可靠性和系统高可用性。本文将深入探讨ISR机制,对其原理和源码进行剖析,并展示如何在Spring Cloud环境下实现和利用ISR。 ISR机制原理 Kafka的数据分散存储在不同的分区中,每个分区都有一个leader副本和多个follower副本。ISR是当前分区内与lead 开发运维 2023-10-13 剑圣无痕
使用 Spring Boot 和 Kafka Streams 进行实时数据处理 Spring Boot 和 Apache Kafka Streams 是两个强大的工具,它们使开发人员能够创建可靠且可扩展的实时数据处理应用程序。在这篇文章中,我们将了解 Spring Boot 和 Kafka Streams 如何协同工作,如何利用流处理来发挥应用程序的优势。还将探索交互式查询,这是一个相对较新且有趣的功能,为实时数据分析提供了新的机会。 安装Kafka Kafka可以从官方网站 开发运维 2023-10-11 贤蛋大眼萌
工具使用集|Kafka:官方文档简明解读(续) 前言 kafka 官方文档浅读,好吃力。已经有大半个月没有更新了,记录一下kafak相关的内容。 konwlage Kafka不是一个传统的消息传递系统,而更类似于一个持久性的分布式发布订阅消息日志。 那么kafka一般将数据持久化在哪里呢? kafka的持久化数据存储通常存储在称为"日志目录"(log directory)的文件系统路径上。 每个Kafka主题(topic)都有一个或多个分区(p 开发运维 2023-10-11 大白菜程序猿
Kafka KRaft线上集群部署实战(broker、controller分离部署) 这里是weihubeats,觉得文章不错可以关注公众号小奏技术,文章首发。拒绝营销号,拒绝标题党 kafka版本 kafka_2.13-3.5.0 背景 继之前Linux Kafka 3.5 KRaft模式集群部署:weihubeats.blog.csdn.net/article/det… 我们采用的 一个节点即是broker又是controller,这种部署方式仅适合于测试环境,本次我们要实现线 开发运维 2023-10-09 醒在深海的猫
Java Kafka基本操作 安装zookeeper 下载镜像:docker pull zookeeper:3.4.14 创建容器:docker run -d --name zookeeper -p 2181:2181 zookeeper:3.4.14 安装kafka 下载容器:docker pull wurstmeister/kafka:2.12-2.3.1 创建容器: docker run -d --name kafka 开发运维 2023-10-05 竹子爱熊猫
kafka:org.apache.kafka.common.network.InvalidReceiveException 背景 今日练习kafka相关操作,但是却爆出了Failed to create new KafkaAdminClient的错误 控制台看不出什么,于是我又看了下docker中kafka的日志 主要是这一行:org.apache.kafka.common.network.InvalidReceiveException: Invalid receive (size = 369295616 larger 开发运维 2023-10-05 向阳逐梦