kafka-每日运维

深入浅出Kafka：高可用、顺序消费及幂等性

在我们旅行于数据海洋的途中，如果把 Kafka 比作是一艘承载无数信息航行的快船，前文《Kafka实战漫谈：大数据领域的不败王者》已经讲述了如何搭建起这艘快船，让它在起风的早晨开始了第一次航行。但随着大浪的拍打，我们必须让它做好准备，以应对那些未知的暴风雨。今天，我们来谈谈如何让这艘快船变得更强壮——让它有能力在风急浪高时稳稳地前行，不至于让宝贵的数据货物沉入海底。在 Kafka 这艘数据游

开发运维 2023-12-18 竹子爱熊猫

7k Star，一款开源的 Kafka 管理平台，功能齐全、页面美观！

1 特征 2 入门快速启动（演示运行）持久安装设置 git 3 配置向导动态应用程序配置 4 数据脱敏主题数据脱敏 5 自定义可插拔 serde 注册传送门 Apache Kafka UI 是一个免费的开源 Web UI，用于监控和管理 Apache Kafka 集群，可方便地查看 Kafka Brokers、Topics、消息、Consumer 等情况，支持多集群管理、性能监控、访问

开发运维 2023-12-15 穿过生命散发芬芳

AutoMQ 社区双周精选第二期（11.2012.01）

本期概要在开源的第二个双周里，作为一个成长中的开源项目，AutoMQ做了很多的优化和重构，以下是相关重点动态的总结。 AutoMQ Kafka：写链路耗时优化、快慢读隔离、Spot 实例强制回收容灾。 AutoMQ RocketMQ：历史数据冷读优化、LogCache 读写耗时优化、发布 v0.0.3-alpha 版本、发布 Helm Chart、发布文档站。 AutoMQ Kafka 精选动态

运维资讯 2023-12-13 泡泡

不要让Apache Kafka成为你的数据库

作者丨Andrew Mills 编译丨诺亚关于Kafka到底能否被认为是数据库的讨论由来已久。支持方认为，Kafka不应该仅仅是一个消息队列，其工作机制涉及到海量数据的存储与处理，根据需求Kafka 是可以作为数据库来使用的。而反对方则表示，Kafka 没有传统数据库的数据模型，也不能很好地支持查询优化，而且Kafka没有严格的隔离机制，也就无从保证在并发读写情况下的数据准确。本文作者Andr

数据运维 2023-12-10 张二河

消息队列备选架构选择，你选择哪个？

备选架构1 - 开源方案评估 kafka：人力成本：测试代表倾向于引入 Kafka，因为 Kafka 比较成熟，无须太多测试投入。中间件团队部分研发人员也支持使用 Kafka，因为使用 Kafka 能节省大量的开发投入。可维护性： Kafka 是 Scala 语言编写的，运维团队没有维护 Scala 语言开发的系统的经验，出问题后很难快速处理。运维团队已经有一套成熟的运维体系，包括部署、

开发运维 2023-11-30 竹子爱熊猫

带你吃透Kafka的可靠性设计

作者 | 蔡柱梁审校 | 重楼目录前言可靠性分析副本设计 leader选举机制日志同步机制 1 前言本文里面涉及到较多基础概念，如果忘记了，那么可以去看下《一文带你快速入门kafka》。对于一个消息中间件而言，可靠性是是至关重要的要素之一。不管是面试或者实际工作中，我们都不得不面对几个问题：是几个九？消息会不会丢失？如何保证幂等？如何顺序消费？在这篇文章中，笔者会和大家一起去看 K

开发运维 2023-11-17 贤蛋大眼萌

Kafka两种集群详解和搭建教程

Kafka是一个能够支持高并发以及流式消息处理的消息中间件，并且Kafka天生就是支持集群的，今天就主要来介绍一下如何搭建Kafka集群。 Kafka目前支持使用Zookeeper模式搭建集群以及KRaft模式（即无Zookeeper）模式这两种模式搭建集群，这两种模式各有各的好处，今天就来分别介绍一下这两种方式。 1，Kafka集群中的节点类型我们首先需要了解一下，一个Kafka集群是由下列几

开发运维 2023-11-09 醒在深海的猫

为什么 Kafka 的吞吐量那么高？

在众多的消息中间件中，Kafka 的性能和吞吐量绝对是顶尖级别的，那么问题来了， Kafka 是如何做到高吞吐的。在性能优化方面，它使用了哪些技巧呢？下面我们就来分析一下。以'批'为单位批量处理是一种非常有效的提升系统吞吐量的方法，操作系统提供的缓冲区也是如此。在 Kafka 内部，消息处理是以"批"为单位的，生产者、Broker、消费者，都是如此。在 Kafka 的客户端 SDK 中，生产

开发运维 2023-11-07 醒在深海的猫

我们一起聊聊 B 站 Kafka 探索与实践

1.背景 Kafka 是我们公司各个部门的重要数据中间件，主要用于上报、暂存和分发各种数据。我们不仅支持大数据场景，同时也保障在线场景的稳定性。我们拥有1000+台Kafka机器，组成了20多个集群，针对不同业务场景配置了不同规格的机器，磁盘类型包括HDD，SSD和NVME。每日PB级输入，输出数十PB，肩负着公司数据传输的重任。随着集群规模的扩张，我们也遇到了越来越多的挑战。图片 2.面临的

开发运维 2023-11-03 穿过生命散发芬芳

Kafka 在分布式系统中的七大应用场景

Kafka 介绍 Kafka 是一个开源的分布式流式平台，它可以处理大量的实时数据，并提供高吞吐量，低延迟，高可靠性和高可扩展性。Kafka 的核心组件包括生产者（Producer），消费者（Consumer），主题（Topic），分区（Partition），副本（Replica），日志（Log），偏移量（Offset）和代理（Broker）。Kafka 的主要特点有：数据磁盘持久化：Kafka

开发运维 2023-10-24 张二河

如何确定Apache Kafka的大小和规模

作者丨Andrew Mills 编译丨云昭调整或扩展Kafka以获得最佳成本和性能的第一步是了解数据流平台如何使用资源。这里给一些实用的建议。实现Apache Kafka的团队，或者扩展他们对强大的开源分布式事件流平台的使用，通常需要帮助理解如何根据他们的需求正确地调整和扩展Kafka资源。这可能很棘手。无论您是在考虑云资源还是预处理硬件资源，了解Kafka集群将如何利用CPU、RAM和存储

开发运维 2023-10-23 三掌柜

Apache Kafka 是一个分布式流处理平台，也是一种高性能、可扩展的消息系统。它在处理海量数据时表现出色，而且易于使用和部署。 Apache Kafka 是一种分布式发布-订阅消息系统，由 LinkedIn 公司开发。它具有高性能、高并发、可扩展等特点，适合用于大型实时数据处理场景。Kafka 的核心概念包括： 1、消息（Message）：Kafka 中的基本数据单元，由一个键和一个值组成。

开发运维 2023-10-23 向阳逐梦

阅读：Kafka a Distributed Messaging System for Log Processing

本篇论文发表于2011年，应该是 Kafka 在 Linkedin 内部应用不久便发布的（可以从论文中的描述得知，可能更接近0.7版本），所以对于 Kafka 的架构设计及部分功能的与后续被广泛使用时会有显著差距，但核心的内容并无二致。 Kafka 诞生的初衷是用于处理海量的日志数据，所以相较传统的消息（Pub/Sub）系统拥有更高的吞吐量。而在 Kafka 之前对于日志的处理大多采用主动抓取的方

系统运维 2023-10-16 大猫

阅读：Kafka a Distributed Messaging System for Log Processing

Mac及Linux环境下配置Kafka

准备Kafka 下载Kafka 💡这里以Kafka 3.5.0为例。Kafka的运行依赖Zookeeper，但由于现在的Kafka版本都内置了Zookeeper，因此无需额外配置。前往Apache Kafka官网下载kafka_2.13-3.5.0.tgz。解压Kafka 将下载的Kafka解压至安装目录，这里以/usr/local/为例： sudo tar -zxvf kafka_2.13-

系统运维 2023-10-16 穿过生命散发芬芳

深入探究Kafka ISR机制与Spring Cloud应用实践

Apache Kafka广泛应用于处理实时数据流，其中ISR（In-Sync Replicas）机制起到关键作用，确保数据可靠性和系统高可用性。本文将深入探讨ISR机制，对其原理和源码进行剖析，并展示如何在Spring Cloud环境下实现和利用ISR。 ISR机制原理 Kafka的数据分散存储在不同的分区中，每个分区都有一个leader副本和多个follower副本。ISR是当前分区内与lead

开发运维 2023-10-13 剑圣无痕

使用 Spring Boot 和 Kafka Streams 进行实时数据处理

Spring Boot 和 Apache Kafka Streams 是两个强大的工具，它们使开发人员能够创建可靠且可扩展的实时数据处理应用程序。在这篇文章中，我们将了解 Spring Boot 和 Kafka Streams 如何协同工作，如何利用流处理来发挥应用程序的优势。还将探索交互式查询，这是一个相对较新且有趣的功能，为实时数据分析提供了新的机会。安装Kafka Kafka可以从官方网站

开发运维 2023-10-11 贤蛋大眼萌

工具使用集|Kafka：官方文档简明解读（续）

前言 kafka 官方文档浅读，好吃力。已经有大半个月没有更新了，记录一下kafak相关的内容。 konwlage Kafka不是一个传统的消息传递系统，而更类似于一个持久性的分布式发布订阅消息日志。那么kafka一般将数据持久化在哪里呢？ kafka的持久化数据存储通常存储在称为"日志目录"（log directory）的文件系统路径上。每个Kafka主题（topic）都有一个或多个分区（p

开发运维 2023-10-11 大白菜程序猿

Kafka KRaft线上集群部署实战(broker、controller分离部署)

这里是weihubeats,觉得文章不错可以关注公众号小奏技术，文章首发。拒绝营销号，拒绝标题党 kafka版本 kafka_2.13-3.5.0 背景继之前Linux Kafka 3.5 KRaft模式集群部署:weihubeats.blog.csdn.net/article/det… 我们采用的一个节点即是broker又是controller，这种部署方式仅适合于测试环境，本次我们要实现线

开发运维 2023-10-09 醒在深海的猫

Kafka KRaft线上集群部署实战(broker、controller分离部署)

Java Kafka基本操作

安装zookeeper 下载镜像：docker pull zookeeper:3.4.14 创建容器：docker run -d --name zookeeper -p 2181:2181 zookeeper:3.4.14 安装kafka 下载容器：docker pull wurstmeister/kafka:2.12-2.3.1 创建容器： docker run -d --name kafka

开发运维 2023-10-05 竹子爱熊猫

kafka:org.apache.kafka.common.network.InvalidReceiveException

背景今日练习kafka相关操作，但是却爆出了Failed to create new KafkaAdminClient的错误控制台看不出什么，于是我又看了下docker中kafka的日志主要是这一行：org.apache.kafka.common.network.InvalidReceiveException: Invalid receive (size = 369295616 larger

开发运维 2023-10-05 向阳逐梦

kafka:org.apache.kafka.common.network.InvalidReceiveException

上一页 1 … 4 5 6 … 8 下一页