Zigbook – Learn the Zig Programming Language

概览

上一章聚焦格式化与文本，其他章节介绍了使用简单缓冲输出的基础打印。本章深入 Zig 0.15.2 的流式原语：现代std.Io.Reader/std.Io.Writer接口及其配套适配器（限流视图、丢弃、复制、简单计数）。这些抽象有意暴露缓冲内部，使性能关键路径（格式化、分隔符扫描、哈希）保持确定性且零分配。不同于其他语言的不透明 I/O 层，Zig 的适配器极薄——往往是操作显式切片与索引的普通结构体方法。Writer.zig Reader.zig

您将学习如何创建固定的内存写入器、迁移传统的 std.io.fixedBufferStream 使用、使用 limited 限制读取、复制输入流（tee）、高效丢弃输出以及组装管道（例如，分隔符处理）而无需隐藏分配。每个示例都很小、自包含，并演示了您可以在连接文件、套接字或未来异步抽象时重用的单个概念。

学习目标

使用 Writer.fixed / Reader.fixed 构造固定缓冲区写入器/读取器并检查缓冲的数据。
安全地从传统的 std.io.fixedBufferStream 迁移到较新的 API。44
使用 Reader.limited 强制执行字节限制，以保护解析器免受失控输入的影响。Limited.zig
实现复制（tee）和丢弃模式，无需额外分配。10
使用 takeDelimiter / 相关助手流式传输分隔符分隔的数据进行行处理。
分析何时选择缓冲与直接流式传输及其性能影响。39

基础：固定 Writer 与 Reader

基石抽象是表示流端点状态的值类型。固定 writer 会缓冲字节，直至缓冲满或显式刷新；固定 reader 暴露其缓冲区域的切片，并提供 peek/take 语义，便于在不复制的情况下进行增量解析。3

固定 Writer 基础（）

创建内存写入器，发出格式化的内容，然后检查并转发缓冲的切片。这反映了早期的格式化模式，但无需分配 ArrayList 或处理动态容量。45

Zig

const std = @import("std");

// 演示使用新的 std.Io.Writer API 进行基本的缓冲写入
// 然后通过旧的 std.io File 写入器刷新到标准输出。
pub fn main() !void {
    var buf: [128]u8 = undefined;
    // 由固定缓冲区支持的新流式写入器。写入会累积直到刷新/消费。
    var w: std.Io.Writer = .fixed(&buf);

    try w.print("Header: {s}\n", .{"I/O adapters"});
    try w.print("Value A: {d}\n", .{42});
    try w.print("Value B: {x}\n", .{0xdeadbeef});

    // 获取缓冲字节并通过 std.debug（标准输出）打印
    const buffered = w.buffered();
    std.debug.print("{s}", .{buffered});
}

运行

Shell

$ zig run reader_writer_basics.zig

输出

Shell

Header: I/O adapters
Value A: 42
Value B: deadbeef

缓冲由用户所有；你决定其生命周期与大小预算。不会发生隐式堆分配——这对紧密循环或嵌入式目标至关重要。

从迁移

传统的 fixedBufferStream（小写 io）返回带有 reader() / writer() 方法的包装器类型。Zig 0.15.2 保留它们以保持兼容性，但更倾向于使用 std.Io.Writer.fixed / Reader.fixed 来进行统一的适配器组合。1 fixed_buffer_stream.zig

Zig

const std = @import("std");

// 演示传统 fixedBufferStream（已弃用，推荐使用 std.Io.Writer.fixed）
// 以突出迁移路径。
pub fn main() !void {
    var backing: [64]u8 = undefined;
    var fbs = std.io.fixedBufferStream(&backing);
    const w = fbs.writer();

    try w.print("Legacy buffered writer example: {s} {d}\n", .{ "answer", 42 });
    try w.print("Capacity used: {d}/{d}\n", .{ fbs.getWritten().len, backing.len });

    // Echo buffer contents to stdout.
    // 回显缓冲区内容到stdout。
    std.debug.print("{s}", .{fbs.getWritten()});
}

运行

Shell

$ zig run fixed_buffer_stream.zig

输出

Shell

Legacy buffered writer example: answer 42
Capacity used: 42/64

面向未来的互操作性，优先使用首字母大写的 Io 新接口；随着更多适配器转向现代接口，fixedBufferStream 可能最终退出历史舞台。

限制输入（）

使用硬上限包装读取器以防御过大的输入（例如，标题部分、魔术前缀）。一旦限制耗尽，后续读取会提早指示流结束，保护下游逻辑。4

Zig

const std = @import("std");

// 使用 std.Io.Reader.Limited 从输入中最多读取 N 个字节
pub fn main() !void {
    const input = "Hello, world!\nRest is skipped";
    var r: std.Io.Reader = .fixed(input);

    var tmp: [8]u8 = undefined; // 限制读取器背后的缓冲区
    var limited = r.limited(.limited(5), &tmp); // 只允许前 5 个字节

    var out_buf: [64]u8 = undefined;
    var out: std.Io.Writer = .fixed(&out_buf);

    // 泵送直到限制触发限制读取器的 EndOfStream
    _ = limited.interface.streamRemaining(&out) catch |err| {
        switch (err) {
            error.WriteFailed, error.ReadFailed => unreachable,
        }
    };

    std.debug.print("{s}\n", .{out.buffered()});
}

运行

Shell

$ zig run limited_reader.zig

输出

Shell

Hello

使用 limited(.limited(N), tmp_buffer) 进行协议保护；解析函数可以假设有界消耗并在提前结束时干净地退出。33

适配器与模式

更高级别的行为（计数、tee、丢弃、分隔符流式传输）通过 buffered() 和小型辅助函数的简单循环出现，而不是繁重的继承或特征链。39

字节计数（缓冲长度）

在许多场景中，您只需要到目前为止生成的字节数——读取写入器当前缓冲的切片长度就足够了，避免了专用的计数适配器。10

Zig

const std = @import("std");

// 使用 Writer.fixed 和缓冲长度的简单计数示例。
pub fn main() !void {
    var buf: [128]u8 = undefined;
    var w: std.Io.Writer = .fixed(&buf);
    try w.print("Counting: {s} {d}\n", .{ "bytes", 123 });
    try w.print("And more\n", .{});
    const written = w.buffered().len;
    std.debug.print("Total bytes logically written: {d}\n", .{written});
}

运行

Shell

$ zig run counting_writer.zig

输出

Shell

Total bytes logically written: 29

对于在刷新后缓冲区长度重置的流式接收器，集成一个自定义的 update 函数（参见哈希写入器设计）来跨刷新边界累积总计。

丢弃输出（）

基准测试和干运行通常需要测量格式化或转换成本，而不保留结果。消费缓冲区会将其长度归零；后续写入继续正常进行。45

Zig

const std = @import("std");

// 演示 std.Io.Writer.Discarding 以忽略输出（在基准测试中很有用）
pub fn main() !void {
    var buf: [32]u8 = undefined;
    var w: std.Io.Writer = .fixed(&buf);

    try w.print("Ephemeral output: {d}\n", .{999});

    // 通过消费缓冲字节来丢弃内容
    _ = std.Io.Writer.consumeAll(&w);

    // 显示缓冲区现在为空
    std.debug.print("Buffer after consumeAll length: {d}\n", .{w.buffered().len});
}

运行

Shell

$ zig run discarding_writer.zig

输出

Shell

Buffer after consumeAll length: 0

consumeAll 是一种结构性的无分配操作；它只是调整 end 并（如果需要）移动剩余的字节。对于紧凑的内循环来说足够便宜。

Tee / 复制

复制流（"tee"）可以手动构建：偷看、写入两个目标、丢弃。这避免了中间堆缓冲区，适用于有限或流水线输入。28

Zig

const std = @import("std");

fn tee(r: *std.Io.Reader, a: *std.Io.Writer, b: *std.Io.Writer) !void {
    while (true) {
        const chunk = r.peekGreedy(1) catch |err| switch (err) {
            error.EndOfStream => break,
            error.ReadFailed => return err,
        };
        try a.writeAll(chunk);
        try b.writeAll(chunk);
        r.toss(chunk.len);
    }
}

pub fn main() !void {
    const input = "tee me please";
    var r: std.Io.Reader = .fixed(input);

    var abuf: [64]u8 = undefined;
    var bbuf: [64]u8 = undefined;
    var a: std.Io.Writer = .fixed(&abuf);
    var b: std.Io.Writer = .fixed(&bbuf);

    try tee(&r, &a, &b);

    std.debug.print("A: {s}\nB: {s}\n", .{ a.buffered(), b.buffered() });
}

运行

Shell

$ zig run tee_stream.zig

输出

Shell

A: tee me please
B: tee me please

写入前始终执行peekGreedy(1)（或合适大小）；若不确保已缓冲内容，可能导致不必要的底层读取或过早终止。44

分隔符流式管线

基于行或记录的协议受益于 takeDelimiter，它返回不包含分隔符的切片。循环直到 null 来处理所有逻辑行，而无需复制或分配。31

Zig

const std = @import("std");

// 演示使用分隔符流将 Reader -> Writer 管道组合。
pub fn main() !void {
    const data = "alpha\nbeta\ngamma\n";
    var r: std.Io.Reader = .fixed(data);

    var out_buf: [128]u8 = undefined;
    var out: std.Io.Writer = .fixed(&out_buf);

    while (true) {
        // 流式传输一行（不包括分隔符），然后打印处理后的形式
        const line_opt = r.takeDelimiter('\n') catch |err| switch (err) {
            error.StreamTooLong => unreachable,
            error.ReadFailed => return err,
        };
        if (line_opt) |line| {
            try out.print("Line({d}): {s}\n", .{ line.len, line });
        } else break;
    }

    std.debug.print("{s}", .{out.buffered()});
}

运行

Shell

$ zig run stream_pipeline.zig

输出

Shell

Line(5): alpha
Line(4): beta
Line(5): gamma

takeDelimiter 在最后一段之后产生 null——即使底层数据以分隔符结束——允许简单的终止检查而无需额外状态。4

注意与警示

固定缓冲区是有限的：超出容量会触发可能失败的写入——根据最坏情况下的格式化输出选择大小。45
limited 强制执行硬性上限；原始流的任何剩余部分保持未读状态（防止过读漏洞）。
分隔符流式传输需要非零缓冲区容量；极小的缓冲区可能由于频繁的底层读取而降低性能。39
混合传统的 std.io.fixedBufferStream 和新的 std.Io.* 是安全的，但为了未来的维护，建议保持一致性。
通过 buffered().len 计数不包括刷新的数据——如果在管道中间刷新，请使用持久累加器。10

练习

实现一个简单的行计数器，如果任何单行超过 256 字节则使用 limited 包装器中止。4
构建一个 tee，同时使用哈希写入器适配器中的 Hasher.update 计算所有流式传输字节的 SHA-256 哈希。sha2.zig
编写一个基于分隔符 + 限制的读取器，从大型记录中仅提取前 M 个 CSV 字段，而不读取整个行。44
扩展计数示例以在使用 {any} 格式化时跟踪逻辑（格式化后）和原始内容长度。45

注意事项、替代方案与边界情况

零容量写入器是合法的，但会立即强制耗尽——为了性能，除非有意测试错误路径，否则应避免。
复制非常大的缓冲块的 tee 循环可能会垄断缓存；对于巨大的流，考虑分块以提高局部性。39
takeDelimiter 将流结束符视为与分隔符类似；如果必须区分尾随空段，请跟踪处理的最后一个字节是否为分隔符。31
与文件系统 API（第 28 章）直接混合会引入平台特定的缓冲区；在包装 OS 文件描述符时重新验证限制。28
如果未来的异步 I/O 引入暂停点，依赖紧凑的 peek/toss 循环的适配器必须确保跨产量的不变性——尽早记录假设。17