HespethornのBlog

Created2025-11-19|工厂模式

在开发脚本引擎或配置解析工具时，我们经常需要处理多种类型的语句（赋值、条件、循环等）。本文将通过一个实用的语句解析器案例，展示如何用注册式工厂模式构建易于扩展的解析系统。一、需求分析与设计思路我们需要开发一个支持以下语句类型的解析器：赋值语句（如x = 100）条件语句（如if x > 5）循环语句（如for i in 0..10）核心挑战是：当需要支持新语句类型时，无需修改现有解析逻辑，只需添加新的解析器实现。这正是工厂模式的用武之地。整体设计方案：定义抽象解析器接口（基类）为每种语句实现具体解析器（派生类）用注册式工厂管理解析器的创建通过语句特征自动匹配对应的解析器二、核心代码实现1. 抽象解析器接口首先定义所有解析器的公共接口： 12345678910111213#include <string>// 语句解析器基类class StatementParser {public: virtual ~StatementParser() = default; //...

Leetcode 0025.reverse-nodes-in-k-group

Created2025-11-18|List

25. K 个一组翻转链表给你链表的头节点 head ，每 k 个节点一组进行翻转，请你返回修改后的链表。 k 是一个正整数，它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍，那么请将最后剩余的节点保持原有顺序。你不能只是单纯的改变节点内部的值，而是需要实际进行节点交换。示例 1： 12输入：head = [1,2,3,4,5], k = 2输出：[2,1,4,3,5] 示例 2： 12输入：head = [1,2,3,4,5], k = 3输出：[3,2,1,4,5] 解题思路：「K 个一组翻转链表」的核心思路是：分组遍历：每次取 K 个节点作为一组，若不足 K 个则停止。翻转每组：对当前 K 个节点进行翻转。连接各组：将翻转后的组与前一组连接，更新指针继续处理下一组。具体步骤：用 dummy 虚拟头节点简化边界处理（避免头节点特殊逻辑）。用 pre 记录上一组的尾节点（翻转后作为连接点）。用 end 遍历并检查当前组是否有 K 个节点。翻转当前组后，重新连接 pre 与翻转后的组，并更新 pre 和...

Leetcode 0023.merge-k-sorted-lists

Created2025-11-18|Lists

23. 合并 K 个升序链表给你一个链表数组，每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中，返回合并后的链表。示例 1： 12345678910输入：lists = [[1,4,5],[1,3,4],[2,6]]输出：[1,1,2,3,4,4,5,6]解释：链表数组如下：[ 1->4->5, 1->3->4, 2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6 示例 2： 12输入：lists = []输出：[] 示例 3： 12输入：lists = [[]]输出：[] 题目大意多个有序链表的合并，使用归并排序整理有序链表，更优秀的思考是采用优先级队列（小根堆）来排序。归并可以看21题。解题思路解法一：分治法（两两合并）思路核心借鉴「归并排序」的分治思想，将 K 个链表逐步拆分为成对的子问题，合并后再递归 / 迭代合并结果，减少重复比较次数。步骤拆解边界处理：若 lists 为空，直接返回...

Leetcode 0022.GenerateParentheses

Created2025-11-18|C-Code

22. Generate Parentheses题目Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses. For example, given n = 3, a solution set is: [ "((()))", "(()())", "(())()", "()(())", "()()()" ] 题目大意给出 n 代表生成括号的对数，请你写出一个函数，使其能够生成所有可能的并且有效的括号组合。解题思路这道题乍一看需要判断括号是否匹配的问题，如果真的判断了，那时间复杂度就到 O(n * 2^n)了，虽然也可以 AC，但是时间复杂度巨高。这道题实际上不需要判断括号是否匹配的问题。因为在 DFS 回溯的过程中，会让 ( 和 )...

Leetcode 0021.合并两个有序链表

Created2025-11-18|链表

21. 合并两个有序链表将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例 1： 12输入：l1 = [1,2,4], l2 = [1,3,4]输出：[1,1,2,3,4,4] 示例 2： 12输入：l1 = [], l2 = []输出：[] 示例 3： 12输入：l1 = [], l2 = [0]输出：[0] 题目大意需要将两个升序排列的链表合并成一个新的升序链表，新链表由原两个链表的所有节点组成，且保持升序排列。解题思路使用虚拟头节点（dummy node）简化边界情况处理双指针遍历两个链表，比较当前节点值，将较小的节点接入结果链表当一个链表遍历完毕后，将另一个链表的剩余部分直接接入结果链表这种方法的时间复杂度为 O (n + m)，其中 n 和 m 分别是两个链表的长度，空间复杂度为 O (1)，仅使用了常数个额外节点。 1234567891011121314151617181920212223242526272829303132333435363738/** * Definition for...

C++ 模板工厂模式：从手动注册到自动发现的进化之路

Created2025-11-12|工厂模式

在软件开发中，工厂模式是解耦对象创建与使用的经典方案。但传统工厂模式在面对频繁新增产品时，总会陷入修改工厂类的尴尬。本文将带你探索如何用 C++ 模板实现自动注册的工厂模式，彻底解决这一痛点。一、传统工厂的 "if-else 地狱"假设我们要开发一个支持多种日志输出的组件（控制台日志、文件日志、网络日志），传统工厂实现可能是这样的： 123456789101112131415161718class Logger {public: virtual void log(const std::string& msg) = 0; virtual ~Logger() = default;};class ConsoleLogger : public Logger { /* 实现 */ };class FileLogger : public Logger { /* 实现 */ };class LoggerFactory {public: static...

Gerrit使用指北

Created2025-11-01|代码提交

一、Gerrit 是什么？为什么需要它？Gerrit 是一款基于 Git 的开源代码审查工具，核心价值在于强制代码评审流程，通过多人协作把关代码质量，减少线上缺陷，同时保留完整的变更追溯记录。它特别适合中小型团队：支持细粒度权限控制（谁能提交 / 评审 / 合并代码）与 Git 原生兼容，无需改变现有开发习惯网页端可视化评审界面，支持评论、打分、变更追踪可集成 CI/CD 流程（如 Jenkins、GitHub Actions），实现自动化验证对比直接提交 Git 仓库：Gerrit 通过「虚拟分支」机制拦截直接提交，确保所有代码变更都经过评审，尤其适合需要严格质量管控的 C/C++ 工程（如嵌入式、工具类项目）。二、环境准备与安装配置（服务器端）1. 核心依赖操作系统：Linux（推荐 Ubuntu 20.04+/CentOS 7+）依赖软件：Java 8+（Gerrit 基于 Java 开发）、Git、数据库（默认 H2，生产环境推荐 MySQL/PostgreSQL） 2....

CMake+Git实现C++项目版本号管理

Created2025-10-21|CMake

一、基础认知：版本号规范与核心逻辑在开展实操之前，需明确两个核心基础内容：版本号的规范化格式标准与该方案的核心实现逻辑，为后续操作提供理论支撑。 1. 语义化版本规范（SemVer）建议采用「语义化版本规范（Semantic Versioning, SemVer）」，其格式定义为：主版本号.次版本号.补丁版本号（例如 v1.2.3），各组成部分的语义含义如下：主版本号（Major）：当项目进行不兼容的API变更时递增，此时旧版本代码无法直接适配（例如 v2.0.0，代表项目功能架构发生重大调整）；次版本号（Minor）：当项目新增向后兼容的功能时递增，不影响现有代码的正常运行（例如 v1.3.0，代表在原有基础上扩展功能）；补丁版本号（Patch）：当项目进行向后兼容的问题修复时递增，仅修正缺陷不新增功能（例如 v1.2.4，代表针对现有版本的Bug修复）；可选后缀：包括预发布版本标识（例如 v1.2.3-beta，用于标识测试阶段版本）与构建信息（例如 v1.2.3+20241201，用于记录版本编译时间）。 2....

YAML 配置指南

Created2025-10-15|Data Structures and Algorithms

一、什么是 YAML？—— 不止于「另一种配置文件」YAML 全称 YAML Ain't Markup Language（YAML 不是标记语言），听着像绕口令，核心却是「反标记语言」的设计理念：用最简洁的语法描述数据结构，让人类一眼能看懂，机器也能轻松解析。它诞生于 2001 年，初衷是替代 XML 的繁琐标签和 JSON 的大括号，如今已成为配置文件的「首选格式」—— 你在 Kubernetes、Docker Compose、Spring Boot、GitHub Actions 等场景中，随处可见它的身影。核心定位：人类可读、机器可解析的数据序列化语言，专注于配置场景的简洁性和易用性。二、为什么选择 YAML？—— 三大核心优势对比 XML、JSON，YAML 的优势一目了然：特性 XML（繁琐） JSON（简洁但局限） YAML（平衡之选）语法简洁度需闭合标签（）需大括号 / 引号，无注释无多余符号，支持注释可读性低（标签冗余）中（结构清晰但缺乏注释）高（自然语言般的层级）数据类型支持需定义...

C++相对路径：从编译到运行

Created2025-10-07|C++Data Structures and Algorithms

步骤 1：说明编译与运行时工作目录的分离特性首先，我们必须明确一个基本原则：编译器的工作目录和程序运行时的工作目录是两个完全独立的概念。 1.1 编译时路径解析编译器（如GCC, Clang, MSVC）在处理源代码时，主要涉及两种路径： #include "my_header.h"：这种形式的包含指令，编译器会首先在包含该指令的源文件所在的目录下查找my_header.h。如果找不到，再在编译器指定的系统或用户包含路径（通过-I参数指定）中查找。 #include <iostream>：这种形式，编译器会直接在系统或用户指定的包含路径中查找，而不会在当前源文件目录中查找。关键点：编译时的路径解析是为了定位源文件和头文件，以便将它们组合成一个翻译单元并生成目标文件（.o或.obj）。这个过程与程序最终运行时需要读取的数据文件（如配置、图片、资源）毫无关系。 1.2...

Leetcode 0570. 至少有5名直接下属的经理

Created2025-10-07|LeetcodeMysql

570. 至少有5名直接下属的经理表: Employee 123456789101112+-------------+---------+| Column Name | Type |+-------------+---------+| id | int || name | varchar || department | varchar || managerId | int |+-------------+---------+id 是此表的主键（具有唯一值的列）。该表的每一行表示雇员的名字、他们的部门和他们的经理的id。如果managerId为空，则该员工没有经理。没有员工会成为自己的管理者。编写一个解决方案，找出至少有五个直接下属的经理。以任意顺序返回结果表。查询结果格式如下所示。示例 1: 123456789101112131415161718输入: Employee 表:+-----+-------+------------+-----------+| id | name | department...

Leetcode 0626. 换座位

Created2025-10-07|LeetcodeMysql

626. 换座位表: Seat 123456789+-------------+---------+| Column Name | Type |+-------------+---------+| id | int || student | varchar |+-------------+---------+id 是该表的主键（唯一值）列。该表的每一行都表示学生的姓名和 ID。ID 序列始终从 1 开始并连续增加。编写解决方案来交换每两个连续的学生的座位号。如果学生的数量是奇数，则最后一个学生的id不交换。按 id 升序返回结果表。查询结果格式如下所示。示例 1: 1234567891011121314151617181920212223输入: Seat 表:+----+---------+| id | student |+----+---------+| 1 | Abbot || 2 | Doris || 3 | Emerson || 4 | Green || 5 | Jeames ...

Leetcode 0180. 连续出现的数字

Created2025-10-07|LeetcodeMysql

180. 连续出现的数字表：Logs 12345678+-------------+---------+| Column Name | Type |+-------------+---------+| id | int || num | varchar |+-------------+---------+在 SQL 中，id 是该表的主键。id 是一个自增列。找出所有至少连续出现三次的数字。返回的结果表中的数据可以按任意顺序排列。结果格式如下面的例子所示：示例 1: 123456789101112131415161718192021输入：Logs 表：+----+-----+| id | num |+----+-----+| 1 | 1 || 2 | 1 || 3 | 1 || 4 | 2 || 5 | 1 || 6 | 2 || 7 | 2 |+----+-----+输出：Result 表：+-----------------+| ConsecutiveNums...

Leetcode 0461.hamming-distance

Created2025-10-05|Leetcode

461. 汉明距离两个整数之间的汉明距离指的是这两个数字对应二进制位不同的位置的数目。给你两个整数 x 和 y，计算并返回它们之间的汉明距离。示例 1： 1234567输入：x = 1, y = 4输出：2解释：1 (0 0 0 1)4 (0 1 0 0) ↑ ↑上面的箭头指出了对应二进制位不同的位置。示例 2： 12输入：x = 3, y = 1输出：1 题目大意汉明距离是指两个整数的二进制表示中，对应位置二进制位不同的数目。给定两个整数 x 和 y，计算并返回它们之间的汉明距离。例如：输入 x=1, y=4，二进制分别为 0001 和 0100，对应位不同的位置有 2 处，输出 2；输入 x=3, y=1，二进制分别为 0011 和 0001，对应位不同的位置有 1 处，输出 1。解题思路核心思路是利用异或运算 + 统计 1 的个数，步骤如下：异或运算（XOR）：异或的特性是 “相同为 0，不同为 1”。对 x 和 y 做异或操作，得到的结果 xor_result 中，每一位的 1 都对应 x 和 y...

BM25 算法解析

Created2025-10-01|C++Data Structures and Algorithms

一、BM25 算法核心原理：从公式到 C++ 实现关注点BM25（Best Matching 25）是基于概率检索模型的改进算法，核心是在 TF-IDF 的基础上增加文档长度归一化和参数可调性，解决 “长文档过度匹配” 的问题。理解原理时，需重点关注与 C++ 实现强相关的设计点。 1.1 核心公式与参数意义BM25 的单术语 - 文档相关性评分公式如下： $score(q, d) = IDF(q) \times \frac{TF(q, d) \times (k_1 + 1)}{TF(q, d) + k_1 \times (1 - b + b \times \frac{len(d)}{avg_len})}$ 其中关键参数与 C++ 实现的关联的： $TF(q,d)$在文档$d$中的词频，需存储在倒排索引中，用float类型平衡精度与内存； $len(d)$文档$d$的长度（术语数），需在文档元数据中记录，用uint32_t节省内存； $avg_len$所有文档的平均长度，预处理阶段计算后全局缓存，避免重复计算； $k$词频饱和系数（通常取...

C++ 高级特性

Created2025-09-27|Interview

一、C++11新特性概述记忆口诀：C++11新特性，语法库扩双提升；auto decltype智能指，nullptr范围循环使；右值引用move效，无序容器正则到；Lambda匿名函数好，代码简洁效率高。1. 语法改进统一初始化方法成员变量默认初始化 auto关键字：编译器自动推断类型 decltype：推导表达式类型智能指针：std::shared_ptr、std::unique_ptr 空指针nullptr：替代NULL，类型明确基于范围的for循环：简化容器遍历右值引用和move语义：提高资源转移效率 2. 标准库扩充无序容器（哈希表）：类似map但效率更高正则表达式：模式匹配字符串 Lambda表达式：定义匿名函数二、智能指针记忆口诀：智能指针分三类，shared_ptr共享随；引用计数来管理，线程安全要注意；unique_ptr独占权，禁止拷贝所有权；weak_ptr旁观态，lock检查免崩溃。1. shared_ptr（共享指针）实现机制：基于引用计数，多指针共享同一资源核心组件：模板指针T*...

C++ 并发编程

Created2025-09-25|Interview

一、并发基础核心组件口诀：线程对象要管理，互斥锁来保安全，原子操作不可拆，条件变量通信忙1.1 std::thread - 线程管理构造方式：默认构造：创建空线程对象初始化构造：thread t(func, args...)，传入函数和参数移动构造：支持线程所有权转移，不支持拷贝生命周期管理： join()：主线程等待子线程完成，阻塞当前线程 detach()：线程独立运行，与主线程分离关键注意：线程对象销毁前必须调用join()或detach()，否则程序崩溃常见陷阱：局部线程对象销毁时，若线程函数仍在运行会导致崩溃（解决：使用detach()或确保join()被调用） 1.2 std::mutex - 互斥锁基本功能：保护共享资源，确保同一时间只有一个线程访问核心方法：lock()（加锁）、unlock()（解锁）、try_lock()（尝试加锁，非阻塞）使用建议：配合RAII包装器使用，避免忘记解锁导致死锁 1.3 std::lock_guard -...

C++ 网络编程

Created2025-09-24|Interview

一、TCP Socket通信实现记忆口诀：服创绑监听，接收发关尽；客创连收发，关闭要记心。服务器端流程创建socket：调用socket()创建流式套接字（TCP）绑定地址：通过bind()将socket与IP地址和端口绑定监听连接：使用listen()开启监听，设置最大连接队列接受连接：调用accept()阻塞等待客户端连接，返回新socket 数据收发：使用send()和recv()进行数据传输关闭socket：通信结束后关闭连接客户端流程创建socket：同服务器端连接服务器：通过connect()向服务器发起连接请求数据收发：同服务器端关闭socket：通信结束后关闭连接服务器端代码示例1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465#include <iostream>#include <cstring>#include...

C++ 实现 JWT 工具类封装

Created2025-09-22|C++Practical System Development

一、JWT概念JWT（JSON Web Token）是一种用于在网络上安全传输信息的紧凑、自包含的方式。它由三部分组成：头部（Header）、载荷（Payload）和签名（Signature），通过点分隔的字符串形式呈现。在身份验证和信息交换场景中应用广泛，因为它可以验证信息的完整性和真实性。 1.1 准备工作在开始之前，我们需要确保系统中安装了libjwt库，这是一个轻量级的 JWT 实现库。在 Ubuntu/Debian 系统上，可以使用以下命令安装： 1sudo apt-get install libjwt-dev 1.2 jwt.cc1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889#include <jwt.h>#include...

C++ STL 背诵版知识点总结

Created2025-09-21|Interview

一、STL容器总览口诀：三容器两适配，序列关联加无序1.1 容器分类序列容器：vector(动态数组)、list(双向链表)、deque(双端队列)、array(固定数组)、forward_list(单向链表) 关联容器：set(有序唯一集合)、map(有序键值对)、multiset(有序可重复集合)、multimap(有序可重复键值对) 无序容器：unordered_set、unordered_map、unordered_multiset、unordered_multimap 容器适配器：stack(栈)、queue(队列)、priority_queue(优先队列) 1.2 底层结构与性能对比 vector/deque: 动态数组，支持随机访问 list/forward_list: 链表，高效插入删除 set/map: 红黑树，有序且查找/插入为O(logN) unordered_*:...