
这个项目是在 Apple M4 Mac mini 16GB 上,用 MLX 从随机初始化开始训练一个 TinyStories 风格的小型 GPT 模型。它不是调用 API,也不是微调现成模型,而是把数据准备、tokenizer、模型结构、训练循环、checkpoint 和推理生成完整走了一遍。
这篇记录更偏工程复盘:重点不是训练出一个能聊天的模型,而是验证个人机器能不能完整跑通一次小规模 LLM 训练。

这个项目是在 Apple M4 Mac mini 16GB 上,用 MLX 从随机初始化开始训练一个 TinyStories 风格的小型 GPT 模型。它不是调用 API,也不是微调现成模型,而是把数据准备、tokenizer、模型结构、训练循环、checkpoint 和推理生成完整走了一遍。
这篇记录更偏工程复盘:重点不是训练出一个能聊天的模型,而是验证个人机器能不能完整跑通一次小规模 LLM 训练。
使用 Systems Manager Patch Manager 扫描 Windows Server 2019 补丁时,如果 SSM Agent、网络和权限都正常,但 WindowsUpdate.log 里显示微软更新服务返回 503,根因可能在微软侧,而不是 AWS 侧。
使用自建 Active Directory 创建 FSx for Windows File Server 时,如果 Single-AZ 2 或 Multi-AZ 文件系统创建失败,并且报 Get-ADComputer: Unable to contact the server,要重点检查 FSx 子网到域控 TCP 9389 的连通性。
这次迁移主要做了两件事:先修复 Debian 12 上 Docker 端口映射失败的问题,再把 new-api 从 SQLite 迁移到 MySQL。过程里踩到的坑不少,尤其是 iptables/nftables 兼容性和 SQLite 到 MySQL 的语法差异。

新 Mac 到手后,我习惯先做一次系统化检测:硬件信息、SSD 健康、接口状态、安全配置、系统稳定性都过一遍。这样后面如果遇到异常,可以知道是机器本身的问题,还是后续使用环境造成的。
一次很离谱的经历:Dock 里的 VS Code 图标突然变成通用应用图标,Finder 里原本的 Visual Studio Code.app 也不见了。最后排查下来,问题出在 VS Code 自动更新、ShipIt 后台进程和跨 APFS 卷移动之间。
Kali 自带很多安全测试工具,如果不想占用 C 盘空间,可以把 WSL 发行版迁移到 E 盘。本文记录安装 Kali WSL、导出备份、重新导入到指定目录,以及设置默认登录用户的过程。
AWS 中国区没有直接提供 Windows 11 AMI,VM Import/Export 也需要额外准备镜像和导入流程。一个折中方式是先启动 Linux EC2,再通过开源 reinstall 脚本把系统重装成 Windows。
项目地址:bin456789/reinstall
参考文档:CSDN 原文