<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Apple Silicon on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/apple-silicon/</link><description>Recent content in Apple Silicon on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 15 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/apple-silicon/index.xml" rel="self" type="application/rss+xml"/><item><title>【好文共赏】antirez 一周写出 DS4：当 Redis 之父把 GPT 5.5 当结对程序员，把 DeepSeek v4 Flash 装进 128GB MacBook</title><link>https://xiejiayun.github.io/post/good-read-antirez-ds4-local-inference/</link><pubDate>Fri, 15 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/good-read-antirez-ds4-local-inference/</guid><description>&lt;blockquote>
&lt;p>📌 &lt;strong>好文共赏 · Editor&amp;rsquo;s Pick&lt;/strong>
原文：&lt;a href="https://antirez.com/news/165">A few words on DS4&lt;/a> · 配套仓库 &lt;a href="https://github.com/antirez/ds4">antirez/ds4&lt;/a>
作者：Salvatore Sanfilippo（&lt;strong>antirez&lt;/strong>，Redis 原作者）
发布：2026-05-14（HN 上线 2 小时即冲到首页第二，48h 内仓库 8.8k ⭐ / 726 forks）
多模评分：&lt;strong>Opus 9.0 / Sonnet 8.7 / Gemini 8.8（综合 8.83/10）&lt;/strong>
一句话推荐：这是 antirez 在 &lt;em>Redis 时代&lt;/em> 之后的第一份&amp;quot;我下半生想做的事&amp;quot;的草稿——不是又一个 llama.cpp 的 fork，而是用 &lt;strong>一个模型 + 一套量化 + 一台 Mac&lt;/strong> 这三件事把&amp;quot;本地 AI 主权&amp;quot;重新定义了一次。&lt;/p></description></item><item><title>【好文共赏】把 Swift 推到 1.1 Tflop/s：Matt Gallagher 用十种实现，在 M3 Max 上手写 LLM 训练，把矩阵乘法跑出 382 倍提升</title><link>https://xiejiayun.github.io/post/good-read-matt-gallagher-swift-llm-matmul/</link><pubDate>Fri, 15 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/good-read-matt-gallagher-swift-llm-matmul/</guid><description>&lt;blockquote>
&lt;p>📌 &lt;strong>好文共赏 · Editor&amp;rsquo;s Pick&lt;/strong>&lt;/p>
&lt;ul>
&lt;li>&lt;strong>原文&lt;/strong>：&lt;a href="https://www.cocoawithlove.com/blog/matrix-multiplications-swift.html">Training an LLM in Swift, Part 1: Taking matrix multiplication from Gflop/s to Tflop/s&lt;/a>&lt;/li>
&lt;li>&lt;strong>作者&lt;/strong>：Matt Gallagher（&lt;a href="https://www.cocoawithlove.com/">Cocoa with Love&lt;/a> 主理人，iOS/macOS 资深独立开发者）&lt;/li>
&lt;li>&lt;strong>发布时间&lt;/strong>：2026 年 4 月 18 日&lt;/li>
&lt;li>&lt;strong>阅读时长&lt;/strong>：约 35 分钟（含代码与汇编片段）&lt;/li>
&lt;li>&lt;strong>多模评分&lt;/strong>：Opus 9.0 / Sonnet 8.8 / Gemini 8.7 — &lt;strong>综合 8.85 / 10&lt;/strong>&lt;/li>
&lt;li>&lt;strong>一句话推荐&lt;/strong>：一次极少有人能写出来的&amp;quot;全栈&amp;quot;性能讲座——不是 PyTorch 算子优化的高谈阔论，而是一个独立开发者用十个版本、上百行汇编、若干被 Apple 刻意藏起来的指令，把 Swift 训练 GPT-2 的速度推到比纯 C 快 30 倍、比单线程 OpenMP 快 30 倍、最终冲过 1 Tflop/s 的门槛。&lt;/li>
&lt;/ul>&lt;/blockquote>
&lt;h2 id="一为什么值得读">一、为什么值得读&lt;/h2>
&lt;p>这篇文章在 Hacker News 上拿到 260+ 分，但和大多数 HN 头条不同的是：它不是观点文，不是公司公告，也不是市场分析——它是一份&lt;strong>可复现、可量化、可单步演进&lt;/strong>的工程笔记。Matt Gallagher 不是在告诉你&amp;quot;Apple Silicon 多厉害&amp;quot;，而是把同一份 &lt;code>matmul_forward&lt;/code>（GPT-2 124M 模型里那条贯穿前向反向的矩阵乘法）写了十遍，每次只改一个变量，每次都给出 tokens/s 和训练迭代/s 的实测，每次都贴出对应的 ARM64 汇编片段，让读者亲眼看到 Swift 编译器做了什么、漏了什么、需要被怎样&amp;quot;哄&amp;quot;才能吐出和 C 同样紧凑的指令流。&lt;/p></description></item></channel></rss>