Toggle navigation
Jiayun's Blog
All Posts
ai
前沿科技
好文共赏
开源
育儿
归档
关于
Jiayun's Blog
探索与分享
【好文共赏】antirez 一周写出 DS4:当 Redis 之父把 GPT 5.5 当结对程序员,把 DeepSeek v4 Flash 装进 128GB MacBook
Salvatore Sanfilippo 在五月中旬扔出 DwarfStar 4——一个只为 DeepSeek v4 Flash 写的本地推理引擎,七天 8.8k stars。他在 antirez.com/news/165 用一篇短文说清楚了:这一次不是又一个 GGUF runner,而是把 KV cache 当成一等磁盘公民、用 2/8 bit 不对称量化把 284B MoE 塞进 128GB Mac、用 GPT 5.5 在一周内把整个 stack 写完的赌注。它真正回答的是:在 GPT 5.5 之后,'本地 AI 主权' 还剩多少现实可能。
Posted by Jiayun's Blog on Friday, May 15, 2026 00:00 UTC
【好文共赏】把 Swift 推到 1.1 Tflop/s:Matt Gallagher 用十种实现,在 M3 Max 上手写 LLM 训练,把矩阵乘法跑出 382 倍提升
Cocoa with Love 主理人 Matt Gallagher 不用任何框架库,从 plain C 到 Metal,演示 Swift 矩阵乘法十种实现的全栈优化之路:MutableSpan、Relaxed.multiplyAdd、InlineArray、DispatchQueue.concurrentPerform、保密的 AMX 协处理器、Metal tiled kernel——一篇真正具体到汇编指令的 Apple Silicon 性能编年史。
Posted by Jiayun's Blog on Friday, May 15, 2026 00:00 UTC
Developer & Blogger
FEATURED TAGS
agentic ai
ai agent
ai 安全
ai基础设施
ai安全
ai推理
ai硬件
ai算力
ai编程
ai芯片
android
anthropic
antirez
app 横评
apple
apple silicon
ar
arxiv
cerebras
chiplet
claude
cloudflare
conway定律
copilot
cpython
cuda
ddos
deepmind
deepseek
demoscene
discord bot
dram
duckdb
eda
fuzzing
gemini
gemma
gguf
github
github copilot
google
gpt
gpt-5.5
gpu
grpo
hbf
hbm
hermes agent
interpretability
ios
ipo
kubernetes
linux
linux 内核
linux内核
llm
llm推理
lpddr5x
mcp
moe
mythos
npm
nvidia
openai
pixel
pqc
project zero
python
quic
rag
redis
risc-v
rlhf
rust
saas
scaling laws
scratchjr
serverless
socamm2
spacex
sre
tee
tesla
token经济
transformer
tsmc
typescript
ucie
vllm
中国ai
云原生
云计算
产业分析
人形机器人
代码审计
估值
供应链
供应链安全
侧信道
先进制程
先进封装
具身智能
内存安全
内核安全
内核漏洞
分布式系统
制造业
前沿模型
半导体
变现策略
可穿戴设备
可观测性
可解释性
后量子密码
商业模式
图形学
基础模型
基础设施
处理器架构
复古计算
外骨骼
多智能体
大模型
好文推荐
学术前沿
安全
安全研究
实时渲染
密码学
对齐
嵌入式
工具链
工程文化
平台工程
幼儿教育
开发工具
开发者工具
开源
开源ai
开源分析
开源安全
开源治理
异构集成
异步运行时
强化学习
形式化验证
思维链
性能优化
性能工程
推理
推理优化
政治经济学
教育app
教育科技
数学启蒙
数据中心
数据库
数据结构
机器人
架构设计
模型架构
模糊测试
注意力机制
洪恩数学
消费电子
深度研究
漏洞利用
版权
物理ai
独立开发
独立开发者
理论机器学习
硬件
硬件安全
硬件考古
硬件逆向
移动安全
端到端加密
算力经济
算力经济学
算法
系统设计
编程启蒙
编程哲学
编程猫
编程语言
编译器
缩放定律
网络协议
网络安全
育儿app
能源
芯片制造
芯片架构
芯片设计
订阅制
论文导读
软件供应链
软件工程
软件架构
边缘计算
逆向工程
都都数学
量子计算
长上下文
隐私
隐私计算
零日漏洞
零知识证明