PolaZhenjing

个人 AI 知识博客 · Personal AI Knowledge Blog

最新文章 / Latest Articles

friendly explainer

仔细听了一下张小珺对姚顺宇播客的访谈,收获非常大。

4 个小时的时长,放在现在来说能好好听完的人想必也不多。于是我就把重点给大家罗列了出来。不得不说这种播客的方式,虽然时间长,但确实能学到很多东西,这也是老外很喜欢的一种形式。硅谷 AI 圈有两位清华同届毕业、英文都叫 Shunyu Yao 的研究者,中文媒体经常混淆:一个是姚顺雨,做计算机科学的,现在在 OpenAI。

deep technical

LangChain 的理解与实战

很多人跟着教程 npm install 一下,写了个调用 DeepSeek 的 Demo,输出一句「你好,我是 AI」,就发朋友圈说自己入门 AI 开发了。结果产品经理一句「给我做个能查公司内部文档的客服机器人」,直接傻眼:- RAG 检索永远答非所问,上下文驴唇不对马嘴- 多轮对话聊个七八轮就崩,token 直接爆仓。

industry vision

DeepSeek,由多边形战士组成的AI团队

过去一年,围绕DeepSeek的人才流动消息一直没有停。从早期罗福莉离职,到初代大模型作者王炳宣、多模态骨干阮翀、R1核心作者郭达雅,相继跳槽。核心作者接连被挖,DeepSeek的技术壁垒会不会松动?我们决定换一种方式来看这个问题。我们用Codex和Python,梳理了DeepSeek近两年发布的27篇核心论文和技术报。

industry vision

Anthropic 是如何搭建可以持续运行 6 小时的 Agent Harness?

“build a retro game maker”。就这一句话。一个完整的复古游戏制作器,54色调色板、8-bit怀旧美术风格、可玩的play mode、能感知角色撞墙的物理反馈,还有一套AI关卡助手——你跟它说“造一座城堡,让小角色守在门口”,它真的能给你做出来。整个过程持续了6小时,耗资约200美元。

creative visual

2026 年 Claude Skills 实战指南:让 AI 懂你的业务

你有没有遇到过这种情况:每次和 AI 对话,都要重新解释一遍项目规范、数据结构、业务逻辑?明明团队写了详细的文档,AI 还是按照它的\"常识\"来回答,结果和实际需求完全对不上。这大概是 2025 年所有开发者最头疼的问题。我们花了大量时间\"训练\"AI理解我们的工作方式,但每次开新对话,一切又得从头开始。最近几个月。

academic insight

一篇文章讲清大语言模型发展史

2017年的某个夏天,Google内部一群搞翻译的工程师,发了一篇论文。标题很狂,叫《Attention Is All You Need》。意思很明确:我们把RNN彻底扔了,只用注意力机制,翻译效果反而更好。这篇论文后来被叫做Transformers。它在当时只是一篇机器翻译论文。但回头看,它更像是大语言模型时代的操作。

literary narrative

使用 AI 不存在中立的做法。你要么用它变得更敏锐,要么变得更空洞。大多数人正变得更空洞

三个月前的某个深夜,我坐在电脑前,盯着一段六周前自己写的函数。屏幕的光打在脸上,我能感觉到一种奇怪的东西正在升起——不是困惑,是陌生。我不认识那些字母。或者说,我认识它们,但它们不认识我。那个瞬间很小。小到几乎不值一提。模型把代码解释给我听,我点了点头,好像明白了。然后我去睡觉了。但有一样东西留了下来,像一根刺,在之后。

academic insight

Please wait...

![Please wait... — cover]({{ site.baseurl }}/assets/images/generated/please-wait/cover.png)你一定见过这个画面。白色的屏幕上,跳动着一行简单的字母:**Please wait...**然后是漫长的几秒——有时候是几十秒。