源思想追语模型内部opic开可视化大言寻东西，逻辑

2025-07-04 11:21:17- 知识

　　Anthropic于5月29日发布开源东西“思想追寻”(Circuit Tracer) ，思想追寻经过构建“归因图”以图形化方法展现AI大言语模型的源东语模决议计划进程。

　　该东西由Anthropic Fellows与Decode Research团队联合开发，西可型内支撑研讨者交互式探究模型内部机制，视化标示、部逻共享图表，思想追寻并调整参数验证假定，源东语模旨在提高AI的西可型内可解释性与安全性。

　　现在，视化Circuit Tracer已作为开源库登陆GitHub，部逻用户可经过Decode Research运营的思想追寻Neuronpedia渠道拜访交互前端。

　　Anthropic着重，源东语模开源此类东西将加快社区对言语模型行为的西可型内了解，补偿当时AI内部研讨滞后于功用开展的视化现状。

部逻

- END -

源思想追语模型内部opic开可视化大言寻东西 ，逻辑