源思想追语模型内部opic开可视化大言寻东西 ,逻辑

2025-07-04 11:21:17- 知识

  Anthropic于5月29日发布开源东西“思想追寻”(Circuit Tracer) ,思想追寻经过构建“归因图”以图形化方法展现AI大言语模型的源东语模决议计划进程。

  该东西由Anthropic Fellows与Decode Research团队联合开发,西可型内支撑研讨者交互式探究模型内部机制 ,视化标示、部逻共享图表 ,思想追寻并调整参数验证假定,源东语模旨在提高AI的西可型内可解释性与安全性。

  现在,视化Circuit Tracer已作为开源库登陆GitHub,部逻用户可经过Decode Research运营的思想追寻Neuronpedia渠道拜访交互前端。

  Anthropic着重,源东语模开源此类东西将加快社区对言语模型行为的西可型内了解,补偿当时AI内部研讨滞后于功用开展的视化现状。

部逻

- END -