爱奇飞网

网站首页健康养生 >正文

Anthropic通过公开发布系统提示揭示了Claude的内部运作

开心的月饼 2024-09-02 14:34:17 健康养生

OpenAI和Anthropic等领先的人工智能公司利用这些系统提示来指导他们的模型,旨在避免不当行为,同时塑造互动的总体基调和风格。例如,系统提示可能会指示模型保持礼貌的举止而不道歉,或者在无法提供明确答案时承认其局限性。

Anthropic通过公开发布系统提示揭示了Claude的内部运作

通常,这些公司会对系统提示保密,既是为了保持竞争优势,也是为了防止那些可能利用这些知识绕过安全措施的人利用这些提示。例如,暴露GPT-4等模型的系统提示通常需要提示注入攻击,这种方法会损害模型响应的完整性。

然而,为了大胆提高透明度,Anthropic公开了其最新AI模型(Claude3Opus、Claude3.5Sonnet和Claude3.5Haiku)的系统提示。这些提示现在可以通过ClaudeiOS和Android应用程序以及网络公开访问。这一决定符合Anthropic的持续使命,即成为AI行业道德和透明的领导者。

Anthropic开发者关系主管AlexAlbert在社交媒体平台X上的一篇最新帖子中强调,公司打算将这些披露作为一项常规做法,在他们继续完善AI模型的同时,向公众通报系统提示的修改情况。这些更新将记录在Claude在线资源上新创建的系统提示发布说明部分中。值得注意的是,这些系统提示不会影响Claude的API版本。

最新的提示于7月12日发布,其中明确规定了Claude模型不得执行的操作。例如,它们明确指出“Claude无法打开URL、链接或视频”。此外,Anthropic非常重视隐私和道德考虑;提示指示ClaudeOpus表现得好像它没有面部识别能力,确保它不会识别或命名图像中的个人,从而有效地使其“脸盲”。

除了列出限制条件外,这些提示还定义了Anthropic希望Claude体现的性格特征。例如,Claude3Opus被描述为求知欲强,热衷于参与各种主题的讨论。它被要求以中立和客观的态度处理有争议的话题,提供深思熟虑和清晰的信息,并避免以过于自信的词语(如“当然”或“绝对”)开头回答。

这些详细的系统提示几乎类似于剧本中的角色发展说明,结尾是“克劳德现在正在与人类联系”这样的台词,营造出一种等待与用户互动的互动意识的幻觉。然而,这种精心打造的角色只是一个幌子;如果没有人类的指导,这些人工智能模型仍然缺乏内在的目的或个性,本质上是一张空白的画布。

通过发布这些系统提示更新日志,Anthropic在人工智能行业开创了先例,暗中挑战其他领先的人工智能公司采取类似的透明措施。这一举措是否会影响竞争对手效仿还有待观察。

Anthropic决定公开其AI模型的内部工作原理,这是人工智能领域朝着提高透明度和问责制迈出的重要一步。这种开放性可能会鼓励其他AI开发人员采取类似的做法,从而在行业内营造一种信任和协作的环境。

这种开放趋势也有可能推动创新。通过了解系统提示如何塑造人工智能行为,开发人员和研究人员可以更有效地合作,以提高人工智能的安全性和功能性。这可能导致开发更复杂的模型,这些模型不仅可以更有效地执行任务,而且可以以符合社会价值观和道德标准的方式执行任务。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行